こけこっこー

がんばる

pandasを使ってcsvの先頭を表形式でjupyterに出力する

kaggleの問題に取り組んでいるときなど、jupyter上でぱぱっとcsvの中身を見れると便利。

例えばタイタニックの生存予測のトレーニングデータcsvの中身を見たいとき

Titanic: Machine Learning from Disaster | Kaggle

以下のようなコードで表形式に表示できる

import pandas as pd

df_train = pd.read_csv("train.csv")
df_train.head()

出力結果

f:id:monisoi:20171012082643p:plain

head()の引数に数字を与えてやればその分の行数が表示されます。