2017-10-12から1日間の記事一覧

2017-10-12

pandasでデータの欠損を確認する

機械学習

機械学習において収集したデータを使おうと思ったとき、ほとんどのケースでデータに欠損があります。そんなときは、もっともらしい値で穴埋めをするなどの対処が必要ですが、それより前にどのパラメータのデータがどれだけ欠損しているかを確認したいです…

2017-10-12

pandasを使ってcsvの先頭を表形式でjupyterに出力する

機械学習

kaggleの問題に取り組んでいるときなど、jupyter上でぱぱっとcsvの中身を見れると便利。例えばタイタニックの生存予測のトレーニングデータcsvの中身を見たいとき Titanic: Machine Learning from Disaster | Kaggle 以下のようなコードで表形式に表示でき…

こけこっこー

がんばる

2017-10-12から1日間の記事一覧

pandasでデータの欠損を確認する

pandasを使ってcsvの先頭を表形式でjupyterに出力する