pandasを利用したCSVファイルの読み込み¶
実務上でpandasのDataFrameを作る時は、以下のような既存のデータを読み込むことがほとんどです。
CSV, TSVファイル
EXCELファイル
SQLのSELECT結果
HTMLのテーブル
JSON
pandasにはさまざまなデータソースからの読み込み手段が存在します。
ここではpandas.read_csv(ファイルパス)
を使ってCSVファイル('dataset/health_check.csv')を読み込んでDataFrameを作成しています。
このとき、オプションがなければread_csvは以下のように動作します。
1行目はヘッダーとしてカラム名を読み込む。
区切り文字は
,
(半角カンマ)データに囲み文字
"
(例えばダブルクォーテーション)がないCSVファイル
引数 sep
にデリミタを指定できます。タブ区切りのTSVファイル('dataset/health_check.tsv')を読み込む場合は、 sep='\t'
を利用します。
また、ヘッダーを持たないCSVファイル('dataset/health_check_nohead.csv')を読み込む場合は、引数names
を指定します。これで、
さらに詳しくは、pandas.read_csvを参照ください。