pandas

pandas は強力なPython製のデータ分析ツールです。

pandasの主なデータ構造であるSeries(1次元:リストのような形式)とDataFrame(2次元:表のような形式)は財務、統計、その他多くの工学分野でのデータ処理に利用されています。

pandasが提供している表形式のデータをサポートするデータフレームクラス(pandas.DataFrame)を利用し、表形式のデータに対してSQLのような問い合わせ、データを加工して新しい列を追加、複数のDataFrameを結合するなどできます。

pandasはファイルフォーマットやデータベースからデータを取り込みDataFrameに変換でき、様々な形式で出力できます。詳しくはデータ読み込み、出力部分で解説します。

pandasを利用すると、Pythonのfor文を用いて1行ずつ処理するよりシンプルにテーブルのデータを追加、変更、分析できます。

Pythonとデータ分析についてやpandasのよく使う機能をまとめます。