DataFrame(データフレーム)

pandasの大きな特徴にpandas.DataFrame(データフレーム)というオブジェクトがあります。 データフレームで、2次元の表形式のデータを処理します。 Series と同様に値とそれが何かを示す見出しを持っています。列方向の見出しを列ラベル、行方向の見出しを行ラベルと呼びます。

df図1

このデータから列ラベル(columns)でデータを取り出したり、その中の最大値や平均を計算するといった操作が簡潔に記述できます。

DataFrameの作成

pandas.DataFrameに2重リストを渡すとDataFrameオブジェクトを作成できます。

import pandas as pd

"""メインの処理"""
df = pd.DataFrame([['佐藤', 170, 60], ['田中', 160, 50], ['鈴木', 165, 58]])

dataframe_001

列ラベルの指定

行も列も同じラベルになり見分けが付きづらいので、列にラベルを付けます。

df.columns=['name', 'height', 'weight']

dataframe_001

作成時に同時に列にラベルを付けられます。

df = pd.DataFrame([['佐藤', 170, 60], ['田中', 160, 50], ['鈴木', 165, 58]],
                  columns=['name', 'height', 'weight', ])

特定の列の取り出し

特定列を取り出すには列ラベルを[]で囲んで指定します。

df['height']

df図3

さらに詳しくは、pandas.DataFrameを参照ください。