DataFrame(データフレーム)¶
pandasの大きな特徴にpandas.DataFrame
(データフレーム)というオブジェクトがあります。
データフレームで、2次元の表形式のデータを処理します。 Series
と同様に値とそれが何かを示す見出しを持っています。
行方向の見出しをインデックス
と呼びます。
列方向の見出しを列名一覧
と呼ぶことにします。
このデータから列名一覧(columns
)でデータを取り出したり、その中の最大値や平均を計算するといった操作が簡潔に記述できます。
DataFrameの作成¶
pandas.DataFrame
に2重リストを渡すとDataFrameオブジェクトを作成できます。
import pandas as pd
"""メインの処理"""
df = pd.DataFrame([['佐藤', 170, 60], ['田中', 160, 50], ['鈴木', 165, 58]])
列名一覧の指定¶
行も列も同じ名前になり見分けが付きづらいので、列名一覧を付けます。
df.columns = ['name', 'height', 'weight']
作成時に列名一覧を付けられます。
df = pd.DataFrame([['佐藤', 170, 60], ['田中', 160, 50], ['鈴木', 165, 58]],
columns=['name', 'height', 'weight', ])
特定の列の取り出し¶
特定列を取り出すには列名を[]
で囲んで指定します。
df['height']
さらに詳しくは、pandas.DataFrameを参照ください。