DataFrame(データフレーム)

pandasの大きな特徴にpandas.DataFrame(データフレーム)というオブジェクトがあります。 データフレームで、2次元の表形式のデータを処理します。 Series と同様に値とそれが何かを示す見出しを持っています。

行方向の見出しをインデックスと呼びます。 列方向の見出しを列名一覧と呼ぶことにします。

df図1

このデータから列名一覧(columns)でデータを取り出したり、その中の最大値や平均を計算するといった操作が簡潔に記述できます。

DataFrameの作成

pandas.DataFrameに2重リストを渡すとDataFrameオブジェクトを作成できます。

import pandas as pd

"""メインの処理"""
df = pd.DataFrame([['佐藤', 170, 60], ['田中', 160, 50], ['鈴木', 165, 58]])

dataframe_001

列名一覧の指定

行も列も同じ名前になり見分けが付きづらいので、列名一覧を付けます。

df.columns = ['name', 'height', 'weight']

dataframe_001

作成時に列名一覧を付けられます。

df = pd.DataFrame([['佐藤', 170, 60], ['田中', 160, 50], ['鈴木', 165, 58]],
                  columns=['name', 'height', 'weight', ])

特定の列の取り出し

特定列を取り出すには列名を[]で囲んで指定します。

df['height']

df図3

さらに詳しくは、pandas.DataFrameを参照ください。

当コンテンツの知的財産権は株式会社ビープラウドに所属します。詳しくは利用規約をご確認ください。