Series(シリーズ)

Series(シリーズ)は pandas のデータ構造のひとつです。 Series はリストのように順序を持った一次元のデータ列と、そのデータが何かを示す見出しを格納するオブジェクトです。この見出しのことを軸ラベルと呼びます。

SeriesとDataFrame

pandas でよく使われるデータ構造として1次元の Series(シリーズ)、2次元の DataFrame(データフレーム)があります。

下の表のようなものが DataFrame 、表の1列分のデータを抜き出したものが Seriesです。

pandas_structure_1

リストのSeriesへの変換

リストを Series に変換してみましょう。作成した Series を変数 series に代入します。

import pandas as pd

sample_list = ['a', 'b', 'c', 'd']
series = pd.Series(sample_list)

series_1.png

a b c dの部分が Series部分、0 1 2 3 の部分が 軸ラベル です。

この場合は 'a' というデータには 0 というラベルが付けられています。

軸ラベルの利用

Series の軸ラベルの初期値は0から始まる連番が設定されています。 単一の値を参照する時は軸ラベルをキーに指定します。

series[1]  # b

Series.index にリストを代入することによって軸ラベルに文字列を指定できます。

series.index=['i1', 'i2', 'i3', 'i4']

これで、新しい軸ラベルをキーとして値にアクセスできます。

series['i3']  # c

軸ラベルに文字列を指定後も連番をキーとして値にアクセスできます。

series[2]  # c

値の一覧

Series の値の一覧を取得できます。

series.values  # array(['a', 'b', 'c', 'd'], dtype=object)

軸ラベルの一覧

Series の軸ラベルの一覧を取得できます。

series.index.values  # array(['i1', 'i2', 'i3', 'i4'], dtype=object)

さらに詳しくは、pandas.Seriesを参照ください。