Series(シリーズ)¶
Series
(シリーズ)は pandas
のデータ構造のひとつです。
Series
はリストのように順序を持った一次元のデータ列と、そのデータが何かを示す見出しを格納するオブジェクトです。この見出しのことを軸ラベル
と呼びます。
SeriesとDataFrame¶
pandas
でよく使われるデータ構造として1次元の Series
(シリーズ)、2次元の DataFrame
(データフレーム)があります。
下の表のようなものが DataFrame
、表の1列分のデータを抜き出したものが Series
です。
リストのSeriesへの変換¶
リストを Series
に変換してみましょう。作成した Series
を変数 series
に代入します。
import pandas as pd
sample_list = ['a', 'b', 'c', 'd']
series = pd.Series(sample_list)
a b c d
の部分が Series
の値部分、0 1 2 3
の部分が 軸ラベル です。
この場合は 'a'
というデータには 0
というラベルが付けられています。
軸ラベルの利用¶
Series
の軸ラベルの初期値は0から始まる連番が設定されています。
単一の値を参照する時は軸ラベルをキーに指定します。
series[1] # b
Series.index
にリストを代入することによって軸ラベルに文字列を指定できます。
series.index=['i1', 'i2', 'i3', 'i4']
これで、新しい軸ラベルをキーとして値にアクセスできます。
series['i3'] # c
軸ラベルに文字列を指定後も連番をキーとして値にアクセスできます。
series[2] # c
値の一覧¶
Series
の値の一覧を取得できます。
series.values # array(['a', 'b', 'c', 'd'], dtype=object)
軸ラベルの一覧¶
Series
の軸ラベルの一覧を取得できます。
series.index.values # array(['i1', 'i2', 'i3', 'i4'], dtype=object)
さらに詳しくは、pandas.Seriesを参照ください。