Pandas Dataframe の作成と利用
データフレームの作成
データフレームを追加する際には Dict 形式で Key には行の名前を入力 Value に各行別データを列順に入れなければならない。
1
2
3
4
5
6
7
8
|
import pandas as pd
data_a = ['1','2','3','4'] # aという行のデータ列順別リスト
data_b = ['5','6','7','8'] # bという行のデータ列順別リスト
df = pd.DataFrame({'a': data_a, 'b': data_b})
|
データフレームの行ラベル変更
基本データーフレーム
1
2
3
|
df.rename(columns={'a':'renamed_a', 'b': 'renamed_b' })
|
| renamed_a | renamed_b |
---|
0 | 1 | 5 |
1 | 2 | 6 |
2 | 3 | 7 |
3 | 4 | 8 |
データフレームの接近
基本データーフレーム
行のラベルを抽出する方法
1
2
3
4
5
|
df.columns
list(df.columns)
|
Index([‘a’, ‘b’], dtype=’object’)
[‘a’, ‘b’]
任意に行順を変える方法
1
2
3
|
df = df[['b','a']] # 当該行のリストに読み込むため、行を除外することもできる。
|
特定例または行を洗濯
1
2
3
4
5
|
df.loc[0] # 特定行の選択
df.iloc[0]
|
1
2
3
|
df["a"][0] # 特定行の中に特定列を選択
|
1
Index の設定 (基本 Index は 0 から自動で追加される)
データフレームの追加・修正・削除
基本データフレーム
データフレームの追加
index を新しく追加して、データフレームに追加
1
2
3
|
df.loc[4] = ['9','10'] # 重複されないindexを追加したい時(重複すると該当するすべてのIndexが重畳されて修正されます。)
|
新しいデータフレームを作成し、データフレームの中に追加
1
2
3
4
5
|
new_data = pd.DataFrame({'a': ['11'], 'b': ['12']}) # Index順を無視して新しいデータフレームを作成し、追加する時
df.append(new_data)
|
データフレームの検索・絞り込み
基本データフレーム
データフレームの列による行の絞り込み
1
2
3
4
5
|
df[
df['a'] == '4' # aが4のすべての行を探す
]
|