Home Pandas Dataframeの作成と利用
Post
Cancel

Pandas Dataframeの作成と利用

Pandas Dataframe の作成と利用

データフレームの作成

データフレームを追加する際には Dict 形式で Key には行の名前を入力 Value に各行別データを列順に入れなければならない。

1
2
3
4
5
6
7
8
import pandas as pd

data_a = ['1','2','3','4'] # aという行のデータ列順別リスト
data_b = ['5','6','7','8'] # bという行のデータ列順別リスト

df = pd.DataFrame({'a': data_a, 'b': data_b})

 ab
015
126
237
348

データフレームの行ラベル変更

基本データーフレーム

 ab
015
126
237
348
1
2
3
df.rename(columns={'a':'renamed_a', 'b': 'renamed_b' })

 renamed_arenamed_b
015
126
237
348

データフレームの接近

基本データーフレーム

 ab
015
126
237
348

行のラベルを抽出する方法

1
2
3
4
5
df.columns

list(df.columns)

Index([‘a’, ‘b’], dtype=’object’)

[‘a’, ‘b’]

任意に行順を変える方法

1
2
3
df = df[['b','a']] # 当該行のリストに読み込むため、行を除外することもできる。

 ba
051
162
273
384

特定例または行を洗濯

1
2
3
4
5
df.loc[0] # 特定行の選択

df.iloc[0]

 ab
015
1
2
3
df["a"] # 特定列の選択

  
01
12
23
34
1
2
3
df["a"][0] # 特定行の中に特定列を選択

1

Index の設定 (基本 Index は 0 から自動で追加される)

1
2
3
df.set_index("b")

ba
51
62
73
84

データフレームの追加・修正・削除

基本データフレーム

 ab
015
126
237
348

データフレームの追加

index を新しく追加して、データフレームに追加

1
2
3
df.loc[4] = ['9','10'] # 重複されないindexを追加したい時(重複すると該当するすべてのIndexが重畳されて修正されます。)

 ab
015
126
237
348
4910

新しいデータフレームを作成し、データフレームの中に追加

1
2
3
4
5
new_data = pd.DataFrame({'a': ['11'], 'b': ['12']}) # Index順を無視して新しいデータフレームを作成し、追加する時

df.append(new_data)

 ab
015
126
237
348
01112

データフレームの検索・絞り込み

基本データフレーム

 ab
015
126
237
348
449

データフレームの列による行の絞り込み

1
2
3
4
5
df[
  df['a'] == '4' # aが4のすべての行を探す
]

 ab
348
449