본문 바로가기

Python

Pandas 명령어 모음

반응형

1. Column의 Key 값 Return

keys = df.columns.to_list()
for key in keys:
  df.colums[key]

 

2. 데이터를 Numpy Arrary로 변환

df_train.values
df_train.to_numpy()

 

3. 특정 keys 값들의 데이터 프레임 생성

df[['x', 'y']]

 

4. 특정 key 값의 데이터 중 Unique한 데이터 추출

df['trackId'].unique()

 

5. 특정 조건을 만족하는 row 데이터 추출

df_train[df_train['frame']==fidx]

 

6. 중복되는 column 값을 갖는 row 제거하기

# frame, trackId 값이 같은 row가 모두 제거됨. 첫 번째 데이터를 남기고.
df_scene.drop_duplicates(['frame', 'trackId'], keep='first')