Hi there!

I am a student studying computer science.

AI/Pandas 기초

07. 데이터 그룹 만들기

만능성구 2020. 4. 24. 19:24
728x90

df

 

groupby_major = df.groupby('major')

 

 type(groupby_major)는 pandas.core.groupby.generic.DataFrameGroupBy

 

groupby_major.groups

 

{'Computer Science': Int64Index([0, 1, 6, 7], dtype='int64'),

'Economics': Int64Index([4, 5, 9], dtype='int64'),

'Physics': Int64Index([2], dtype='int64'),

'Psychology': Int64Index([3, 8, 10], dtype='int64')}

 

 

dict 타입으로 확인할 수 있다.

for name, group in groupby_major:
    print(name + ": " + str(len(group)))
    print(group)
    print()

 

이렇게 하면 편하게 볼수 있고

 

df_major_cnt = pd.DataFrame({'count' : groupby_major.size()})
df_major_cnt

df_major_cnt = pd.DataFrame({'count' : groupby_major.size()}).reset_index()
df_major_cnt

 

위에는 column이 한 줄 추가되는 것 같고 아래 처럼하면 reset해줘서 columns가 한줄이 된다.

728x90