Hi there!

I am a student studying computer science.

AI/Pandas 기초

08. 중복 데이터 삭제하기

만능성구 2020. 4. 24. 19:25
728x90
df.duplicated()

 

true / false로 알려준다

이때는 모든 열의 데이터가 같아야 한다.

 

df.drop_duplicates()

쉽게 지울 수 있다.

 

df.duplicated(['name'])

name 이 같은 데이터를 찾는다.

 

df.drop_duplicates(['name'], keep='last')

keep = 'first'

keep = 'last'

keep =False

남길 값은 정한다.

중간 값은 안된다. 

False이면 다 지운다.

728x90