Hi there!

I am a student studying computer science.

728x90

AI/Pandas 기초 14

13. 두개의 데이터프레임 합치기

행으로 합치기 df1 df2 result = pd.concat([df1,df2] ,ignore_index = True) ignore_index 앞에서도 나왔는데 행 index 중복 될까봐 이전 값 무시하는거 result = df1.append(df2, ignore_index = True) 똑같은 기능 열로 합치기 result = pd.concat([df1,df2],axis =1 ,ignore_index =True) label = [1,2,3,4,5] prediction = [1,2,2,4,4] comparison = pd.DataFrame({'label' : label, 'prediction' : prediction}) 이렇게 생긴다.

AI/Pandas 기초 2020.04.24

10. apply 함수 활용

def extract_year(row): return row.split('-')[0] df['year'] = df['yyyy-mm-dd'].apply(extract_year) 06. 에서 했던거 이게 apply함수의 기본이래 def get_age(year, current_year): return current_year - int(year) df['age'] = df['year'].apply(get_age, current_year = 2020) 생년으로 나이 구해서 넣기. def get_introduce(age, prefix, suffix): return prefix + str(age) + suffix df['introduce'] = df.apply(get_introduce, prefix = "I am",..

AI/Pandas 기초 2020.04.24

09. NaN 찾아서 다른 값으로 변경하기

df.shape df.info() (8, 3) RangeIndex: 8 entries, 0 to 7 Data columns (total 3 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 name 8 non-null object 1 job 8 non-null object 2 age 6 non-null float64 dtypes: float64(1), object(2) memory usage: 320.0+ bytes 이처럼 확인할 수 있다. df.isna() df.isnull() 둘 다 똑같다. df.age = df.age.fillna(0) 0으로 채운다. df["age"].fillna(df.groupby("job")["a..

AI/Pandas 기초 2020.04.24

06. 행, 열 생성 및 수정하기

열 만들기 df['salary'] = 0 열추가 자동으로 적용된다. import numpy as np df['salary'] = np.where(df['job'] != 'student', 'yes', 'no') np.where을 이용하여 앞에 조건에 따라 참이면 yes 거짓이면 no 값이 들어간다. df['total'] = df['mid'] + df['fin'] mid라는 열과 fin열의 값을 더해서 total이라는 열 생성하여 저장 grades = [] for row in df['average']: if row >= 90: grades.append('A') elif row >= 80: grades.append('B') else: grades.append('F') df['grades'] =grades 리..

AI/Pandas 기초 2020.04.24

04. 데이터프레임 행, 열 선택 및 필터하기

- 일부 선택 df[1:3] 1, 2 data만 ! - 불연속적으로 선택 df.loc[ ['2009-01','2010-01'] ] 행의 이름으로! - by column condition df[df.age > 25] df.query('age>25') df[ (df.age>25) & (df.name == 'Nate') ] Filter Column - by index df.iloc[:,0:2] df.iloc[0:2,0:2] 인덱스로 접근! - by column name df[ ['name', 'age'] ] df.filter(items = ['age','job']) 둘다 같은 의미로 column name 선택하기 df.filter(like ='a', axis = 1) column name에 'a'가 들어가 있..

AI/Pandas 기초 2020.04.24
728x90