Run The Bridge

Pandas 기초(10) 본문

Python/Pandas

Pandas 기초(10)

anfrhrl5555 2020. 9. 7. 17:27
728x90
반응형

데이터프레임에서 None값을 찾고, 원하는 값으로 변경하기

DataFrame을 하나 선언한다.
1
2
3
4
5
6
7
8
9
10
11
12
import pandas as pd
school_id_list = [{'name''John''job'"teacher"'age'40},
                {'name''Nate''job'"teacher"'age'35},
                {'name''Yuna''job'"teacher"'age'37},
                {'name''Abraham''job'"student"'age'10},
                {'name''Brian''job'"student"'age'12},
                {'name''Janny''job'"student"'age'11},
                {'name''Nate''job'"teacher"'age'None},
                {'name''John''job'"student"'age'None}
         ]
df = pd.DataFrame(school_id_list, columns = ['name''job''age'])
df
cs


Result


Result

df.info()를 보시면 name과 job은 8개의 non-null로 이루어져있지만


age만 6개의 non-null로 이루어져있다 즉, 2개가 None이라는 뜻이다.


다음과 같은 명령으로 확인이 가능하다.

1
2
df.isna()
df.isnull()
cs


Result



NaN값에 0을 넣기

1
df.age = df.age.fillna(0)
cs


Result

하지만 나이가 0살인것은 말이되지않으므로 평균값을 넣어준다.

1
df.age.fillna(df.groupby(['job'])['age'].transform('median'), inplace = True
cs

Result




감사합니다. Thank you!

728x90
반응형

'Python > Pandas' 카테고리의 다른 글

Pandas 기초(12)  (0) 2020.09.08
Pandas 기초(11)  (0) 2020.09.08
Pandas 기초(9)  (0) 2020.09.07
Pandas 기초(8)  (0) 2020.09.07
Pandas 기초(7)  (0) 2020.09.07
Comments