Run The Bridge
Pandas 기초(10) 본문
728x90
데이터프레임에서 None값을 찾고, 원하는 값으로 변경하기
DataFrame을 하나 선언한다.
1 2 3 4 5 6 7 8 9 10 11 12 | import pandas as pd school_id_list = [{'name': 'John', 'job': "teacher", 'age': 40}, {'name': 'Nate', 'job': "teacher", 'age': 35}, {'name': 'Yuna', 'job': "teacher", 'age': 37}, {'name': 'Abraham', 'job': "student", 'age': 10}, {'name': 'Brian', 'job': "student", 'age': 12}, {'name': 'Janny', 'job': "student", 'age': 11}, {'name': 'Nate', 'job': "teacher", 'age': None}, {'name': 'John', 'job': "student", 'age': None} ] df = pd.DataFrame(school_id_list, columns = ['name', 'job', 'age']) df | cs |
Result
Result
df.info()를 보시면 name과 job은 8개의 non-null로 이루어져있지만
age만 6개의 non-null로 이루어져있다 즉, 2개가 None이라는 뜻이다.
다음과 같은 명령으로 확인이 가능하다.
1 2 | df.isna() df.isnull() | cs |
Result
NaN값에 0을 넣기
1 | df.age = df.age.fillna(0) | cs |
Result
하지만 나이가 0살인것은 말이되지않으므로 평균값을 넣어준다.
감사합니다. Thank you!
728x90
'Python > Pandas' 카테고리의 다른 글
Pandas 기초(12) (0) | 2020.09.08 |
---|---|
Pandas 기초(11) (0) | 2020.09.08 |
Pandas 기초(9) (0) | 2020.09.07 |
Pandas 기초(8) (0) | 2020.09.07 |
Pandas 기초(7) (0) | 2020.09.07 |
Comments