-
Pandas 결측 데이터 처리하기카테고리 없음 2023. 10. 27. 11:26
3) 결측 데이터 처리하기
isna(), isnull() - 결측데이터 여부 확인
lemonade.isna().tail(20)
#sum을 통해 결측 데이터 확인 가능
lemonade.isna( ).sum( )
Date 1 Location 0 Lemon 0 Orange 0 Temperature 0 Leaflets 1 Price 0 Sold 0 Revenue 0 dtype: int64
lemonade.isnull( ) #isna와 동일한 결과
fillna( ) - Missing 데이터 대체하기
# 주의! 아래처럼하면 어떻게 될까?
lemonade['Date'].fillna(0)#일시적으로만 변한다
--> 결측치가 바뀌지 않음
#방법1. 원본에 덮어쓴다.
lemonade['Date'] = lemonade['Date'].fillna(0)
#방법2: inplace = True를 이용한다.
lemonade['Date'].fillna(0, inplace = True)# Leafleats결측값을 평균값으로 치환
lemonade['Leaflets'].mean()
lemonade['Leaflets'] = lemonade['Leaflets'].fillna(lemonade['Leaflets'].mean())
lemonade.tail()