카테고리 없음
Pandas 결측 데이터 처리하기
mm대장
2023. 10. 27. 11:26
3) 결측 데이터 처리하기
isna(), isnull() - 결측데이터 여부 확인
lemonade.isna().tail(20)
#sum을 통해 결측 데이터 확인 가능
lemonade.isna( ).sum( )
Date 1
Location 0
Lemon 0
Orange 0
Temperature 0
Leaflets 1
Price 0
Sold 0
Revenue 0
dtype: int64
lemonade.isnull( ) #isna와 동일한 결과
fillna( ) - Missing 데이터 대체하기
# 주의! 아래처럼하면 어떻게 될까?
lemonade['Date'].fillna(0)
#일시적으로만 변한다
--> 결측치가 바뀌지 않음
#방법1. 원본에 덮어쓴다.
lemonade['Date'] = lemonade['Date'].fillna(0)
#방법2: inplace = True를 이용한다.
lemonade['Date'].fillna(0, inplace = True)
# Leafleats결측값을 평균값으로 치환
lemonade['Leaflets'].mean()
lemonade['Leaflets'] = lemonade['Leaflets'].fillna(lemonade['Leaflets'].mean())
lemonade.tail()