카테고리 없음

Pandas 결측 데이터 처리하기

mm대장 2023. 10. 27. 11:26

3) 결측 데이터 처리하기

 

isna(), isnull() - 결측데이터 여부 확인

lemonade.isna().tail(20)  

 

#sum을 통해 결측 데이터 확인 가능

lemonade.isna( ).sum( )

Date           1
Location       0
Lemon          0
Orange         0
Temperature    0
Leaflets       1
Price          0
Sold           0
Revenue        0
dtype: int64

 

lemonade.isnull( )  #isna와 동일한 결과

 

fillna( ) - Missing 데이터 대체하기

 

# 주의! 아래처럼하면 어떻게 될까?
lemonade['Date'].fillna(0)

#일시적으로만 변한다

--> 결측치가 바뀌지 않음

 

#방법1. 원본에 덮어쓴다. 
lemonade['Date'] = lemonade['Date'].fillna(0)

#방법2: inplace = True를 이용한다.
lemonade['Date'].fillna(0, inplace = True)

 

# Leafleats결측값을 평균값으로 치환

lemonade['Leaflets'].mean()

lemonade['Leaflets'] = lemonade['Leaflets'].fillna(lemonade['Leaflets'].mean())
lemonade.tail()