ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Pandas 결측 데이터 처리하기
    카테고리 없음 2023. 10. 27. 11:26

    3) 결측 데이터 처리하기

     

    isna(), isnull() - 결측데이터 여부 확인

    lemonade.isna().tail(20)  

     

    #sum을 통해 결측 데이터 확인 가능

    lemonade.isna( ).sum( )

    Date           1
    Location       0
    Lemon          0
    Orange         0
    Temperature    0
    Leaflets       1
    Price          0
    Sold           0
    Revenue        0
    dtype: int64

     

    lemonade.isnull( )  #isna와 동일한 결과

     

    fillna( ) - Missing 데이터 대체하기

     

    # 주의! 아래처럼하면 어떻게 될까?
    lemonade['Date'].fillna(0)

    #일시적으로만 변한다

    --> 결측치가 바뀌지 않음

     

    #방법1. 원본에 덮어쓴다. 
    lemonade['Date'] = lemonade['Date'].fillna(0)

    #방법2: inplace = True를 이용한다.
    lemonade['Date'].fillna(0, inplace = True)

     

    # Leafleats결측값을 평균값으로 치환

    lemonade['Leaflets'].mean()

    lemonade['Leaflets'] = lemonade['Leaflets'].fillna(lemonade['Leaflets'].mean())
    lemonade.tail()

     

     

Designed by Tistory.