헤맨 만큼 내 땅이다

카테고리 없음

Pandas 데이터 전처리

mm대장 2023. 10. 27. 11:19

1) sort_values() - 데이터 정렬

 

lemonade.sort_values(by=['Temperature'])

#Temperature 가 오름차순으로 정렬됨

- 내림차순으로 하고 싶다면? ascending= False

  • 'by'는 생략해도 됨
  • inplace = True --> 정렬한 값이 lemonade에 바로 저장
  • inplace = True 없이 실행한 경우 1회성으로 결과만 보여줄뿐 lemonade의 실제 내용은 바뀌지 않음

 

lemonade.sort_values(by=['Temperature'], inplace = True) 

#원본을 바꾸고 싶으면 Inplace를 사용한다.

 

2) groupby() - 데이터 그룹핑

 

lemonade.groupby(by='Location')   # lemonade.groupby(by=['Location'])

lemonade.groupby(by='Location').count()

 

#평균, Max값, Min 값에 대해서 알수있다.

lemonade.groupby(by='Location').mean(numeric_only=True)

lemonade.groupby(by='Location')['Revenue'].max()

lemonade.groupby(by='Location')['Revenue'].min()