-
Pandas 데이터 전처리카테고리 없음 2023. 10. 27. 11:19
1) sort_values() - 데이터 정렬
lemonade.sort_values(by=['Temperature'])
#Temperature 가 오름차순으로 정렬됨
- 내림차순으로 하고 싶다면? ascending= False
- 'by'는 생략해도 됨
- inplace = True --> 정렬한 값이 lemonade에 바로 저장
- inplace = True 없이 실행한 경우 1회성으로 결과만 보여줄뿐 lemonade의 실제 내용은 바뀌지 않음
lemonade.sort_values(by=['Temperature'], inplace = True)
#원본을 바꾸고 싶으면 Inplace를 사용한다.
2) groupby() - 데이터 그룹핑
lemonade.groupby(by='Location') # lemonade.groupby(by=['Location'])
lemonade.groupby(by='Location').count()
#평균, Max값, Min 값에 대해서 알수있다.
lemonade.groupby(by='Location').mean(numeric_only=True)
lemonade.groupby(by='Location')['Revenue'].max()
lemonade.groupby(by='Location')['Revenue'].min()