pandas 데이터 분석 - 데이터 정렬(sort_index, sort_values)
https://kbkb456.tistory.com/118
pandas 데이터 분석 - 중복제거(drop_duplicates)
https://kbkb456.tistory.com/88?category=1021504 pandas 데이터 분석 - group by를 이용한 집계(sum, count, min, max, mean, median, std, var, quantile, describe, agg) https://kbkb456.tistory.com/86 pand..
kbkb456.tistory.com
오늘은 데이터 프레임을 정렬하기 위해서 필요한 함수 sort_index와 sort_value에 대해서 알아보도록 하겠습니다.
예시 데이터 프레임
#예제용 데이터프레임
df = pd.DataFrame([[1,2,3],[0,2,4],[0,3,3],[1,2,3]],columns=['c1','c2','c3'])

1. sort_index
sort_index는 그야말로 데이터 프레임의 index를 가지고 정렬하는 함수입니다.
#문법
데이터프레임.sort_index(ascending=False)
- ascending: True(오름차순)/False(내림차순)
보시다시피 아무 값도 넣지 않고 실행하면 index기준으로 오름차순으로 정렬합니다.

ascending에 False값을 넣어 내림차순으로 정렬하면 index 기준으로 내림차순으로 정렬합니다.

2. sort_values
sort_value는 특정 칼럼을 기준으로 정렬합니다.
#문법
데이터프레임.sort_values(by=정렬할 컬럼, ascending = False)
- by: 정렬할 컬럼을 정해서 넣어야 함(정렬할 컬럼이 여러개인 경우 리스트로 넣어주면 됨)
- ascending: True(오름차순)/False(내림차순)
sort_values는 특정 컬럼을 기준으로 정렬하기 때문에 by에 정렬할 기준값을 넣어줘야 합니다. ascending을 넣지 않고 돌리면 오름차순으로 정렬합니다.

c1을 기준으로 ascending에 False를 넣어서 정렬하게 되면 내림차순으로 정렬하게 됩니다.

여러 개를 기준으로 할 때는 리스트에 정렬할 칼럼을 넣어주면 됩니다. 이때 정렬은 리스트의 제일 뒤부터 실행하게 됩니다.

https://colab.research.google.com/drive/1qNzTAdWwO5WiZ7-_ZpHNHBcJ94tp8CbB?usp=sharing
Untitled4.ipynb
Colaboratory notebook
colab.research.google.com
오늘은 판다스 데이터 프레임의 정렬방법에 대해서 알아봤습니다.