데이터분석/파이썬

pandas 데이터 분석 - 데이터 정렬(sort_index, sort_values)

devbean 2022. 6. 27. 21:18
반응형

https://kbkb456.tistory.com/118

 

pandas 데이터 분석 - 중복제거(drop_duplicates)

https://kbkb456.tistory.com/88?category=1021504 pandas 데이터 분석 - group by를 이용한 집계(sum, count, min, max, mean, median, std, var, quantile, describe, agg) https://kbkb456.tistory.com/86 pand..

kbkb456.tistory.com

오늘은 데이터 프레임을 정렬하기 위해서 필요한 함수 sort_index와 sort_value에 대해서 알아보도록 하겠습니다.

 

예시 데이터 프레임

#예제용 데이터프레임
df = pd.DataFrame([[1,2,3],[0,2,4],[0,3,3],[1,2,3]],columns=['c1','c2','c3'])

예시용 데이터 프레임

 

1. sort_index

sort_index는 그야말로 데이터 프레임의 index를 가지고 정렬하는 함수입니다.

#문법
데이터프레임.sort_index(ascending=False)

- ascending: True(오름차순)/False(내림차순)

 

보시다시피 아무 값도 넣지 않고 실행하면 index기준으로 오름차순으로 정렬합니다.

sort_index() 오름차순 정렬

ascending에 False값을 넣어 내림차순으로 정렬하면 index 기준으로 내림차순으로 정렬합니다.

sort_index() 내림차순 정렬

 

2. sort_values

sort_value는 특정 칼럼을 기준으로 정렬합니다.

#문법
데이터프레임.sort_values(by=정렬할 컬럼, ascending = False)

- by: 정렬할 컬럼을 정해서 넣어야 함(정렬할 컬럼이 여러개인 경우 리스트로 넣어주면 됨)
- ascending: True(오름차순)/False(내림차순)

 

sort_values는 특정 컬럼을 기준으로 정렬하기 때문에 by에 정렬할 기준값을 넣어줘야 합니다. ascending을 넣지 않고 돌리면 오름차순으로 정렬합니다.

c1기준으로 오름차순으로 정렬

c1을 기준으로 ascending에 False를 넣어서 정렬하게 되면 내림차순으로 정렬하게 됩니다.

c1기준으로 내림차순 정렬

여러 개를 기준으로 할 때는 리스트에 정렬할 칼럼을 넣어주면 됩니다. 이때 정렬은 리스트의 제일 뒤부터 실행하게 됩니다.

이때 c2를 먼저 내림차순으로 정렬하고 c1을 그다음에 내림차순으로 정렬한다.

 

 

https://colab.research.google.com/drive/1qNzTAdWwO5WiZ7-_ZpHNHBcJ94tp8CbB?usp=sharing 

 

Untitled4.ipynb

Colaboratory notebook

colab.research.google.com

오늘은 판다스 데이터 프레임의 정렬방법에 대해서 알아봤습니다.

반응형