데이터분석
-
pandas 데이터 분석 - 칼럼 순서, 인덱스 변경하기(리스트, index)데이터분석/파이썬 2024. 10. 22. 23:36
이전 포스팅에서 칼럼이름 변경하기에 대해서 알아봤습니다.https://kbkb456.tistory.com/160 pandas 데이터 분석 - 칼럼 이름 변경하기(rename, df.column =[], lambda)데이터를 분석하다 보면 칼럼 이름을 바꾸거나 순서를 바꿔야 하는 경우가 왕왕 있습니다.오늘은 pandas 데이터 프레임에서 칼럼이름을 변경하는 법에 대해서 알아보겠습니다.예시 데이터 프레kbkb456.tistory.com 이번 포스팅에서는 pandas DataFrame에서 칼럼 순서를 바꾸는 방법과 인덱스명을 변경하는 법에 대해서 배워보도록 하겠습니다. 예시 데이터 프레임#예제용 데이터프레임df = pd.DataFrame([[1,2,3],[0,2,4],[0,3,3],[1,2,3]],column..
-
pandas 데이터 분석 - 칼럼 이름 변경하기(rename, df.column =[], lambda)데이터분석/파이썬 2024. 10. 20. 21:58
데이터를 분석하다 보면 칼럼 이름을 바꾸거나 순서를 바꿔야 하는 경우가 왕왕 있습니다.오늘은 pandas 데이터 프레임에서 칼럼이름을 변경하는 법에 대해서 알아보겠습니다.예시 데이터 프레임#예제용 데이터프레임df = pd.DataFrame([[1,2,3],[0,2,4],[0,3,3],[1,2,3]],columns=['c1','c2','c3']) 1. rename먼저 rename 함수를 이용해서 바꿔보겠습니다.rename 함수는 지정되는 컬럼을 지정한 이름으로 바꿔주는 함수입니다.소수의 칼럼의 이름을 바꿀 때, 도움이 되는 함수입니다. - 하나의 칼럼이름을 바꿀 때c1이라는 칼럼을 d1으로 바꿔보겠습니다.df.rename(columns = {'c1':'d1'},inplace=True) - 여러 개의 칼럼..
-
루커 스튜디오(구글 데이터 스튜디오) - 12 보고서 꾸미기데이터분석/루커 스튜디오(데이터 스튜디오) 2023. 3. 11. 02:23
전반적인 레이아웃과 페이지 추가, 텍스트 박스등 보고서의 가독성을 높이는 방법에 대해서 알아보고자 한다. 1. 테마 및 레이아웃 상단에서 테마 및 레이아웃을 고르면 전체적인 분석 레포트의 톤을 정할 수 있다. 2. 텍스트 박스 위에 A모양의 아이콘으로 텍스트박스를 만들 수 있고 텍스트의 속성도 수정이 가능하다. 3. 이미지 추가 이미지 추가도 가능한데 컴퓨터에서 직접 업로드 하는 경우도 있고 url을 활용하는 경우가 있다. 아래의 url을 통해서 이미지를 넣어보자! https://sesac.seoul.kr/static/common/images/www/temp/thumbnail.png 4. 도형 과 선 위 두개 아이콘을 통해서 도형과 선을 표현할 수 있다. 5. 페이지 추가 루커 스튜디오도 보고서의 탭을 ..
-
루커 스튜디오(구글 데이터 스튜디오) - 11 컨트롤 추가(control)데이터분석/루커 스튜디오(데이터 스튜디오) 2023. 3. 11. 02:11
보고서 단위에서 그래프를 내가 편하게 조절하면서 보기 위해서 필요한 게 컨트롤이다. 위에 컨트롤 추가에서 추가 할 수 있다. 1. 드롭다운 목록 쭉 아래로 내려오는 컨트롤로 리스트를 보여주고 필요한 것만 체크해서 보면 된다. 컨트롤 필드에서 어떤 기준으로 조절할 건지 정할 수 있다. 2. 고정 크기 목록 고정 크기는 검색과 체크박스가 같이 있는 형태로 검색을 한 다음에 필요한 필터 조건만 선택하는 컨트롤이다. 3. 입력상자 입력상자는 내가 원하는 값을 넣으면 관련 데이터가 필터링 된다. 4. 고급필터 고급 필터는 컨트롤 필드를 정하고 원하는 필터 값에 원하는 조건을 넣어서 필터 하는 컨트롤이다. 5. 슬라이더 슬라이더는 산술적인 데이터를 기준으로 최솟값부터 최댓값을 정해 필터 하는 컨트롤이다. 6. 기간..
-
루커 스튜디오(구글 데이터 스튜디오) - 10 계산된 필드 추가데이터분석/루커 스튜디오(데이터 스튜디오) 2023. 3. 11. 01:49
대시보드를 작업하다보면 데이터들끼리 계산해서 표현해야하는 경우가 있다. 예를들어 상품카드 뷰 수와 클릭 수를 가지고 있는데 CTR이 없다면 데이터 소스를 다시 만들어야하는걸까? 아니다! 데이터 소스에서 필드 추가를 통해서 충분히 추가가 가능하다. 홈 > 데이터 소스 > 원하는 데이터로 가보자 우측상단에 필드 추가를 눌러보자 여기서 ctr의 공식은 클릭 수 / 뷰 수 이다. sum은 왜 하는 것인가? 계산할때 집계한 값으로 표현해야하기 때문이다. 만약 이런 데이터에 ctr이 들어가게 된다면 group by 광고타입, 광고매체로 sum 되게 된다.
-
루커 스튜디오(구글 데이터 스튜디오) - 9 필터(filter)데이터분석/루커 스튜디오(데이터 스튜디오) 2023. 3. 11. 01:37
루커 스튜디오에는 모든 차트에 필터가 있다. 여기서 필터의 역할을 특정 조건의 데이터를 보여주게 하는 것이며 루커스튜디오에 주로 활용되는 필터는 일반 필터와 날짜 필터가 있다. 1. 일반 필터(filter) 일반 필터는 차트에 들어가는 필터로 특정 데이터를 기준으로 차트가 그려질 수 있게 해준다. 광고 타입별, 매체별 상품카드 뷰/클릭 수 테이블이 있다고 해보자. 여기서 cpc 광고만 필터 쳐서보고 싶으면 어떻게 할까? 설정 세팅 > 필터 > 필터 추가 클릭 > 하단에 필터 만들기 클릭 이름을 cpc로 정하고 포함을 선택한 다음 광고타입에서 cpc와 같음 조건을 선택한다. 결과는? cpc 기준으로 필터가 되었다. 그러면 cpc에서 상품 카드 클릭 유저 수가 2000보다 큰 데이터만 보려면 어떻게 해야 할..
-
루커 스튜디오(구글 데이터 스튜디오) - 8 이해하기 쉬운 표(테이블, 피폿 테이블)데이터분석/루커 스튜디오(데이터 스튜디오) 2023. 3. 11. 00:50
루커 스튜디오에는 가장 직관적으로 데이터를 표현해 주는 테이블과 피봇테이블이 있다. 1. 테이블(Table) 데이터를 직관적으로 표현하는 방식으로 일별 현황같은것을 한눈에 파악하기 좋다. 만드는 법 1. 차트 추가 > 테이블 선택 2. 지표셋팅 - 데이터 소스: 어떤 소스에 데이터를 활용할지 - 기간 측정 기준: 어느 날짜를 활용해서 기간을 조절할지 - 측정기준: 어떤 기준으로 테이블을 측정할 것인지 (group) - 측정항목: 기준이 정해졌다면 어떤 데이터를 볼건지(value) - 페이지당 행: 표 한 페이지에 몇 개의 row를 가져야 하는지 알려준다. - 요약 행: 각 데이터의 총합계를 보여준다. - 기본기간: 기간 측정기준으로 며칠부터 며칠까지 데이터를 체크할지 - 표 필터: 필터링할 데이터 기준은..
-
루커 스튜디오(구글 데이터 스튜디오) - 7 관계를 표현하기 좋은 그래프들 (산포도, 트리맵)데이터분석/루커 스튜디오(데이터 스튜디오) 2023. 3. 10. 23:45
루커 스튜디오에 데이터 간의 관계를 나타내는 그래프들이 있다. 산도표와 트리맵인데 알아보도록하자 1. 산포도(scatterplot, bubble charts) 산도표는 점을 그려주는 그래프로써 x축, y축 두 데이터 간의 관계를 표현해 준다. cs 유저수와 구매 유저수를 보여주는 그래프 만드는 법 1. 차트 추가 > 분산형 차트 선택 2. 설정 세팅 - 데이터 소스: 어떤 소스에 데이터를 활용할지 - 기간 측정 기준: 어느 날짜를 활용해서 기간을 조절할지 - 측정기준: x축을 어떤 기준으로 둘 것인지 - 측정항목: 어떤 데이터를 측정할지 x축과 y축을 정한다 - 풍선 크기항목: 산도표에서 각 점의 크기를 정하는데 풍선크기 항목에 들어간 데이터를 기준으로 점의 크기가 정해진다. 예를 들어 위의 경우 cs ..