데이터분석
-
루커 스튜디오(구글 데이터 스튜디오) - 6 추세를 표현하기 좋은 그래프들 (막대 차트, 시계열 차트, 영역 차트, 콤보차트)데이터분석/루커 스튜디오(데이터 스튜디오) 2023. 3. 10. 22:58
루커 스튜디오에서는 날짜에 따른 추세를 보기 위한 그래프들이 있다. 하나씩 알아보도록 하자. 1. 막대차트(Bar Charts) 바 차트는 막대 그래프 차트로써 특정 카테고리 별 개수나 일별로 데이터가 어떻게 되는지 보기 좋다. 일별 stacked bar 차트 같은 경우, 날짜별로 어떤비중을 가지는지 보기 좋은 차트이다. (예를 들면 날짜별 진입유저의 성별 비중) 만드는 법 1. 차트 추가 > 바차트 선택 2. 지표 셋팅 - 데이터 소스: 어떤 소스에 데이터를 활용할지 - 기간 측정 기준: 어느 날짜를 활용해서 기간을 조절할지 - 측정기준: x축을 어떤 기준으로 둘 것인지 - 세부 측정기준: 어떤 기준으로 group을 나눠서 볼건지 - 예를 들어 여기에 광고매체를 넣게 되면 날짜별 광고매체별 상품카드 클..
-
루커 스튜디오(구글 데이터 스튜디오) - 5 상태를 표현하기 좋은 그래프들 (Scorecards, Gauges, Pie Charts)데이터분석/루커 스튜디오(데이터 스튜디오) 2023. 3. 10. 08:54
루커 스튜디오에서 상태를 표현하기 좋은 그래프는 3가지가 있다. 스코어카드, 게이지, 파이차트인데 하나씩 알아보도록 하자. 1. 스코어카드 스코어 카드는 현재 지표가 어떤지를 숫자로 명확하게 보여주는 차트이다. 주로 회사의 KPI나 아침에 그날 체크해야 하는 숫자가 있다면 활용하는 편이다. (예를 들면 회사의 어제 매출 같은 지표) 만드는 법 1. 차트 추가 > 스코어카드 > 넣을 스코어 카드 선택 두 개의 차이는 왼쪽은 스코어카드 숫자를 전부 보여주는 버전 오른쪽은 축약버전이라는 것이다. 2. 지표 세팅 차트를 추가한 다음에 설정창에서 필요한 옵션들을 추가해 준다. - 데이터 소스: 어떤 소스에 데이터를 활용할지 - 기간 측정 기준: 어느 날짜를 활용해서 기간을 조절할지 - 측정항목: 어떤 데이터를 측..
-
루커 스튜디오(구글 데이터 스튜디오) - 4 리포트 차트 설정데이터분석/루커 스튜디오(데이터 스튜디오) 2023. 3. 8. 16:34
보고서를 만들려면 어떤 필드에 설정을 어떻게 넣어주느냐에 따라서 풍부한 그래프 표현이 가능하다. 스타일의 경우 차트마다 다르니 설정만 한번 훑고 가보려고 한다. 편집 설정 훑어보기 - 데이터 소스: 어떤 데이터 소스를 가지고 있는지 알려주는 필드 해당 차트가 어떤 데이터로 그려지는지 알려주는 필드라고 보면 된다. 데이터 혼합을 통해서 다른 데이터와 조인해서 활용이 가능하다. - 기간 측정 기준: 해당 지표의 측정기준이 되는 날짜 데이터를 넣어주는 곳 - 세부 측정기준: 그래프에 drill down에서 봐야 하는 지표가 있다면 그에 대한 기준을 여기 넣어주면 된다. 예를 들면 위의 그래프를 광고 매체별로 보고 싶다고 한다면 세부 측정 기준에 광고매체를 넣어주면 된다. - 측정항목: 어떤데이터를 주로 차트를..
-
루커 스튜디어(구글 데이터 스튜디오) - 3 보고서 시작하기데이터분석/루커 스튜디오(데이터 스튜디오) 2023. 3. 5. 15:23
데이터 소스를 셋팅했다면 이제 보고서를 만들 수 있다. 보고서는 일종의 대시보드같은 형태로 데이터셋을 가지고 조건별로 필요한 그래프를 그리거나 표를 생성해준다. 1. 보고서 생성 데이터셋 위에 보고서 작성을 누르면 해당 데이터 소스를 기준으로 새로운 보고서가 생성된다. 이 데이터 소스를 기준으로 아래처럼 편집창이 열리면서 대시보드를 만들 수 있게 된다. 2. 컴포넌트 편집하기 보고서에 들어가는 차트나 테이블은 하나의 컴포넌트라고 부르며 편집은 오른쪽 사이드바에서 가능하다. 오른쪽 사이드바에서는 측정기준이나 측정항목, 요약행표시, 필터 , 정렬등을 셋팅할 수 있다. 3. 상단 바의 기능 - 파일(file): 리포트를 공유하고 관리하는 기능 - 수정(edit): 되돌리기, 자르기, 복사등의 기능 - 보기(v..
-
루커 스튜디오(구글 데이터 스튜디오) - 2 데이터 소스 연결하기(GA, 빅쿼리, 스프레드 시트)데이터분석/루커 스튜디오(데이터 스튜디오) 2023. 3. 5. 11:43
보고서에 들어가는 데이터 셋들을 데이터 소스라고 한다. 이 데이터 소스가 있어야 보고서에 대시보드를 만들 수 있다. 데이터 소스는 여러가지가 있을 수 있지만 GA와 빅쿼리, 구글 스프레드 시트 데이터를 루커 스튜디오로 연결하는 것을 중점적으로 다뤄보고자 한다. 1. GA 데이터 연결하기 일단 GA와 루커스튜디오를 연결하기 위해서는 사전에 GA를 나의 프로덕트와 연결해야 한다. 위 사진은 지금 이 블로그의 GA를 붙인 사진이다. 일단 만들기에서 데이터 소스를 클릭한다. 거기서 GA를 선택한다. 연결하고 싶은 GA 계정을 선택해서 GA를 연동한다. 연결하게 되면 ga 데이터가 이런 식으로 데이터셋으로 나오게 된다. 2. 빅쿼리 연결하기 빅쿼리도 마찬가지로 처리하면 된다. 데이터 소스 만들기를 한 후에 빅쿼리..
-
루커 스튜디오(구글 데이터 스튜디오) - 1 인터페이스 살펴보기데이터분석/루커 스튜디오(데이터 스튜디오) 2023. 3. 3. 20:48
오늘부터 루커 스튜디오(구 구글 데이터 스튜디오)에 대해서 알아보도록 하자 1. 루커 스튜디오가 뭐예요? 루커 스튜디오는 구글 데이터 스튜디오가 리브랜딩 해서 나온 BI(business intelligence) 툴이다. 주로 대시보드를 만들 때 활용되며 다양한 데이터 소스와 결합 가능한 무료툴이라는 게 특징이다. https://lookerstudio.google.com/u/0/ 맞춤 보고서 및 대시보드 손쉽게 만들기 - Looker Studio 이메일 또는 휴대전화 accounts.google.com 2. 왜 루커 스튜디오를 활용해야 하나요? 루커 대시보드에는 아래와 같은 장점이 있다. - 일단 공짜이다. 타블로, 리대시, 퀵사이트 등등 회사에서 주로 활용되는 대시보드 툴은 사용하려면 모두 유료이다. 하..
-
AWS Athena(presto sql) - url 데이터 가져오기(url_decode, url_extract_host, url_extract_parameter, url_extract_path, url_extract_protocol, url_extract_query)데이터분석/SQL 2022. 7. 25. 21:58
아테나에서 url 데이터를 가져오는 법에 대해서 배워보도록 합시다. 기본적인 url 구조는 아래처럼 되어 있습니다. 여기서 데이터를 하나씩 가져오도록 하겠습니다. [protocol:][//host[:port]][path][?query][#fragment] 얘 시를 봅시다. 이건 네이버에서 디아블로를 검색한 url입니다. https://search.naver.com/search.naver?where=nexearch&sm=top_hty&fbm=0&ie=utf8&query=%EB%94%94%EC%95%84%EB%B8%94%EB%A1%9C url을 쪼개면 이렇게 볼 수 있다. -- host : search.naver.com -- path : /search.naver -- query : ?where=nexearc..
-
AWS Athena(Presto SQL) - json 데이터에서 value값 추출하기(json_extract, json_extract_scalar)데이터분석/SQL 2022. 7. 25. 08:12
aws 아테나에서 json 데이터에 있는 value값들을 가져오는 방법에 대해서 알아보도록 합시다. WITH dataset AS ( SELECT '{"name": "Susan Smith", "org": "engineering", "projects": [{"name":"project1", "completed":false}, {"name":"project2", "completed":true}]}' AS blob ) SELECT * FROM dataset 위의 json 데이터가 들어가 있다고 가정해봅시다. 1. json_extract_scalar: 단순 value 값 가져오기 json_extract_scalar는 단순 key와 value의 관계일 때 값을 가져오는 함수입니다. 문법 - json_extract_..