데이터분석/스프레드시트
-
스프레드 시트 데이터 분석 2 - 평균비교(t-test)데이터분석/스프레드시트 2022. 6. 18. 21:56
오늘은 스프레드 시트를 통해서 t-test를 하는 법에 대해서 알아보도록 하겠습니다. t-test는 무엇인가요? 두 집단 간 평균을 비교하는 대표적인 방법입니다. t-test는 분석을 위해서 여러 가지 가정을 하게 됩니다. 1. 두 집단의 분포가 정규분포이다.(정규성) 2. 두 집단의 분포는 같은 분산을 가지고 있다(등분 산성) 3. 실험은 서로 독립적으로 이루어졌을 것이다.(독립성) 안타깝지만 해당 가설은 스프레드시트로 검증하기가 어렵습니다. 하지만 R로는 쉬우니 한번 확인해보시기 바랍니다. https://kbkb456.tistory.com/93?category=915378 R 프로그래밍 10 - T-TEST(독립표본 t-test) https://kbkb456.tistory.com/90 R 프로그래밍 ..
-
스프레드 시트 데이터 분석 1 - 상관계수 분석(correl)데이터분석/스프레드시트 2021. 12. 26. 15:59
안녕하세요! 오늘은 스프레드 시트를 활용한 상관계수 분석에 대해서 알아보도록 하겠습니다. 1. 상관계수는 어떤 상황에서 활용하는 걸 까요? - 특정 변수와 다른 변수의 상관관계를 분석하기 위함 예를 들어 실제 아이스크림 판매수와 온도와의 상관관계를 본다고 생각해봅시다. 온도가 내려가면 아이스크림 판매수가 떨어지겠지? 온도가 올라가면 아이스크림 판매수가 올라가겠지? 이런 일반적인 지식을 뭔가 숫자로 표현해주는 것이 바로 상관계수입니다. (상관관계랑 인과관계는 다른 것인데 인과관계에 해당 분석은 상관관계만 반영하는 것입니다.) 2. 어떻게 계산되는 걸까? - 스프레드 시트의 상관계수는 pearson의 상관계수를 따릅니다. 수식 https://en.wikipedia.org/wiki/Correlation Cor..
-
구글 스프레드 시트 22 - 막대차트와 원형차트데이터분석/스프레드시트 2021. 3. 21. 07:31
안녕하세요! 오늘은 막대차트와 원형차트에 대해서 알아보도록 하겠습니다! 1. 막대차트와 원형차트는 각각 무엇인가요? - 막대차트: 범주 데이터를 요약하는 방법중 하나로 같은 크기의 막대를 사용하여 데이터를 표현하며, 각 막대에서는 데이터의 범주를 나타냅니다. - 원형차트: 범주 데이터를 요약하는 방법중 하나로 원형으로 되어 각 데이터의 비중을 표현하는 그래프 방식입니다. 2. 어떨때 사용하면 좋을까요? - 막대차트: 시간에 따른 데이터 + 범주가 많을때 ex) 월별 지역별 판매량 - 원형차트: 각 카테고리별 비중 ex) 지역별 판매량 이런 데이터 셋이 있다고 가정해 봅시다. 막대차트 그려보기 1. 일반 막대차트 단순 월별 사과 판매량을 보는 것과 같은 단순한 지표를 보기에 좋습니다. 2. 누적 막대차트 ..
-
구글 스프레드 시트 21 - 주소에서 지번을 분리 해보자데이터분석/스프레드시트 2021. 3. 20. 21:56
안녕하세요. 오늘은 주소를 지번과 동으로 나눠보도록 하겠습니다. 이런 주소가 있다고 생각해봅시다. 시군구, 읍, 동... 다양한 경우의 수가 있어서 지번을 분리하기가 쉬워보이지 않아보입니다. 하지만 공통점이 있습니다. 위 주소에서 지번이 시작하는 지점은 모두 숫자라는 점입니다. 서울시 송파구 잠실동, 대구광역시 달성군 다사읍 매곡리 이런 텍스트를 보면 공백수나 텍스트 수나 규칙이 없기 때문에 첫 숫자의 위치값을 찾는 방법이 현실적일 것입니다. 1. 0~9까지 모두 index를 구해봅시다. - 주소에서 숫자의 최초 위치값을 찾아야하기 때문에 일단 각 숫자별로 위치 값들을 찾아주는게 먼저입니다. =if(isnumber(FIND(0,$A2)),FIND(0,$A2),99) - FIND(0,$A2) = a2에 숫..
-
구글 스프레드 시트 20 - 데이터 순위 계산(rank, percentrank)데이터분석/스프레드시트 2021. 3. 20. 19:25
안녕하세요! 오늘은 데이터 순위를 계산하는 방법에 대해서 배워보겠습니다. 어떤 점수가 있다고 했을 때 등수를 정하는 것은 일반적인 일인데요. 스프레드 시트에서는 rank함수와 percentrank 함수를 이용해서 순위를 정하는 것이 가능합니다. 이런 점수 데이터 셋이 있다고 가정해봅시다. 해당 점수에 순위를 정해 보도록 하겠습니다. 1. Rank rank(데이터, 범위, 순위방식) - 데이터: 타겟 되는 데이터 - 범위: 타겟 되는 데이터가 속한 범위(해당 범위 안에서 타겟 데이터가 몇위인지 찾기 위함) - 순위방식: 1(오름차순 -> 작은값이 높은 순위) , 0(내림차순 -> 높은값이 높은 순위) 오름 차순 예시 내림 차순 예시 2. Percentrank percentrank는 기본적으로 내림차순으로 ..
-
구글 스프레드 시트 19 - 반올림, 반내림 함수(ROUND, ROUNDUP, ROUNDDOWN, MROUND, INT, FLOOR, CEILING)데이터분석/스프레드시트 2021. 3. 20. 19:01
오늘은 반올림, 반내림 함수에 대해서 알아보도록 하겠습니다. 1. 반올림, 반내림 함수 목록 함수명 기능 ROUND 표준 규칙에 따라 숫자를 특정 소수점 이하 자릿수로 반올림 TRUNC 특정 개수의 자릿수만 남기고 나머지 자리를 잘라 버립니다. ROUNDUP 숫자를 특정 소수점 이하 자릿수로 올립니다. ROUNDDOWN 숫자를 특정 소수점 이하 자릿수로 버립니다. MROUND 한 숫자를 다른 숫자의 가장 가까운 정수배로 반올림합니다. INT 해당 숫자보다 작거나 같은 가장 가까운 정수로 숫자를 버립니다. FLOOR 숫자를 지정된 significance의 가장 가까운 정수배로 버립니다. CEILING 숫자를 지정된 significance의 가장 가까운 정수배로 올립니다. 2. 소숫점이 0.5보다 큰 경우 ..
-
구글 스프레드 시트 18 - 영역 차트(Area chart)데이터분석/스프레드시트 2021. 3. 20. 16:32
안녕하세요! 오늘은 스프레드 시트의 영역차트에 대해서 알아보도록 하겠습니다. 영역차트란? 영역차트는 선차트와 비슷한 추세를 나타내는 차트이지만 선 아래에 음영이 있어서 추세의 크기도 같이 표현할 수 있는 차트 입니다. 예를 들어보겠습니다. A자동차 회사의 1~6월 매출과 비용에 추세에 대해서 그려보도록 하겠습니다. 이런 데이터셋이 있다고 가정해 봅시다. 매출과 비용을 선차트로 그려도 추세를 알 수 있지만 사실 비용대비 매출이 얼마나 차이가 있는지 알기 위함 입니다. 1. 영역차트 이런식으로 선 아래 음영처리를 통해서 면적을 시각화 함으로써 차이가 얼마나 발생했는지 알기 좋게 표현해 줍니다. 2. 누적 영역차트 비용과 매출을 합산하여 표시하되 각각 항목별로 얼마나 면적을 차지하는지 알려줍니다. 3. 퍼센트..
-
구글 스프레드 시트 17 - 선 차트(line chart)데이터분석/스프레드시트 2021. 1. 15. 00:33
안녕하세요 오늘은 스프레드 시트에서 선 차트(line chart)를 사용하는 법, 사용하는 사례에 대해서 알아보도록 하겠습니다. 1. 선차트(line chart)란 무엇인가? - 데이터를 선으로 표현해서 데이터를 시각화하는 것을 선 차트라고 합니다. 2. 어떨때 활용하면 좋을까요? - 시간에 따른 데이터의 변화를 보고 싶을 때 주로 사용하면 좋습니다. ex) 주식차트, 날짜별 매출변화 ... 이런 데이터가 있다고 가정해봅시다. 날짜별로 자동차 A사와 B사의 매출의 변화를 그래프로 그려보겠습니다. 3. 차트 넣는 법 - 데이터를 드래그 한 뒤 차트 넣기 버튼을 눌러주면 됩니다. 4. 그래프 결과 그래프 결과는 이렇게 나오게 됩니다. 시간에 따라 자동차 B사와 A사의 매출이 벌어지는 것을 한눈에 알 수 있죠..