구글 스프레드 시트
-
스프레드 시트 데이터 분석 1 - 상관계수 분석(correl)데이터분석/스프레드시트 2021. 12. 26. 15:59
안녕하세요! 오늘은 스프레드 시트를 활용한 상관계수 분석에 대해서 알아보도록 하겠습니다. 1. 상관계수는 어떤 상황에서 활용하는 걸 까요? - 특정 변수와 다른 변수의 상관관계를 분석하기 위함 예를 들어 실제 아이스크림 판매수와 온도와의 상관관계를 본다고 생각해봅시다. 온도가 내려가면 아이스크림 판매수가 떨어지겠지? 온도가 올라가면 아이스크림 판매수가 올라가겠지? 이런 일반적인 지식을 뭔가 숫자로 표현해주는 것이 바로 상관계수입니다. (상관관계랑 인과관계는 다른 것인데 인과관계에 해당 분석은 상관관계만 반영하는 것입니다.) 2. 어떻게 계산되는 걸까? - 스프레드 시트의 상관계수는 pearson의 상관계수를 따릅니다. 수식 https://en.wikipedia.org/wiki/Correlation Cor..
-
구글 스프레드 시트 22 - 막대차트와 원형차트데이터분석/스프레드시트 2021. 3. 21. 07:31
안녕하세요! 오늘은 막대차트와 원형차트에 대해서 알아보도록 하겠습니다! 1. 막대차트와 원형차트는 각각 무엇인가요? - 막대차트: 범주 데이터를 요약하는 방법중 하나로 같은 크기의 막대를 사용하여 데이터를 표현하며, 각 막대에서는 데이터의 범주를 나타냅니다. - 원형차트: 범주 데이터를 요약하는 방법중 하나로 원형으로 되어 각 데이터의 비중을 표현하는 그래프 방식입니다. 2. 어떨때 사용하면 좋을까요? - 막대차트: 시간에 따른 데이터 + 범주가 많을때 ex) 월별 지역별 판매량 - 원형차트: 각 카테고리별 비중 ex) 지역별 판매량 이런 데이터 셋이 있다고 가정해 봅시다. 막대차트 그려보기 1. 일반 막대차트 단순 월별 사과 판매량을 보는 것과 같은 단순한 지표를 보기에 좋습니다. 2. 누적 막대차트 ..
-
구글 스프레드 시트 21 - 주소에서 지번을 분리 해보자데이터분석/스프레드시트 2021. 3. 20. 21:56
안녕하세요. 오늘은 주소를 지번과 동으로 나눠보도록 하겠습니다. 이런 주소가 있다고 생각해봅시다. 시군구, 읍, 동... 다양한 경우의 수가 있어서 지번을 분리하기가 쉬워보이지 않아보입니다. 하지만 공통점이 있습니다. 위 주소에서 지번이 시작하는 지점은 모두 숫자라는 점입니다. 서울시 송파구 잠실동, 대구광역시 달성군 다사읍 매곡리 이런 텍스트를 보면 공백수나 텍스트 수나 규칙이 없기 때문에 첫 숫자의 위치값을 찾는 방법이 현실적일 것입니다. 1. 0~9까지 모두 index를 구해봅시다. - 주소에서 숫자의 최초 위치값을 찾아야하기 때문에 일단 각 숫자별로 위치 값들을 찾아주는게 먼저입니다. =if(isnumber(FIND(0,$A2)),FIND(0,$A2),99) - FIND(0,$A2) = a2에 숫..
-
구글 스프레드 시트 20 - 데이터 순위 계산(rank, percentrank)데이터분석/스프레드시트 2021. 3. 20. 19:25
안녕하세요! 오늘은 데이터 순위를 계산하는 방법에 대해서 배워보겠습니다. 어떤 점수가 있다고 했을 때 등수를 정하는 것은 일반적인 일인데요. 스프레드 시트에서는 rank함수와 percentrank 함수를 이용해서 순위를 정하는 것이 가능합니다. 이런 점수 데이터 셋이 있다고 가정해봅시다. 해당 점수에 순위를 정해 보도록 하겠습니다. 1. Rank rank(데이터, 범위, 순위방식) - 데이터: 타겟 되는 데이터 - 범위: 타겟 되는 데이터가 속한 범위(해당 범위 안에서 타겟 데이터가 몇위인지 찾기 위함) - 순위방식: 1(오름차순 -> 작은값이 높은 순위) , 0(내림차순 -> 높은값이 높은 순위) 오름 차순 예시 내림 차순 예시 2. Percentrank percentrank는 기본적으로 내림차순으로 ..
-
구글 스프레드 시트 19 - 반올림, 반내림 함수(ROUND, ROUNDUP, ROUNDDOWN, MROUND, INT, FLOOR, CEILING)데이터분석/스프레드시트 2021. 3. 20. 19:01
오늘은 반올림, 반내림 함수에 대해서 알아보도록 하겠습니다. 1. 반올림, 반내림 함수 목록 함수명 기능 ROUND 표준 규칙에 따라 숫자를 특정 소수점 이하 자릿수로 반올림 TRUNC 특정 개수의 자릿수만 남기고 나머지 자리를 잘라 버립니다. ROUNDUP 숫자를 특정 소수점 이하 자릿수로 올립니다. ROUNDDOWN 숫자를 특정 소수점 이하 자릿수로 버립니다. MROUND 한 숫자를 다른 숫자의 가장 가까운 정수배로 반올림합니다. INT 해당 숫자보다 작거나 같은 가장 가까운 정수로 숫자를 버립니다. FLOOR 숫자를 지정된 significance의 가장 가까운 정수배로 버립니다. CEILING 숫자를 지정된 significance의 가장 가까운 정수배로 올립니다. 2. 소숫점이 0.5보다 큰 경우 ..
-
구글 스프레드 시트 16 - 다양한 전화번호 양식 통일시키기(SUBSTITUTE, IF, CONCATENATE, TEXTJOIN)데이터분석/스프레드시트 2021. 1. 11. 13:53
안녕하세요! 오늘은 다양한 양식으로 되어있는 전화번호를 한 양식으로 통일하는 방법에 대해서 알아보겠습니다. 이런 양식이 있다고 가정해봅시다. 정말(?) 다양한 양식으로 전화번호가 입력되어있는데요. 이것은 일반적인 형태인 010-1234-1234로 변경시키는 방법은 어떤게 있을까요? 일일이 손으로 하는 방법도 있지만 이 전화번호가 1000개 10000개가 된다면 손으로 하는 방법은 불가능에 가까울 것입니다. 그럼 어떻게 통일 시킬 수 있을까요? 1. 필요없는 문자는 제거하여 숫자로 된 문자만 남기자 위의 예시에서는 " ","-",".",")"과 같은 문자가 들어가 있고 이들이 불규칙적으로 들어가 있기 때문에 일단 제거하는 작업이 필요합니다. 문자열 내에서 이런 불필요한 문자를 제거하는 함수는 바로 SUBS..
-
구글 스프레드 시트 15 - 필터활용하기(filter)데이터분석/스프레드시트 2021. 1. 8. 08:59
안녕하세요 어떤 데이터가 있다고 했을때 원하는 조건으로 데이터를 보고싶다고 한다면 어떤 기능을 활용해야 할까요? 바로 필터링입니다. 오늘은 구글 스프레드 시트에서 원하는 조건으로 데이터를 볼 수 있는 데이터 필터 기능에 대해서 알아보도록 하겠습니다. 1. 필터 버튼으로 필터링 하기 1. 필터링 시작하기 아래의 버튼들을 활용하면 필터를 시작할 수 있습니다. - 필터버튼클릭 - 데이터 -> 필터 만들기 클릭 버튼을 누르면 이렇게 표시가 되고 필터가 활성화 된 것 입니다. 2. 필터 활용하기 필터의 장점 - 데이터를 원하는 조건대로 짤라서 볼 수 있음 - 한 데이터 시트에 여러조건을 넣어 필터링 해볼 수 있음 그럼 필터를 한번 활용해 볼까요? 위에 세모 버튼을 누르게 되면 필터링 할 수 있는 옵션들이 나옵니다..
-
구글 스프레드 시트 13 - 자주 사용되는 문자열 함수(LEN, FIND, SEARCH, LOWER, UPPER, TRIM, REPLACE)데이터분석/스프레드시트 2021. 1. 3. 07:27
안녕하세요. 오늘은 자주 활용되는 문자열 함수에 대해서 알아보겠습니다. 1. LEN LEN은 문자열의 길이를 측정해주는 함수인데요. "가나다", "가나", "다" 이런 텍스트가 있을때 각각의 텍스트가 몇글자인지 알려주는 함수 입니다. =LEN("문자열") 2. FIND FIND 함수는 어떤 문자열이 있을 때 그 문자열 안에서 특정 단어의 위치를 알려주는 함수 입니다. FIND 함수의 경우 대소문자를 구분해서 위치를 찾습니다. =FIND("찾고싶은문자", "문자열", "시작 위치") 예를들어 "가나다"라는 문자열에서 "나"라는 문자의 위치를 첫번째 문자부터 찾게 되면 "가나다"에서 "나"가 두번째 자리에 있기 때문에 2를 리턴합니다. #예시 =FIND("나",A2,1) 3. SEARCH SEARCH 함수도..