스프레드시트
-
스프레드 시트 데이터 분석 2 - 평균비교(t-test)데이터분석/스프레드시트 2022. 6. 18. 21:56
오늘은 스프레드 시트를 통해서 t-test를 하는 법에 대해서 알아보도록 하겠습니다. t-test는 무엇인가요? 두 집단 간 평균을 비교하는 대표적인 방법입니다. t-test는 분석을 위해서 여러 가지 가정을 하게 됩니다. 1. 두 집단의 분포가 정규분포이다.(정규성) 2. 두 집단의 분포는 같은 분산을 가지고 있다(등분 산성) 3. 실험은 서로 독립적으로 이루어졌을 것이다.(독립성) 안타깝지만 해당 가설은 스프레드시트로 검증하기가 어렵습니다. 하지만 R로는 쉬우니 한번 확인해보시기 바랍니다. https://kbkb456.tistory.com/93?category=915378 R 프로그래밍 10 - T-TEST(독립표본 t-test) https://kbkb456.tistory.com/90 R 프로그래밍 ..
-
구글 스프레드 시트 20 - 데이터 순위 계산(rank, percentrank)데이터분석/스프레드시트 2021. 3. 20. 19:25
안녕하세요! 오늘은 데이터 순위를 계산하는 방법에 대해서 배워보겠습니다. 어떤 점수가 있다고 했을 때 등수를 정하는 것은 일반적인 일인데요. 스프레드 시트에서는 rank함수와 percentrank 함수를 이용해서 순위를 정하는 것이 가능합니다. 이런 점수 데이터 셋이 있다고 가정해봅시다. 해당 점수에 순위를 정해 보도록 하겠습니다. 1. Rank rank(데이터, 범위, 순위방식) - 데이터: 타겟 되는 데이터 - 범위: 타겟 되는 데이터가 속한 범위(해당 범위 안에서 타겟 데이터가 몇위인지 찾기 위함) - 순위방식: 1(오름차순 -> 작은값이 높은 순위) , 0(내림차순 -> 높은값이 높은 순위) 오름 차순 예시 내림 차순 예시 2. Percentrank percentrank는 기본적으로 내림차순으로 ..
-
구글 스프레드 시트 18 - 영역 차트(Area chart)데이터분석/스프레드시트 2021. 3. 20. 16:32
안녕하세요! 오늘은 스프레드 시트의 영역차트에 대해서 알아보도록 하겠습니다. 영역차트란? 영역차트는 선차트와 비슷한 추세를 나타내는 차트이지만 선 아래에 음영이 있어서 추세의 크기도 같이 표현할 수 있는 차트 입니다. 예를 들어보겠습니다. A자동차 회사의 1~6월 매출과 비용에 추세에 대해서 그려보도록 하겠습니다. 이런 데이터셋이 있다고 가정해 봅시다. 매출과 비용을 선차트로 그려도 추세를 알 수 있지만 사실 비용대비 매출이 얼마나 차이가 있는지 알기 위함 입니다. 1. 영역차트 이런식으로 선 아래 음영처리를 통해서 면적을 시각화 함으로써 차이가 얼마나 발생했는지 알기 좋게 표현해 줍니다. 2. 누적 영역차트 비용과 매출을 합산하여 표시하되 각각 항목별로 얼마나 면적을 차지하는지 알려줍니다. 3. 퍼센트..
-
구글 스프레드 시트 16 - 다양한 전화번호 양식 통일시키기(SUBSTITUTE, IF, CONCATENATE, TEXTJOIN)데이터분석/스프레드시트 2021. 1. 11. 13:53
안녕하세요! 오늘은 다양한 양식으로 되어있는 전화번호를 한 양식으로 통일하는 방법에 대해서 알아보겠습니다. 이런 양식이 있다고 가정해봅시다. 정말(?) 다양한 양식으로 전화번호가 입력되어있는데요. 이것은 일반적인 형태인 010-1234-1234로 변경시키는 방법은 어떤게 있을까요? 일일이 손으로 하는 방법도 있지만 이 전화번호가 1000개 10000개가 된다면 손으로 하는 방법은 불가능에 가까울 것입니다. 그럼 어떻게 통일 시킬 수 있을까요? 1. 필요없는 문자는 제거하여 숫자로 된 문자만 남기자 위의 예시에서는 " ","-",".",")"과 같은 문자가 들어가 있고 이들이 불규칙적으로 들어가 있기 때문에 일단 제거하는 작업이 필요합니다. 문자열 내에서 이런 불필요한 문자를 제거하는 함수는 바로 SUBS..
-
구글 스프레드 시트 4 - 조건문(if, ifs, switch, iferror)데이터분석/스프레드시트 2020. 12. 21. 22:44
오늘은 구글 스프레드시트의 if, ifs, switch, iferror 함수에 대해서 알아보겠습니다. 어떤 데이터가 있다고 했을때 조건에 맞게 데이터를 처리하는 것이 필요합니다. if 함수 - 하나의 조건을 처리해야하는 경우 =if(관련 조건식, 참일때 값 , 거짓일때 값) ex) =if(A1 = B1, 1, 0) A1과 B1이 같다면 1 서로 다르다면 0 예를들어 이런 연봉 테이블에 대한 데이터가 있다고 가정을 해봅시다. 만약 30대 이상을 그룹으로 묶으려면 어떻게 해야할까요? if함수를 이용하면 간단하게 가능합니다. =if(E2>30,"30대이상","30대이하") 이런식으로 처리를 할 수 있습니다. ifs 함수 - 한번에 여러조건으로 데이터를 처리해야하는 경우 =ifs(조건1, 조건1이 참일때 값, ..
-
구글 스프레드시트 3 - 산술연산자와 논리 연산자데이터분석/스프레드시트 2020. 12. 20. 23:02
스프레드 시트에서는 어떤 특정 계산을 하기 위해서 숫자연산자, 논리연산자, 문자연산자가 있습니다. 흡사 계산기랑 비슷한 형태를 가졌는데요. 하나씩 알아보도록 합시다. 앞서 연산을 하기 위해서는 '=셀 + 셀' 과 같이 '=' 등호를 먼저 붙이면서 시작해야합니다. 등호를 붙이면 그 순간 스프레드 시트가 이를 수식으로 인지하게 시작합니다. 1. 숫자 연산자 - 숫자 연산자는 숫자에 해당하는 값들을 계산해주는 연산자 입니다. 연산자 설명 수식 결과 + 수식에 있는 값들을 더해줌 =1+2 3 - 수식에 있는 값들을 빼줌 =2-1 1 * 수식에 있는 값들을 곱해줌 =3*4 12 / 수식에 있는 값들을 나눠줌 =12/3 4 ^ 수식에 있는 값들을 제곱해줌 =2^2 4 % 수식에 있는 값을 %로 바꿔줌 =2% 0.0..
-
구글 스프레드시트 1 - 왜 구글 시트를 활용해야 하는가?데이터분석/스프레드시트 2020. 12. 19. 16:44
우리는 왜 구글 스프레드 시트를 활용해야하는가? 보통 회사에서 업무를 할때 많이 사용하는 것이 바로 엑셀입니다. 데이터 정리 및 관리, 데이터 분석, 시각화 등 다양한 작업을 활용하는 툴로 많은 사람들이 활용하고 있습니다. 그러나 코로나19이후, 자연스럽게 많은 회사가 재택근무를 시행함으로써 클라우드에 문서를 공유하고 서로 같이 작업하는게 일상화 되어 가고있습니다. 매일 엑셀을 다운로드 받고, 수식을 고쳐서 버전관리하고, 이를 그때그때마다 저장해서 다시 파일을 공유하고 이런데 불편하고 지치지 않으셨는지요? 이런 불편함을 해소하기 위해 활용해야 할것이 바로 구글 스프레드 시트입니다. 구글 스프레드 시트란? - 위의 엑셀을 별도의 설치없이 웹에서 활용할 수 있도록 만들어놓은 프로그램 그럼 구글 스프레드 시트..