데이터분석/R
-
R 프로그래밍 10 - T-TEST(독립표본 t-test)데이터분석/R 2021. 12. 26. 01:52
https://kbkb456.tistory.com/90 R 프로그래밍 9 - dplyr을 활용하여 깔끔한 코드로 데이터 전처리하기(filter, arrange, mutate, select, summa https://kbkb456.tistory.com/62 R 프로그래밍 8 - R 데이터 프레임을 피벗 테이블 처럼 활용하기(dcast, melt) 오늘은 R의 데이터 프레임을 피벗테이블처럼 활용하는 법에 대해서 알아보도록 하겠습니다. 여 kbkb456.tistory.com 저번 시간까지 데이터를 가공하고 요약하는 법에 대해서 배웠습니다. 오늘은 T-TEST에 대해서 알아보도록 합시다. 필요한 라이브러리 불러오기 library(lawstat) library(dplyr) T-TEST? 두 집단간 평균을 비교하는..
-
R 프로그래밍 9 - dplyr을 활용하여 깔끔한 코드로 데이터 전처리하기(filter, arrange, mutate, select, summarise, group_by, %>%)데이터분석/R 2021. 12. 14. 23:58
https://kbkb456.tistory.com/62 R 프로그래밍 8 - R 데이터 프레임을 피벗 테이블 처럼 활용하기(dcast, melt) 오늘은 R의 데이터 프레임을 피벗테이블처럼 활용하는 법에 대해서 알아보도록 하겠습니다. 여러분 피벗테이블은 왜 쓸까요? 바로 데이터프레임을 원하는 데로 길게(long format)하거나 넓게(wide fo kbkb456.tistory.com 저번 시간에는 reshape2를 활용해서 데이터를 피봇팅 하는 방법에 대해서 알아봤습니다. 오늘은 r 데이터 전처리에서 널리 활용되는 dplyr에 대해서 알아보도록 하겠습니다. dplyr 패키지? reshape2 패키지와 마찬가지로 데이터 전처리에 특화된 R패키지입니다. 현재는 tidyverse 패키지 묶음에 포함되어 있는..
-
R 프로그래밍 8 - R 데이터 프레임을 피벗 테이블 처럼 활용하기(dcast, melt)데이터분석/R 2021. 11. 7. 15:11
오늘은 R의 데이터 프레임을 피벗테이블처럼 활용하는 법에 대해서 알아보도록 하겠습니다. 여러분 피벗테이블은 왜 쓸까요? 바로 데이터프레임을 원하는 데로 길게(long format)하거나 넓게(wide format)하거나 하고 싶어서입니다. R에서도 이런 게 가능합니다. R에는 패키지라는 개념이 있습니다. 남이 만들어둔 함수를 내가 가져다가 쓸 수 있는 개념이라고 보시면 됩니다. R에 reshape2 패키지를 이용해서 데이터 프레임을 자유자재로 길게 하거나 넓게 하거나 하는 것이 가능합니다. 일단 패키지를 설치해봅시다. #reshape2 설치하기 install.packages("reshape2") #reshape2 불러오기 library(reshape2) 이런 식으로 남이 만들어둔 패키지를 가져다가 내 컴..
-
R 프로그래밍 7 - 패키지와 샘플데이터(packages, sample data)데이터분석/R 2021. 11. 3. 21:15
R에는 패키지와 샘플데이터라는 것이 있습니다. 1. 패키지? 패키지는 많은 R 유저들이 각자 특수한 목적으로 코드를 만들어둔 집합을 의미하는 것으로 특정 주제에 대해서 완성도가 높고 설계가 잘되어 있어 제삼자가 재사용하기 쉽게 만들어 둔 것을 의미합니다! 패키지는 CRAN이란곳에서 공유되고 있고 install.packages() 함수를 통해서 설치가 가능합니다. #하나의 패키지를 설치하는 법 install.packages("reshape2") #여러개의 패키지를 설치하는 법 install.packages(c("reshape2","dplyr")) #패키지를 실행하는 법 library(reshape2) 이런 식으로 기본 R에 설치되지 않은 함수를 활용할 수 있도록 도와주는 것이 패키지입니다. 2. 샘플데이터..
-
R 프로그래밍 6 - R에 CSV파일 불러오기데이터분석/R 2021. 1. 10. 16:01
오늘은 R에서 CSV 파일을 데이터 프레임으로 가져오는 법에 대해서 알아보도록 하겠습니다. 그런데 CSV 파일이 무엇일까요? Comma: 컴마로(,) Separated: 분리된 Values: 값 입니다. 메모장에 예시로 보면 이것을 스프레드 시트로 열어보면 각 셀로 펼쳐져 있습니다. 스프레드시트나 엑셀은 이 파일을 Comma(,)로 자동으로 분리해 각 셀로 가지고 있는 것 입니다. R에서는 CSV파일을 read_csv 함수를 통해서 가져오게 되는데요. (다른 라이브러리에도 CSV파일을 가져오는 함수가 있으나 일단 오늘은 기본내장함수부터 써보도록 하겠습니다.) x 옵션을 선택안했을시 기본 True로 인식 fileEncoding: 한글파일을 인코딩할때 활용하는 옵션 -> CP949, UTF-8 주로활용 st..
-
R 프로그래밍 4 - R 문법 기초3 반복문(for, while, repeat)과 함수(function)데이터분석/R 2021. 1. 2. 06:19
오늘 알아볼것은 R에서의 반복문과 함수입니다. 어떤 작업을 반복해서 출력해야할 때 반복문이라는 것을 활용하게 되는데요. R에서의 기본적인 반목분은 for, while, repeat이 있습니다. 하나씩 알아볼까요? 1. 반복문 - for for loop에서는 ()안에 반복수를 넣고 {}안에 하고 싶은 연산을 넣으면 됩니다. for(반복수){ 연산 } 예시로 구구단 3단을 출력해보겠습니다. for(i in 1:9){ print(i*3) } 위의 코드를 해석하자면 1. i 를 1 부터 9까지 순차적으로 할당하겠다.(반복수) 2. i에 3을 곱해서 출력하겠다. 출력 결과를 확인하면 이런 결과가 나오게 됩니다. - while while에는 ()안에 조건을 넣고 {}에는 조건이 참이 될 때까지 할 연산을 넣어주면 ..