-
R 프로그래밍 7 - 패키지와 샘플데이터(packages, sample data)데이터분석/R 2021. 11. 3. 21:15반응형
R에는 패키지와 샘플데이터라는 것이 있습니다.
1. 패키지?
패키지는 많은 R 유저들이 각자 특수한 목적으로 코드를 만들어둔 집합을 의미하는 것으로 특정 주제에 대해서 완성도가 높고 설계가 잘되어 있어 제삼자가 재사용하기 쉽게 만들어 둔 것을 의미합니다!
패키지는 CRAN이란곳에서 공유되고 있고 install.packages() 함수를 통해서 설치가 가능합니다.
#하나의 패키지를 설치하는 법 install.packages("reshape2") #여러개의 패키지를 설치하는 법 install.packages(c("reshape2","dplyr")) #패키지를 실행하는 법 library(reshape2)
이런 식으로 기본 R에 설치되지 않은 함수를 활용할 수 있도록 도와주는 것이 패키지입니다.
2. 샘플데이터?
R을 이용하는 사용자를 위해서 자체적으로 제공하는 연습용 데이터가 있습니다.
대표적으로 iris나 mtcars 같은 것이 있는데요.
확인은 이렇게 가능합니다.
#R 내장 데이터 확인하기 data()
이렇게 콘솔에서 실행하면 아래처럼 데이터들의 리스트가 나옵니다.
r 내장 데이터 셋 이 해당 데이터는 그냥 저대로 가져다 쓸 수도 있고 따로 변수로 선언해서 활용도 할 수 있습니다.
#mtcars를 df 변수로 활용하고 싶다면 이렇게 하면 된다. df <- mtcars
그리고 여기서 데이터의 구조를 확인하고 싶다면 head와 str을 이용하면 데이터의 구조를 확인해볼 수 있습니다.
head 함수: head는 데이터 프레임의 상위 몇 개 row를 보여주는 함수입니다.
# 기본은 상위 6개를 보여준다. head(mtcars) # 뒤에 숫자를 쓰면 숫자만큼 보여준다. head(mtcars,10)
head 함수 str 함수: str은 데이터의 구조를 보여주는 함수입니다.
df의 데이터 구조를 보여주고 있다. 여기서 df의 데이터 구조는 데이터 프레임이고 각각 컬럼 별로 어떤 타입의 변수인지 알려 주고 있습니다.
다음시간부터는 해당 데이터와 패키지를 가지고 데이터를 가공하는 법에 대해서 알아보도록 하겠습니다.
반응형'데이터분석 > R' 카테고리의 다른 글
R 프로그래밍 9 - dplyr을 활용하여 깔끔한 코드로 데이터 전처리하기(filter, arrange, mutate, select, summarise, group_by, %>%) (0) 2021.12.14 R 프로그래밍 8 - R 데이터 프레임을 피벗 테이블 처럼 활용하기(dcast, melt) (0) 2021.11.07 R 프로그래밍 6 - R에 CSV파일 불러오기 (0) 2021.01.10 R 프로그래밍 5 - 수열 만들기(rep,seq) (0) 2021.01.03 R 프로그래밍 4 - R 문법 기초3 반복문(for, while, repeat)과 함수(function) (0) 2021.01.02