데이터분석/R
R 프로그래밍 6 - R에 CSV파일 불러오기
devbean
2021. 1. 10. 16:01
반응형
오늘은 R에서 CSV 파일을 데이터 프레임으로 가져오는 법에 대해서 알아보도록 하겠습니다.
그런데 CSV 파일이 무엇일까요?
Comma: 컴마로(,)
Separated: 분리된
Values: 값
입니다.
메모장에 예시로 보면
이것을 스프레드 시트로 열어보면 각 셀로 펼쳐져 있습니다.
스프레드시트나 엑셀은 이 파일을 Comma(,)로 자동으로 분리해 각 셀로 가지고 있는 것 입니다.
R에서는 CSV파일을 read_csv 함수를 통해서 가져오게 되는데요.
(다른 라이브러리에도 CSV파일을 가져오는 함수가 있으나 일단 오늘은 기본내장함수부터 써보도록 하겠습니다.)
x <- read.csv("파일 경로", header = T, fileEncoding = "CP949",stringsAsFactors= False)
"파일경로": CSV가 있는 파일의 경로
header: 맨 위의 row가 컬럼명, 즉 헤더인지의 여부 -> 옵션을 선택안했을시 기본 True로 인식
fileEncoding: 한글파일을 인코딩할때 활용하는 옵션 -> CP949, UTF-8 주로활용
stringsAsFactors: 문자열을 인자로 받아야 할때 활용
위의 예시로 데이터를 가져와 보겠습니다.
근데 파일경로는 어떻게 알 수 있나요?
윈도우에서 해당 파일을 오른쪽 클릭 -> 속성에 들어가면 알 수 있습니다.
이제 한번 가져와 보도록 하겠습니다.
그냥 경로를 복사해서 붙여 넣을 경우 이런에러를 만날 수도 있습니다.
이때는 당황하지 마시고 모든 역슬래시를 슬래시로 바꿔주시면 됩니다.
x <- read.csv("C:/Users/Administrator/Desktop/example.csv",header=TRUE)
이렇게 하고 R 스튜디오에서 테이블을 확인해보면 잘들어가 있는 것을 확인 할 수 있습니다.
마치며
보통 파일을 엑셀에서 원하는 시트를 csv로 저장해 R에서 처리하는 경우가 많습니다. read.csv를 통해서 R로 데이터를 불러왔으니 다음시간부터는 데이터 처리를 해보도록 하겠습니다.
반응형