데이터분석/R

R 프로그래밍 6 - R에 CSV파일 불러오기

devbean 2021. 1. 10. 16:01
반응형

오늘은 R에서 CSV 파일을 데이터 프레임으로 가져오는 법에 대해서 알아보도록 하겠습니다.

 

그런데 CSV 파일이 무엇일까요?

 

Comma: 컴마로(,)

Separated: 분리된
Values: 값

 

입니다.

메모장에 예시로 보면

콤마로 분리되어 있는 데이터들

 

이것을 스프레드 시트로 열어보면 각 셀로 펼쳐져 있습니다.

스프레드시트나 엑셀은 이 파일을 Comma(,)로 자동으로 분리해 각 셀로 가지고 있는 것 입니다.

 

위의 csv 파일을 스프레드 시트로 옮겼을 때

 

R에서는 CSV파일을 read_csv 함수를 통해서 가져오게 되는데요.

(다른 라이브러리에도 CSV파일을 가져오는 함수가 있으나 일단 오늘은 기본내장함수부터 써보도록 하겠습니다.)

x <- read.csv("파일 경로", header = T, fileEncoding = "CP949",stringsAsFactors= False)

"파일경로": CSV가 있는 파일의 경로

header: 맨 위의 row가 컬럼명, 즉 헤더인지의 여부 -> 옵션을 선택안했을시 기본 True로 인식

fileEncoding: 한글파일을 인코딩할때 활용하는 옵션 -> CP949, UTF-8 주로활용

stringsAsFactors: 문자열을 인자로 받아야 할때 활용

위의 예시로 데이터를 가져와 보겠습니다.

 

근데 파일경로는 어떻게 알 수 있나요?

윈도우에서 해당 파일을 오른쪽 클릭 -> 속성에 들어가면 알 수 있습니다.

윈도우에서 파일속성 클릭
파일 위치확인

 

이제 한번 가져와 보도록 하겠습니다.

 

그냥 경로를 복사해서 붙여 넣을 경우 이런에러를 만날 수도 있습니다.

R 역슬래시 에러

이때는 당황하지 마시고 모든 역슬래시를 슬래시로 바꿔주시면 됩니다.

x <- read.csv("C:/Users/Administrator/Desktop/example.csv",header=TRUE)

이렇게 하고 R 스튜디오에서 테이블을 확인해보면 잘들어가 있는 것을 확인 할 수 있습니다. 

R 스튜디오 테이블

마치며

보통 파일을 엑셀에서 원하는 시트를 csv로 저장해 R에서 처리하는 경우가 많습니다. read.csv를 통해서 R로 데이터를 불러왔으니 다음시간부터는 데이터 처리를 해보도록 하겠습니다.

반응형