csv파일 불러오기

Data Learning

csv파일 불러오기

HR분석 0 121 2020.02.29 10:31

데이터 불러오기 및 저장하기

csv파일 불러오기


형식 | read.csv(“파일위치/파일명.csv”,옵션1,옵션2)

read.csv(“파일위치/파일명.확장자”,옵션1,옵션2)순으로 정의를 한다.
header=TRUE, 첫번째 행의 이름을 컬럼명으로 한다, 기본값은 TRUE
결측치가 포함된 경우 대응값을 지정, 기본값은 NA
na.string=‘NA’
문자열을 팩터로 지정할지 여부를 설정, 기본값은 TRUE
stringAsFactor=TRUE )


실습 csv파일을 불러온다.

hr <- read.csv("C:/data/hrdata.csv",header=T, stringsAsFactors = T)
names(hr)
##  [1] "id"                    "satisfaction_level"    "last_evaluation"      
##  [4] "number_project"        "average_montly_hours"  "time_spend_company"   
##  [7] "Work_accident"         "left"                  "promotion_last_5years"
## [10] "sales"                 "salary"                "sex"
  • 불러온 파일을 hr이라는 데이터프레임(객체)로 저장하여 사용한다.
    • read.csv(“파일위치/파일명.확장자”,옵션1, 옵션2)순으로 정의를 한다.
    • 옵션1 header의 디폴트 옵션은 TRUE이다.
    • 사내외 대다수의 파일들은 컬럼명(열이름)이 있으므로, 구태여 지정할 필요없다.
    • stringAsFactor의 옵션2의 디폴트는 TRUE이다.
    • csv파일을 불러올 경우 문자형은 모두 범주형(Factor형)으로 변경되어 불러오므로 구태여 지정할 필요없다.


실습 옵션없이 csv파일을 불러온다.

hr1 <- read.csv("C:/data/hrdata.csv")
names(hr1)
##  [1] "id"                    "satisfaction_level"    "last_evaluation"      
##  [4] "number_project"        "average_montly_hours"  "time_spend_company"   
##  [7] "Work_accident"         "left"                  "promotion_last_5years"
## [10] "sales"                 "salary"                "sex"
  • 대부분의 내부 자료에서는 첫번째 행이 컬럼명으로 되어 있기 때문에 옵션1 header없이 사용 가능하다..
  • 결측치가 있을 경우 ’NA’로 기본적으로 표기된다.
  • 문자열을 factor로 기본적으로 설정된다.
  • 따라서 파일명으로 불러와서 사용해도 무방하다.


 

HR04.co.kr HR분석연구소 유제성

hrd04@naver.com

, , , , ,

Comments

Data Learning

상담 문의


010.9417.2025 hrd04@naver.com