csv파일 불러오는 방법

Data Learning

csv파일 불러오는 방법

HR분석 0 92 2019.01.22 10:39

csv파일 불러오기



현업에서 사용하는 대다수의 파일들이 엑셀로 되어 있는데,
엑셀 파일을 다른이름으로 저장하여 확장자가 csv파일로 저장한다.
csv파일은 쉽표로 구분된 값이 있는 파일이며
그러한 파일을 읽어오려고 한다.

새로운 변수 <- read.csv("파일명")
  • 파일이 존재하는 경로 및 파일이름 및 확장자인 csv를 입력하여 데이터를 불러온다.
  • 파일경로 및 파일명은 따옴표로 묶어줘야 한다.
  • 불러온 파일 내용을 새로운 변수로 저장하여 사용하도록 한다.
hire <- read.csv("N:/study/myhuman.csv")
  • 즉, 이 스크립트가 표현하고자 하는 것은
  • N드라이브 하위 study폴더에 있는 myhuman.csv파일을 읽어들여서
  • 새로운 파일(데이터프레임)hire에 임시 할당하여 사용하라는 의미입니다.
  • 위 스크립트 내용은 RAM에 임시로 저장되는 내용으로서
  • Rstudio가 종료시에는 데이터 내용이 삭제되므로 save as명령을 사용하여 저장할 필요가 있음.
  •  

read.csv 옵션 사용방법

read.csv(
         file,                                           # 파일경로 및 파일명
         header = FALSE,                      # 파일의 첫행을 헤더로 처리할 것인지 여부
         na.strings="NA",                     # 데이터에 결측값 여부에 따라 NA에 대응시킬 값 지정
         stringsAsFactors = FALSE        # 문자열을 factor로의 저장 여부를 지정
)  
  • 실무자들이 다루고 있는 대다수의 파일들은 컬럼명이 붙어 있으므로 header=TRUE임
  • defalt로 설정된 값은 header=TRUE이므로 옵션을 생략해도 무방함.
  • 실무 데이터가 결측값이 있다해도 na.string=“NA”로 default로 설정되어 있으므로 생략해도 무방함
  • read.csv()함수의 잇점은 데이터가 문자열로 되어 있더라도 factor로 받아들여진다는 점이다.
  • 따라서 stringAsFactors의 옵션은 사용하지 않아도 무방하다.

  • 현업데이터를 불러올때 아무 걱정없이 read.csv(“파일경로/파일명.csv”)로 사용

Comments

Data Learning

상담 문의


010.9417.2025 hrd04@naver.com