데이터 프레임의 열이름 바꾸기

Data Learning

데이터 프레임의 열이름 바꾸기

분석작업의 용이,편리성을 위한 컬럼명 변경하기

?

컬럼명을 자유자재로 변경(긴것을 짧게, 알 수 있도록)


1. 컬럼명 확인하기

캐글등 영문 데이터의 컬럼명들이 대문자와 소문자가 혼재되어 있는 경우가 많다.
하나의 합성어로서 ’SatisfactionLevel’와 같은 경우인데
이것은 ’Satisfaction Level’이라는 표현으로서 단어사이 띄어쓰기가 원래 사용되어야 하지만
R에서는 띄어쓰기를 허용하지 않는다. 그래서 붙여쓰기하면서 공란뒤의 글자는 대문자로 바꿔서 입력하는 경우가 발생한다.
데이터를 읽어 왔다면 먼저 하여야 하는 것이 데이터 컬럼명이 어떻게 되어 있는가를 확인하여야 한다.

hire <- read.csv("N:/study/myhuman.csv")
names(hire)
## [1] "Sociability" "Rating"      "Career"      "Score"       "Group"
  • 다행히 붙여쓰기한 컬럼명은 없다.
  • 하지만 첫글자가 대문자인데 컬럼을 불러오고 가공하기 위해서는 소문자를 변경하는 것이 훨씬 작업이 용이하다.

2. 개별 컬럼명 변경하기

names(hire)[1] <- "sociability"
names(hire)[1]
## [1] "sociability"
  • [n]은 n번째 컬럼명을 의미하다.
  • 첫번째 컬럼명을 sociability라는 단어를 입력하라는 의미이다.
  • 문자열을 입력 받기 위해서는 “따옴표”로 표기하여야 한다.
  • 두번째 컬럼명은 names(hire)[2] <- “rating”로 변경이 가능하다.

3. 전체 또는 다수의 컬럼명을 변경하기

names(hire) <- c("sociability","rating","career","score","hire")
names(hire)
## [1] "sociability" "rating"      "career"      "score"       "hire"
  • 컬럼명을 하나하나씩 바꾸기보다 전체를 대상으로 변경하는 것이 필요할때도 있다.
  • 그럴때에는 combine의 약자인 c()로 묶어서 변경이 가능하다.
  • 하지만 컬럼명이 순차적으로 빠짐없이 입력하여야 한다.

4. colnames를 사용하여도 무방하다

colnames(hire)
## [1] "sociability" "rating"      "career"      "score"       "hire"
  • 때론 행이름(row names)에 해당하는 항목이 들어가 있는 경우가 있다.
  • 그럴경우 rownames()함수를 사용하여 확인이 가능하다
 

Comments

Data Learning

상담 문의


010.9417.2025 hrd04@naver.com