plot함수를 활용한 산점도 그리기

Data Learning

plot함수를 활용한 산점도 그리기

HR분석 0 127 2019.02.06 03:56

Cinque Terre
 

산점도 그리기 plot함수 사용법


산점도(Scatter Plot)는 주어진 데이터를 점으로 표시해 시각화한 그래프이다. 
데이터의 실제 값들이 표시되므로 데이터의 분포를 한눈에 살펴보는데 유용하다.

 

 

1. plot()함수를 사용해 산점도 그리는 방법

plot : X - Y 에 도표를 그린다.
plot(
x, # X 좌표
y, # Y 좌표
option # 점(크기, 형태, 색상), 제목, 축(제목, 범위)등
)

 

 

2. 산점도 그리기 실습

실습 데이터 hire를 이용하여 컬럼에 대한 산점도를 그리기.
par(mfrow=c(1,2))
plot(hire$Sociability)
plot(sort(hire$Sociability))
par(mfrow=c(1,1))
01.png


  • 상기 왼쪽의 그림은 조건없이 산점도를 그린 형태이므로 인덱스 순에 의한 Y좌표값을 산점도로 시각화.
  • 오른쪽 그림은 사회성 지수에 대해 오름차순으로 정렬하여 Y좌표값을 산점도로 시각화.
  • plot()는 X축을 rownames로 하고, Y축은 Sociability값을 좌표로 한 그래프


 

3. 주요 그래프 옵션

그래프 옵션
의미
   xlab , ylab   X, Y축 이름
   main   그래프 제목
   pch   점의 종류
   cex   점의 크기
   col   색상
   xlim , ylim   X, Y축의 값 범위
   type   그래프 유형, 점(p), 선(l), 점과 선 모두(b)

 

 

3.1 축 이름(xlab, ylab) 옵션


plot(hire$Sociability,hire$Score,xlab="사회성 지수",ylab="면접점수")


20.1.plot02.png

 

  • 그래프 옵션에서 X축 이름 옵션은 xlab="사회성 지수"로 지정하게 되며, 문자열이므로 따옴표를 처리하여야 한다.
  • 마찬가지로 Y축 이름 옵션은 ylab="면접점수"로 지정한 후 실행한다.

 

 

3.2 그래프 제목(main) 옵션


plot(hire$Sociability,hire$Score,xlab="사회성 지수",ylab="면접점수",main="최종 채용 결과")


20.1.plot03_main.png

 

  • 그래프 옵션 함수는 main이며 사용법은 main="최종 채용 결과"와 같이 사용하며 제목은 문자열이므로 제목 양단에 따옴표로 처리한다.
  • 옵션은 필요에 따라 연계해서 사용 가능하며 구분자를 쉽표(,)로 처리한다.

 

 

3.3 점의 종류(pch) 옵션


par(mfrow=c(1,2))
plot(hire$Sociability,hire$Score,xlab="사회성 지수",ylab="면접점수",main="최종 채용 결과",pch=20)
plot(hire$Sociability,hire$Score,xlab="사회성 지수",ylab="면접점수",main="최종 채용 결과",pch="+")
par(mfrow=c(1,1))


20.1.plot04_pch.png

 

  • 왼쪽 그림은 점의 형태는 막힌 공간으로 처리한 옵션 20번을 사용한 그래프(19~25의 숫자로 사용 : R이 확장한 특수문자).
  • 오른쪽 그림은 점의 형태를 문자형태인 +를 사용한 결과 그래픽(문자열이므로 "+"로 사용, "X"로도 사용 가능함.

 

 

3.4 점의 크기(cex) 옵션


plot(hire$Sociability,hire$Score,xlab="사회성 지수",ylab="면접점수",main="최종 채용 결과",pch=20,
cex=2.0)


 

  • X, Y를 그리되 점의 크기를 나타내는 옵션함수는 cex이다.
  • cex의 기본값은 1이며,
  • cex가 작을수록 점의 크기가 비례하여 작아지고, 클수록 점의 크기가 cex에 비례해 커진다.

 

 

3.5 점의 색상(col) 옵션


par(mfrow=c(1,2))
plot(hire$Sociability,hire$Score,xlab="사회성 지수",ylab="면접점수",main="최종 채용 결과",pch=20,
cex=2,col="blue") plot(hire$Sociability,hire$Score,xlab="사회성 지수",ylab="면접점수",main="최종 채용 결과",pch=20,
cex=2,col=ifelse(hire$Group=="Good","red","blue")) par(mfrow=c(1,1))


 

  • X, Y를 그리되 색상 col은 색상이름 또는 RGB색상으로 지정한다.
  • 흰색인 경우 #ffffff, RGB(red, green, blue)에 대한 16진수로 색상 표현을 한다.
  • RGB를 사용해 색상을 지원할 경우 #RRGGBB로 RGB값을 기입한다.
  • 각 색상별 16진수값은 0~10,a~f를 사용한 16진수 값이다..
  • 오른쪽의 그래프는 색상에 대해 조건값을 부여하여 사용한 예시를 보여주고 있다.
  • 즉 Group가 Good이면 "red"로 표기하고 그 외에는 "blue"로 표기하라는 조건식에 따라 색상을 지정하라는 의미이다.

 

 

3.6 좌표축 값의 범위(xlim, ylim) 옵션


par(mfrow=c(1,2))
plot(hire$Sociability,hire$Score,xlab="학점",ylab="면접점수",main="최종 채용 결과",pch=20,
cex=2,col="blue") plot(hire$Sociability,hire$Score,xlab="학점",ylab="면접점수",main="최종 채용 결과",pch=20,
cex=2,col="blue",xlim=c(0,100),ylim=c(0,100) par(mfrow=c(1,1)


 

  • X, Y를 그리되 좌표축 값의 범위를 xlim, ylim으로 지정한다.
  • xlim, ylim의 값은 c(최소값 , 최대값) 형태로 지정한다.
  • 오른쪽의 그림은 최소값 0, 최대값 100을 기준으로 산점도를 그린 것이다.
  • 왼쪽의 그래프는 각 좌표축의 최소값 과 최대값의 기준으로 산점도를 그린 것이다.

 

 

3.7 그래프 유형(type) 옵션


par(mfrow=c(1,3))
plot(sort(hire$Sociability),hire$Score,xlab="사회성 지수",ylab="면접점수",main="최종 채용 결과",pch=20,
cex=2,type="l")
plot(sort(hire$Sociability),hire$Score,xlab="사회성 지수",ylab="면접점수",main="최종 채용 결과",pch=20,
cex=2,type="b")
plot(sort(hire$Sociability),hire$Score,xlab="사회성 지수",ylab="면접점수",main="최종 채용 결과",pch=20,
cex=2,type="o")
par(opar)


 

  • X, Y를 그리되 그래프의 유형을 type으로 지정한다.
  • type중 자주사용하는 형태로는 p(점), l(선), b(점과 선), o(점과 선 중첩)을 사용한다..
  • 그 중 b와 o는 헷갈리기 쉬운데
  • b는 점과 점을 선으로 있는데 점이 중심이 되어 선으로 연결하는 반면
  • o는 점과 점을 선으로 연결하는데 점의 중간을 통과하게 되므로 확연하게 차이가 난다.

 

 

, ,

Comments

Data Learning

상담 문의


010.9417.2025 hrd04@naver.com