본문 바로가기

R프로그래밍,통계학/R까기2

클리블랜드 점 그리기(X축에 여러개의 명목형 변수가 쓰였을 때)

반응형

#R까기2의 예제 15를 참조하였습니다.

X축에 여러개의 명목형 변수가 쓰였을 때 사용하기 좋은 '클리블랜드 점 그리기' 입니다.

 

 

1. 데이터를 불러옵니다.

example_population_f.csv
0.02MB

library("dplyr")
library("ggplot2")
library("ggthemes")
DF <- read.csv("example_population_f.csv")
DF <- DF[,-1]
DF <- tbl_df(DF)
DF <- tibble::as_tibble(DF)


#as_tibble(DF) : 예전의 tbl_df() 와 같음 , 빠르고 쉽게 데이터프레임 객체를 다루기 위해 dplyr 객체 속성을 추가하기 위한 함수. dplyr를 사용하기전에 이 함수로 변환부터 하기.

 

 

 

2.남녀 비율을 명목형 변수로 바꿉니다.

DF2 <- mutate(DF,SexF= ifelse(SexRatio>1, "남자비율높음", ifelse(SexRatio ==1, "남녀비율같음", "여자비율높음")))

 

3.경기도 데이터만 DF3에 따로 저장합니다.

DF3 <- filter(DF2, Provinces=="경기도")

 

4.그래프를 그려봅니다.

Graph <- ggplot(DF3, aes(x=(SexRatio-1), y= reorder(City,SexRatio))) + geom_segment(aes(yend=City), xend=0,colour= "grey50") +geom_point(size=4, aes(colour=SexF)) + theme_minimal() ;Graph

 

 

#클리브랜드 그래프는 geom_segment()함수로 그립니다.

#geom_segment(aes(yend=City), xend=0,colour= "grey50") 에서

yend인자는 y축의 명목형 변수를 나타내고,

xend인자는 X축의 시작위치를 나타내며colour인자는 xend에서 값을 나타내는 위치까지의 선 컬러를 나타냅니다.

반응형