반응형
#R까기2의 예제 15를 참조하였습니다.
X축에 여러개의 명목형 변수가 쓰였을 때 사용하기 좋은 '클리블랜드 점 그리기' 입니다.
1. 데이터를 불러옵니다.
library("dplyr")
library("ggplot2")
library("ggthemes")
DF <- read.csv("example_population_f.csv")
DF <- DF[,-1]
DF <- tbl_df(DF)
DF <- tibble::as_tibble(DF)
#as_tibble(DF) : 예전의 tbl_df() 와 같음 , 빠르고 쉽게 데이터프레임 객체를 다루기 위해 dplyr 객체 속성을 추가하기 위한 함수. dplyr를 사용하기전에 이 함수로 변환부터 하기.
2.남녀 비율을 명목형 변수로 바꿉니다.
DF2 <- mutate(DF,SexF= ifelse(SexRatio>1, "남자비율높음", ifelse(SexRatio ==1, "남녀비율같음", "여자비율높음")))
3.경기도 데이터만 DF3에 따로 저장합니다.
DF3 <- filter(DF2, Provinces=="경기도")
4.그래프를 그려봅니다.
Graph <- ggplot(DF3, aes(x=(SexRatio-1), y= reorder(City,SexRatio))) + geom_segment(aes(yend=City), xend=0,colour= "grey50") +geom_point(size=4, aes(colour=SexF)) + theme_minimal() ;Graph
#클리브랜드 그래프는 geom_segment()함수로 그립니다.
#geom_segment(aes(yend=City), xend=0,colour= "grey50") 에서
yend인자는 y축의 명목형 변수를 나타내고,
xend인자는 X축의 시작위치를 나타내며colour인자는 xend에서 값을 나타내는 위치까지의 선 컬러를 나타냅니다.
반응형
'R프로그래밍,통계학 > R까기2' 카테고리의 다른 글
(명목변수별 다른명목변수 levels별 비율 표현)_reshape2 패키지의 melt()를 이용해 데이터를 가공 후 그래프로 나타내기 (0) | 2020.08.07 |
---|---|
(명목형변수별로 수치를 나타낼때)_dplyr 패키지를 이용해 필요한 데이터를 만들고 그래프로 나타내기 (0) | 2020.08.02 |
ggplot2로 하는 정교한 시각화-막대그래프(geom_bar) (0) | 2020.08.01 |
ggplot2로 하는 정교한 시각화-산점도 (0) | 2020.07.29 |
시각화,탐색적자료분석에 사용하는 4가지 메인 그래프와 특성 요약 (0) | 2020.07.29 |