본문 바로가기

R프로그래밍,통계학/R까기2

(6)
클리블랜드 점 그리기(X축에 여러개의 명목형 변수가 쓰였을 때) #R까기2의 예제 15를 참조하였습니다. X축에 여러개의 명목형 변수가 쓰였을 때 사용하기 좋은 '클리블랜드 점 그리기' 입니다. 1. 데이터를 불러옵니다. library("dplyr") library("ggplot2") library("ggthemes") DF
(명목변수별 다른명목변수 levels별 비율 표현)_reshape2 패키지의 melt()를 이용해 데이터를 가공 후 그래프로 나타내기 #R까기 예제 14를 참고하였습니다. #명목형변수(지역)별로 다른명목변수(성별)의 비율을 막대그래프로 나타낼 때에 참고하면 좋은 예제입니다. library("dplyr") library("ggplot2") library("ggthemes") install.packages("reshape2") library("reshape2") DF
(명목형변수별로 수치를 나타낼때)_dplyr 패키지를 이용해 필요한 데이터를 만들고 그래프로 나타내기 #R까기2의 예제 13를 참고하였습니다. 명목형 변수(도수) 별로 수치(남녀비율)를 나타낼 때 참고 할 수 있는 예제입니다. Barplot을 이용하였습니다. 데이터를 불러오고 필요없는 열을 삭제해 줍니다. install.packages("dplyr") library("dplyr") library("ggplot2") library("ggthemes") DF
ggplot2로 하는 정교한 시각화-막대그래프(geom_bar) 막대그래프는 범주별 빈도수를 나타낼 때 주로 쓰입니다. 저번에는 산점도로 해보았는데 이번에는 막대그래프로 데이터를 시각화 해보겠습니다. 1. 범주별 빈도수 나타내기 DF
ggplot2로 하는 정교한 시각화-산점도 png("C:/DATA/residualPlot01.png",width = 2000, height = 1500) ggplot(data=diamonds, aes(x=carat, y=price, colour=clarity)) + geom_point() +theme_wsj() dev.off()​ g1+geom_point() +geom_line(size=1) +facet_grid(sex~.) install.packages("ggplot2") install.packages("ggthemes") library("ggplot2") library("ggthemes") ggplot(data=diamonds, aes(x=carat, y=price, colour=clarity)) + geom_point() +theme_wsj..
시각화,탐색적자료분석에 사용하는 4가지 메인 그래프와 특성 요약 시각화는 단순히 아름답게 보이는 목적을 넘어서 데이터의 특징을 찾아내는데 아주 효과적입니다. 시각화는 크게 나누어 1)막대그래프, 2) Boxplot ,3)히스토그램, 4)산포도 로 나눠질 수 있습니다. 1.막대그래프 -명목형변수에 대한 도수를 그래프로 나타내기에 좋음. (또는 이산형, 순서형) 2.히스토그램 -X축은 반드시 수치형 연속형 변수여야만 함 -도수를 그래프로 나타낸다는 점은 막대 그래프와 같습니다. 3.상자그래프(Box Plot) -수치형 연속 변수만 나타낼 수 있는 그래프. -아웃라이어, 분산정도, 중앙값 파악가능 -> 탐색적자료분석을 할때 반드시 필요한 그래프 4.산포도 -1~3 은 일변량 그래프. 산포도는 다변량 그래프. -두 개 변수의 관계를 그래프로 나타냄. ggplot 패키지를 이..