반응형
시각화는 단순히 아름답게 보이는 목적을 넘어서 데이터의 특징을 찾아내는데 아주 효과적입니다.
시각화는 크게 나누어
1)막대그래프, 2) Boxplot ,3)히스토그램, 4)산포도 로 나눠질 수 있습니다.
1.막대그래프
-명목형변수에 대한 도수를 그래프로 나타내기에 좋음. (또는 이산형, 순서형)
2.히스토그램
-X축은 반드시 수치형 연속형 변수여야만 함
-도수를 그래프로 나타낸다는 점은 막대 그래프와 같습니다.
3.상자그래프(Box Plot)
-수치형 연속 변수만 나타낼 수 있는 그래프.
-아웃라이어, 분산정도, 중앙값 파악가능 -> 탐색적자료분석을 할때 반드시 필요한 그래프
4.산포도
-1~3 은 일변량 그래프. 산포도는 다변량 그래프.
-두 개 변수의 관계를 그래프로 나타냄.
ggplot 패키지를 이용하여 다음부터 하나하나씩 다뤄보도록하겠습니다.
반응형
'R프로그래밍,통계학 > R까기2' 카테고리의 다른 글
클리블랜드 점 그리기(X축에 여러개의 명목형 변수가 쓰였을 때) (0) | 2020.09.06 |
---|---|
(명목변수별 다른명목변수 levels별 비율 표현)_reshape2 패키지의 melt()를 이용해 데이터를 가공 후 그래프로 나타내기 (0) | 2020.08.07 |
(명목형변수별로 수치를 나타낼때)_dplyr 패키지를 이용해 필요한 데이터를 만들고 그래프로 나타내기 (0) | 2020.08.02 |
ggplot2로 하는 정교한 시각화-막대그래프(geom_bar) (0) | 2020.08.01 |
ggplot2로 하는 정교한 시각화-산점도 (0) | 2020.07.29 |