본문 바로가기

R프로그래밍,통계학/R까기2

시각화,탐색적자료분석에 사용하는 4가지 메인 그래프와 특성 요약

반응형

시각화는 단순히 아름답게 보이는 목적을 넘어서 데이터의 특징을 찾아내는데 아주 효과적입니다.

시각화는 크게 나누어 

1)막대그래프, 2) Boxplot ,3)히스토그램, 4)산포도 로 나눠질 수 있습니다. 

 

1.막대그래프

-명목형변수에 대한 도수를 그래프로 나타내기에 좋음. (또는 이산형, 순서형)

 

2.히스토그램

-X축은 반드시 수치형 연속형 변수여야만 함

-도수를 그래프로 나타낸다는 점은 막대 그래프와 같습니다.

 

3.상자그래프(Box Plot)

-수치형 연속 변수만 나타낼 수 있는 그래프.

-아웃라이어, 분산정도, 중앙값 파악가능 -> 탐색적자료분석을 할때 반드시 필요한 그래프

 

4.산포도

-1~3 은 일변량 그래프. 산포도는 다변량 그래프.

-두 개 변수의 관계를 그래프로 나타냄.

 

 

ggplot 패키지를 이용하여 다음부터 하나하나씩 다뤄보도록하겠습니다. 

반응형