Base/R

[R] R 에서 사용되는 기본적인 시각화 그래프-2

반응형

 

#산점도

x축과 y축으로 이루어진 그래프에 두 변수의 값을 점으로 나타낸 그래프이다.

산점도를 이용하면 두 변수의 관계를 파악하는데 용이하다.

 

구문

plot( x , y) - 기본구문 

plot( x , y,
	xlab="naem1",
    ylab="name2")  # 이런식으로 그래프의 축에 lab을 할 수 있다.

 

# xlab, ylab

보통 구문은 plot( x, y ) 로 시작 되고 여기서는 xlab ,ylab으로 x 축 lab을 쓰고 y축 lab을 썼다,

 

 

#main - title

그래프의 이름을 적는다.

 

 

 

#pch - 점의종류

pch 를 통해 정의 모양을 바꿀수 있다.

 

 

 

 

 

# CEX - 점의 크기

찍히는 점의 크기를 조절한다

 

 

 

 

#점크기 (cex)

.8은 0.8이라는 뜻이다.

 

# xlim , ylim -좌표측의 범위

x축의 범위 y축의 범위를 지정한다.

 

 

 

 

#jitter - 노이즈 추가

지터Jitter는 데이터 값에 약간의 노이즈를 추가하는 방법을 말한다.

노이즈를 추가하면 데이터 값이 조금씩 움직여서 같은 값을 가지는

 데이터가 그래프에 여러 번 겹쳐서 표시되는 현상을 막아준다.

 

구문

plot( jitter(x) , jitter(y) )

 

 

 

 

 

#abline - 직선 긋기

- abline( )은 y = ax + b 형태의 직선이나 y=h 형태의 가로로 그은 직선 또는 x=v 형태의 세로로 그은 직선을 그래프에 그린다.

옵션 lty - 선 유형 / col - 선 컬러  

 

 

 

 

 

#선형 회귀

 선형 회귀는 종속 변수(또는 반응 변수)를 독립 변수(또는 설명 변수)에 의해 설명하는 모델을 다루는 회귀 분석(Regression Analysis)의 한 종류다.

구문

#lm(formula, data = ) 
#lm(종속변수 ~ 독립변수, data = )

lm(
  formula,  # 종속 변수 ~ 독립 변수 형태로 지정한 포뮬러
  data      # 포뮬러를 적용할 데이터. 보통 데이터 프레임
)

 

              dist와 speed 간의 관계 = coefficients

 

 

#points() - 점으로 찍기

points( )는 점을 그리는 함수다. plot( )을 연달아 호출하는 경우 매번 새로운 그래프가 그려지는 것과 달리 points( )는 이미 생성된 plot에 점을 추가로 그려준다.

 

 

 

#legend - 범례 표시

 

 

 

#boxplot - 상자수염그림

 

 

 

 

 

#boxplot  horizontal =T - 가로로 바꾸기

 

 

boxplot( formula)

formula, # y ~ grp의 형식으로 y는 분포를 그릴 값, grp는 값들을 그룹 짓는 변수다.

 

 

 

#hist 그램

 

 

 

 

 

 

 

반응형