#산점도
x축과 y축으로 이루어진 그래프에 두 변수의 값을 점으로 나타낸 그래프이다.
산점도를 이용하면 두 변수의 관계를 파악하는데 용이하다.
구문
plot( x , y) - 기본구문
plot( x , y,
xlab="naem1",
ylab="name2") # 이런식으로 그래프의 축에 lab을 할 수 있다.
# xlab, ylab
보통 구문은 plot( x, y ) 로 시작 되고 여기서는 xlab ,ylab으로 x 축 lab을 쓰고 y축 lab을 썼다,
#main - title
그래프의 이름을 적는다.
#pch - 점의종류
pch 를 통해 정의 모양을 바꿀수 있다.
# CEX - 점의 크기
찍히는 점의 크기를 조절한다
#점크기 (cex)
.8은 0.8이라는 뜻이다.
# xlim , ylim -좌표측의 범위
x축의 범위 y축의 범위를 지정한다.
#jitter - 노이즈 추가
지터Jitter는 데이터 값에 약간의 노이즈를 추가하는 방법을 말한다.
노이즈를 추가하면 데이터 값이 조금씩 움직여서 같은 값을 가지는
데이터가 그래프에 여러 번 겹쳐서 표시되는 현상을 막아준다.
구문
plot( jitter(x) , jitter(y) )
#abline - 직선 긋기
- abline( )은 y = ax + b 형태의 직선이나 y=h 형태의 가로로 그은 직선 또는 x=v 형태의 세로로 그은 직선을 그래프에 그린다.
옵션 lty - 선 유형 / col - 선 컬러
#선형 회귀
선형 회귀는 종속 변수(또는 반응 변수)를 독립 변수(또는 설명 변수)에 의해 설명하는 모델을 다루는 회귀 분석(Regression Analysis)의 한 종류다.
구문
#lm(formula, data = )
#lm(종속변수 ~ 독립변수, data = )
lm(
formula, # 종속 변수 ~ 독립 변수 형태로 지정한 포뮬러
data # 포뮬러를 적용할 데이터. 보통 데이터 프레임
)
dist와 speed 간의 관계 = coefficients
#points() - 점으로 찍기
points( )는 점을 그리는 함수다. plot( )을 연달아 호출하는 경우 매번 새로운 그래프가 그려지는 것과 달리 points( )는 이미 생성된 plot에 점을 추가로 그려준다.
#legend - 범례 표시
#boxplot - 상자수염그림
#boxplot horizontal =T - 가로로 바꾸기
boxplot( formula)
formula, # y ~ grp의 형식으로 y는 분포를 그릴 값, grp는 값들을 그룹 짓는 변수다.
#hist 그램
'Base > R' 카테고리의 다른 글
[R] R 을 활용한 데이터 탐색(Exploratory Data Analysis) (0) | 2020.07.30 |
---|---|
[R] R ggplot 사용법 (데이터 시각화 도구) (0) | 2020.07.28 |
[R] R 에서 사용되는 기본적인 시각화 그래프 (0) | 2020.07.28 |
[R] R 데이터 가공을 위한 기본적인 함수 (0) | 2020.07.27 |
[R] R 사용자 정의 함수(FUNCTION)와 데이터 전처리를 위한 기본적인 함수 (0) | 2020.07.25 |