다변량 데이터 그리기
변수가 여러 개인 데이터셋을 시각적으로 전체적 경향을 쉽게 판단하는데 도움을 주는 작도법이 있다. 여기서는 pairs()과 stars() 두 가지만을 소개한다.
1. pairs()
pairs(수치행렬 혹은 데이터프레임)은 수치행렬이나 데이터프레임의 변량(열)들 사이의 산점도를 동시에 출력해 주는 다중 산점도 작도함수이다. 이 작도법은 변량들 사이의 관계를 한 번에 알 수한다는 점에서 유용하다. 이 함수는 plot()의 인수 main, pch, bg, cex 등을 인수로 사용할 수 있다.
예를 위해 iris 데이터셋을 이용하자. 이 자료는 150개(행)의 붓꽃 자료의 측정값으로 이루어져 있는데, 각 열에는
1열: Sepal.Length(꽃잎 길이)
2열: Sepal.Width(꽃잎 너비)
3열: Petal.Length(꽃받침 길이)
4열: Petal.Width(꽃받침 너비)
5열: 붓꽃 종류
setosa: 1행-50행
versicolor: 51행-100행
virginica: 101행- 150행
기본 옵션을 사용하여 1열부터 4열의 4개의 변수 Sepal.Length, Sepal.Width, Petal.Length, Petal.Width의 산점도를 동시에 그려보자.
> X=iris[, 1:4]
> pairs(X)
pairs()의 인수 panel을 이용하여 보다 다양한 다중 산점도를 그릴 수 있다.
2. stars()
stars(수치행렬 혹은 데이터프레임)은 각 관측치 별로 다변량 변수값의 크기를 별 모양으로 나타낸 그림이다. 이 그래픽은 관측치들을 다변량 변수 특징별로 분류할 때 유용한 시각적 정보를 제공한다..
iris 데이터 셋을 이용하여 stars()를 그려보자.
> X=iris[, 1:4]
> stars(X, key.loc=c(20,1))
은 별모양 범례표를 (20, 1)의 위치에 그려 넣으라는 옵션이다.
3.stars()
R에서 화면을 분할하여 작도하는 방법은 다양하지만 여기서는 split.screen() 함수를 이용하는 방법을 소개한다.
> windows()
> split.screen(c(2,2)) #화면을 2행 2열로 분할. 창 번호는 행우선.
> screen(1); plot(1:10) #1번 분할창에 플롯
> screen(2); plot(sin) #2번 분할창에 플롯
> screen(3); plot(log) #3번 분할창에 플롯
> screen(4); plot(exp) #4번 분할창에 플롯
> close.screen(all=TRUE) #분할 해제
‣ split.screen(c(n,m)) : 화면을 n행 m열로 분할한다.
‣ screen(i) : i번째 분할 창을 활성화 한다.
‣ split.screen(c(n,m), screen=i) : i번째 분할 화면을 다시 n행 m열로 분할한다.
‣ close.screen(all=TRUE): 창분할을 해제한다.
추천
기초 R 1
R 프로그램은 1995년 뉴질랜드의 Auckland 대학의 Robert Gentleman과 Ross Ihaka에 의해 개발되었다. 두 개발자의 이름의 머리글자를 이용하여 “R”로 명명된 것이다. R 프로그램은 배열 및 행렬로 표현된
dasoni1004.com
기초 R 4
자료 파일의 입출력 1. 데이터 프레임의 입출력 [1] write.table()과 read.table() 데이터프레임이나 행렬을 txt 파일로 저장할 수 있다. ① 데이터프레임의 파일 저장 우선 mydata라는 데이터프레임을 다음
dasoni1004.com
'study > Rstudio' 카테고리의 다른 글
R 시각화 - 6 ( persp()...) (0) | 2021.01.19 |
---|---|
R 시각화 - 5 (points()등) (0) | 2021.01.18 |
R 시각화 - 4 ( barplot(), hist(), pie() ) (0) | 2021.01.18 |
R 시각화 - 3(커브그래프) (0) | 2021.01.17 |
R 시각화 - 2(산점도 그래프) (0) | 2021.01.16 |