'study/Rstudio' 카테고리의 글 목록
본문 바로가기
반응형

study/Rstudio12

R 시각화 - 7 다변량 데이터 그리기변수가 여러 개인 데이터셋을 시각적으로 전체적 경향을 쉽게 판단하는데 도움을 주는 작도법이 있다. 여기서는 pairs()과 stars() 두 가지만을 소개한다. 1. pairs()pairs(수치행렬 혹은 데이터프레임)은 수치행렬이나 데이터프레임의 변량(열)들 사이의 산점도를 동시에 출력해 주는 다중 산점도 작도함수이다. 이 작도법은 변량들 사이의 관계를 한 번에 알 수한다는 점에서 유용하다. 이 함수는 plot()의 인수 main, pch, bg, cex 등을 인수로 사용할 수 있다.  예를 위해 iris 데이터셋을 이용하자. 이 자료는 150개(행)의 붓꽃 자료의 측정값으로 이루어져 있는데, 각 열에는  1열: Sepal.Length(꽃잎 길이)2열: Sepal.Width(꽃잎 너비.. 2021. 1. 19.
R 시각화 - 6 ( persp()...) 3차원 그래픽 3차원 그래픽스로 고수준 그래픽스 함수인 persp()와 contour()의 사용법을 다룬다. persp()는 2차원 함수 를 그려주며, contour()는 의 등고선을 그려준다. 1. persp() persp()의 기본 사용형식은 persp(x, y, z) 여기서 x와 y는 x축과 y축을 표시하는 좌표 벡터이고, z는 함수 outer()에 의해 생성된 (x, y) 격자점에 대응한 f(x,y) 값을 나타낸다. 간단히 2변량 표준화 정규분포함수 를 그려보자. > x=y=seq(-4,4,by=0.1) #x, y 축의 구간 > f=function(x,y){1/(2*pi)* exp(-(x^2+y^2)/2)} #f(x,y) 정의 > z=outer(x,y,f) #(x, y) 격자점에 대응한 f(x,y.. 2021. 1. 19.
R 시각화 - 5 (points()등) 작도 함수들 함수 기능 points() 점 그리기 추가 lines() 선 그리기 추가 abline() 지정된 직선 그리기 추가 segment() 선분 그리기 추가 arrows() 화살표 그리기 추가 rect() 사각형 그리기 추가 text() 테두리 내 문자열 추가 mtext() 테두리 밖 문자열 추가 title() 제목과 부제목 추가 box() 테두리 꾸밈 axis() 좌표축 그리기 추가 polygon() 다각형 추가 legend() 범례표 추가 1. 함수 points() points()는 고수준의 함수 위에 점들을 추가한다. 또한 함수 plot()의 인수인 pch, col, cex lwd 등을 인수로 사용할 수 있다. 앞 절에서 그린 (체중, 신장)의 산점도에 다음 세 점을 추가하자. (55, 165.. 2021. 1. 18.
R 시각화 - 4 ( barplot(), hist(), pie() ) 함수 barplot()과 hist() 및 pie() 함수 barplot() 범주형 자료의 빈도를 막대그래프로 그려주며, hist()는 1차원 연속형 자료 빈도에 대해 히스토그램을 그려준다. [1] barplot() ▶ 높이 값들의 막대그래프 다음 표의 높이값의 막대 그래프를 그려보자. names A B C 높이값 10 8 5 > x=c(10, 8, 5) > names(x)=c('A','B','C') > barplot(x) ※ 자료에 names가 없으면 x-축의 좌표값을 넣지 않음을 유의하자. ▶ 1차원 도수분포표의 막대그래프 앞에서 제공한 예제에서 범주형 변수인 sex와 group의 도수분포표는 아래와 같다. sex M F 합계 빈도 6 4 10 group A B C 합계 빈도 5 3 2 10 이제 ta.. 2021. 1. 18.
R 시각화 - 3(커브그래프) 1차원 함수 그래프 그리기 함수 plot은 x의 함수 f(x)를 그리는 데에도 유용하게 이용될 수 있다. y=f(x)를 그리는데 두 가지 방식을 사용 • plot(x,y) : x 벡터와 y 벡터 이용 • plot(f, x의 하한, x의 상한) : 함수 이름 f와 x의 범위 이용 예를 들어 범위 내에서 함수 의 그림을 그려보자. 먼저, y 자료 벡터를 이용하면, > x=seq(-5,5,0.1) > y=x^2 -x +1 > windows(); plot(x,y, type='l') 다음은 함수명 f를 이용하면 > f=function(x){x^2-x+1} > windows(); plot(f, -5, 5) 같이 거의 같은 결과를 얻을 수 있다. ≪plot()과 curve()의 비교≫ 함수 를 그리기 위해 함수 pl.. 2021. 1. 17.
R 시각화 - 2(산점도 그래프) 1. 산점도 그리기 다음 표는 10명의 체중(weight)와 신장(height) 자료를 나타내고 있다. 이 자료를 1차원 산점도 표시 자료번호 1 2 3 4 5 6 7 8 9 10 체중(kg) 50 48 55 45 78 47 72 60 68 54 신장(cm) 170 168 178 162 186 157 183 166 174 160 성별 M M M F M F M M F M 그룹 A A A A A B B B B B > weight=c(50,48,55,45,78,47,72,60,68,54) > height=c(170,168,178,162,186,157,183,166,174,160) > sex=c('M','M','M','F','M','F','M','F','M','F') > group=c('A','A','A','A.. 2021. 1. 16.
R 시각화 - 1(시각화 함수) R 시각화 R의장점 • 간단한 명령으로 보기 좋은 그래프를 작성할 수 있다. • 그래프의 사용자화를 쉽게 수행할 수 있다. - 저수준 작도함수로 완성된 그래프에 도형이나 문자를 추가할 수 있다. - 전용 패키지를 이용하여 사용자화 할 수 있다. • 복잡한 그래프나 입체적인 그래프도 간단히 그릴 수 있다. • 다양한 종류의 이미지 파일로 저장할 수 있다. 기본관리와 주요 관련함수에 대해서만 소개합니다. 1. 그래픽 장치 관리 그래픽 함수의 결과는 객체로 생성되는 것이 아니라 그래픽 장치(device)로 전해져 표현된다. 이러한 그래픽 장치로는 그래픽을 그리는 창(windows)이나 그래픽 파일이 있다. 그래픽 함수가 수행된 후 그래픽 장치가 없을 때는 그래픽 창을 열고 그 위에 그래픽을 표현한다. ∙ 그래.. 2021. 1. 15.
기초 R 4 자료 파일의 입출력 1. 데이터 프레임의 입출력 [1] write.table()과 read.table() 데이터프레임이나 행렬을 txt 파일로 저장할 수 있다. ① 데이터프레임의 파일 저장 우선 mydata라는 데이터프레임을 다음과 같이 만들자. > id=c(1,2,3,4,5) > sex=c('남', '여', '남', '남', '여' ) > height=c(180, 160, 175, 170, 155) > weight=c(85, 50, 65, 70, 44) > mydata=data.frame(id, sex, height, weight) #데이터프레임 mydata 생성 > mydata id sex height weight 1 1 남 180 85 2 2 여 160 50 3 3 남 175 65 4 4 남 170.. 2021. 1. 14.
기초 R 3 6. 행렬 [1] 자료 벡터 이용하기 길이가 같은 벡터들을 쌓거나 이어 붙여서 행렬을 만든다. • cbind: 벡터들을 이어 붙여서 행렬을 만듦. • rbind: 벡터들을 아래로 쌓아서 행렬을 만듦. cbind() 함수를 이용 > c1=c(1,2,3) #길이 3인 벡터> c2=c(4,5,6) #길이 3인 벡터 > c3=c(7,8,9) #길이 3인 벡터 > mat1=cbind(c1,c2) #옆으로 이어 붙여서 행렬 생성 > mat1 c1 c2 [1,] 1 4 [2,] 2 5 [3,] 3 6 rbind() 함수를 이용 > mat2=rbind(c2,c3) #아래로 쌓아서 행렬 생성 > mat2 [,1] [,2] [,3] c2 4 5 6 c3 7 8 9 행렬의 몇 가지 속성들 • 자료의 유형: mode • 차원.. 2021. 1. 12.
기초 R 2 1.벡터(vector) 자료 [1] c() 함수 이용 R에서 기본적인 방법은 함수 “c()”를 이용하는 것이다. 이 함수의 괄호 내에 자료를 나열함으로써 자료를 생성 c(자료 나열) > x=c(1, 3, 0.5, 5) #수치 자료 벡터 > x [1] 1.0 3.0 0.5 5.0 > s=c('Kim', 'Lee', 'Park') #문자 자료 벡터 > s [1] "Kim" "Lee" "Park" 변수 x에는 수치 자료만, 변수 s에는 문자열 자료를 생성하여 할당 > x=c(1,3,0.5,5) > c(x, c(0,1)) [1] 1.0 3.0 0.5 5.0 0.0 1.0 > s=c(s, 'Choi', 'Lee') > s [1] "Kim" "Lee" "Park" "Choi" "Lee" 원소의 이름과 함께 입력하고.. 2021. 1. 2.
기초 R 1 R 프로그램은 1995년 뉴질랜드의 Auckland 대학의 Robert Gentleman과 Ross Ihaka에 의해 개발되었다. 두 개발자의 이름의 머리글자를 이용하여 “R”로 명명된 것이다. R 프로그램은 배열 및 행렬로 표현된 데이터에 대하여 효과적인 연산자를 이용해 자료 분석, 시뮬레이션 및 시각적 표현에 유용한 객체지향적 프로그래밍 언어 이라고 할 수 있다. R 프로그램은 1970년 중반에 AT&T 벨 연구소에서 개발된 S 언어를 기반으로 하고 있다. 현재 S 프로그램은 S-PLUS로 상업화되어 있으며 R 프로그램은 무료로 제공되고 있다. 따라서 R과 S는 엔진이나 모형식의 표현 등에서 약간의 차이가 있으나 근본적으로는 같은 소프트웨어이라 할 수 있다. R 프로그램은 공개 소프트웨어라는 점 이외.. 2021. 1. 1.
R Markdown기초 R MarkdownR 마크다운 문서는 완벽하게 재현 가능하며 PDF, 워드 파일, 슬라이드쇼 등을 포함한 수십 가지 출력 형식을 지원한다.  - 분석 코드보다는 분석 결과에 관심이 있을 의사결정권자와 의사소통을 위해- 분석 결론과 그 과정(즉, 코드)에 관심이 있는 다른분들과  협업을 위해     R 마크다운 기초R 마크다운 파일, 즉 확장자가 .Rmd 인 포맷이 없는 텍스트 파일이다.위 파일에는 세 가지 중요한 내용이 포함되어 있다.—으로 둘러싼 YAML 헤더 (선택항목).``` 으로 둘러싼 R 코드 청크 (코드묶음, Chunk).heading 및 _italic_과 같은 간단한 텍스트 서식과 텍스트.확장자 .Rmd 파일을 열면 코드와 출력이 번갈아 표시되는 인터페이스가 나온다. Run 아이콘을 클릭하거.. 2020. 12. 31.
반응형