R Markdown
R 마크다운 문서는 완벽하게 재현 가능하며 PDF, 워드 파일, 슬라이드쇼 등을 포함한 수십 가지 출력 형식을 지원한다.
- 분석 코드보다는 분석 결과에 관심이 있을 의사결정권자와 의사소통을 위해
- 분석 결론과 그 과정(즉, 코드)에 관심이 있는 다른분들과 협업을 위해
R 마크다운 기초
R 마크다운 파일, 즉 확장자가 .Rmd 인 포맷이 없는 텍스트 파일이다.
위 파일에는 세 가지 중요한 내용이 포함되어 있다.
- —으로 둘러싼 YAML 헤더 (선택항목).
- ``` 으로 둘러싼 R 코드 청크 (코드묶음, Chunk).
- heading 및 _italic_과 같은 간단한 텍스트 서식과 텍스트.
확장자 .Rmd 파일을 열면 코드와 출력이 번갈아 표시되는 인터페이스가 나온다. Run 아이콘을 클릭하거나 Cmd/Ctrl+Shift+Enter를 눌러 각 코드 청크를 실행할 수 있다. RStudio에서 코드가 실행되고, 실행결과가 코드와 함께 표시됩니다.
텍스트, 코드와 실행결과 모두가 포함된 최종 보서를 작성
- ’Knit’을 클릭하거나 Cmd/Ctrl-Shift-K를 입력
- rmarkdown::render(“1-example.Rmd”)으로 프로그램화
뷰어 창에 보고서가 나타나고, 다른 사용자와 공유할 수 있는 HTML 파일이 만들어진다.
문서를 니트(knit) 하면 R마크다운은 .Rmd 파일을 knitr, 로 보내고 knitr는 모든 코드 청크를 실행하고 코드와 그 출력을 포함하는 새로운 마크다운 문서(.md)를 생성
생성된 마크다운 파일은 이후 pandoc이 처리하는데, pandoc은 완성 파일을 생성하는 역할을 한다. 이와 같이 작업이 두 단계로 나누어져서, 다양한 출력 형식을 만들 수 있다는 장점이 있다.
마크다운으로 텍스트 서식 저장하기
일반 텍스트 파일의 형식을 지정하기 위한 간단한 규칙이다
코드 청크
R마크다운 문서에서 코드를 실행하려면 청크를 삽입해야 한다. 세 가지 방법이 있다.
- 키보드 단축키 Cmd/Ctrl+Alt+I
- 편집기 툴바의 ’Insert’ 버튼 아이콘
- 청크 구분 기호 {r} 과 를 수동으로 타이핑
- 단축키를 외울 것을 추천한다. (시간을 절약!!)
청크 이름
다음과 같이 청크에 옵션으로 이름을 줄 수 있다. ```{r 청크이름}. 청크 이름을 사용하는 것은 세 가지 이점이 있다.
- 스크립트 편집기의 왼쪽 하단에 있는 드롭 다운 코드 탐색기를 사용하여 특정 청크로 쉽게 옮겨갈 수 있다.
동작을 하게 하는 청크 이름이 하나 있는데 바로 setup이다. 그리고 setup 이름을 가진 청크는 다른 코드가 실행되기 전에 자동으로 한 번 실행된다.
청크 옵션
코드 청크를사용하는 옵션이 60개나 있다. 자주 사용되는 중요한 청크 옵션들에 알려드릴게요.
코드 블록의 실행 여부와 완성된 보고서에 삽입되는 결과 선택을 제어하는 옵션들이 가장 중요하다.
- eval = FALSE를 하면 코드가 실행(evaluate)되는 것이 방지된다(물론 코드가 실행되지 않으면 결과도 생성되지 않는다). 이것은 예제 코드를 표시하거나, 각 행마다 주석 처리하지 않고 큰 코드 블록을 비활성화하는 데 유용하다.
- include = FALSE 를 하면 코드는 실행하지만 코드나 결과가 최종 문서에 표시되지 않는다. 설정 코드에 이를 사용하면 보고서가 복잡해지지 않는다.
- echo = FALSE를 사용하면 완성된 파일에 코드는 보이지 않지만, 결과는 보인다. R코드를 보고 싶지 않은 사람들을 대상으로 한 보고서를 작성할 때 이것을 사용하라.
- message = FALSE 또는warning = FALSE를 하면 메시지나 경고가 완성된 파일에 나타나지 않는다.
- results = ’hide’를 하면 출력이 보이지 않고, fig.show = ’hide’를 하면 플롯이 보이지 않는다.
- error = TRUE를 하면 코드가 오류를 반환하더라도 렌더링이 계속된다. 보고서의 최종 버전에 이것이 포함되는 경우는 거의 없겠지만 .Rmd 내에서 수행되는 작업을 정확하게 디버깅해야 하는 경우 매우 유용할 수 있다. R을 교육하거나 의도적으로 오류를 포함하려는 경우에도 유용하다. 기본값인 error = FALSE에서는 문서에 오류가 하나라도 있으면 니트가 성공적으로 작동하지 않는다.
전체 목록은 http://yihui.name/knitr/options/에서 볼 수 있습니다.
출처 : R을 할용한 데이터 과학
추천
기초 R 1
R 프로그램은 1995년 뉴질랜드의 Auckland 대학의 Robert Gentleman과 Ross Ihaka에 의해 개발되었다. 두 개발자의 이름의 머리글자를 이용하여 “R”로 명명된 것이다. R 프로그램은 배열 및 행렬로 표현된
dasoni1004.com
R 시각화 - 2(산점도 그래프)
1. 산점도 그리기 다음 표는 10명의 체중(weight)와 신장(height) 자료를 나타내고 있다. 이 자료를 1차원 산점도 표시 자료번호 1 2 3 4 5 6 7 8 9 10 체중(kg) 50 48 55 45 78 47 72 60 68 54 신장(cm) 170 168..
dasoni1004.com