#통계학 중 데이터로 배운 통계학#장·우오은쵸루#장·우오은쵸루 교수는 서울대#KMOOC강의 노트 R소개 R은 통계 계산에 적합한 프로그래밍 언어에서 MATLAB 같은 다른 과학 계산용 언어와 비교할 때 많은 장점이 있는 파이썬 등 프로그래밍 언어에 능숙한 학생들은 큰 탈 없이 배울 수 있는 다양한 무료 참고 문헌 제공:http://www.r-project.org/R에 관한 일반적인 소개는 뉴욕 타임스 기사를 참조 R에 관한 무료 한글 참고 문헌:서민구(2014)R을 이용한 데이터 실무 분석, https://cran.r-project.org/ 같은 운영, 본인 게임 같은 프로그램을 선택한다
RStudio란?R을 사용하기 위해 통합개발환경(IDE) 프로그램으로 무료버전 R Studio Desktop 다운로드 가능
RStudio를 설치할 RStudio를 설치한 후 RStudio 프로그램을 열어보면 다음과 같은 화면이 나타나는 RStudio의 화면은 여러 구획으로 구성된 콘솔:R 명령을 입력하고 결과 출력 환경:현재 세션에서 사용 가능한 각 객체를 보여주는 파일:디렉토리 파일을 보여준다
프로그램 설치가 어렵다면 프로그램 설치 없이 웹 기반으로 사용하고자 할 때 RStudio에서 운영하는 클라우드 기반 서비스 RStudio Cloud 사용 가능
R Package 설치 R의 가장 큰 장점 : 다양한 분석 기능을 가진 수많은 Package 제공 예시 : R Studio menu에서 Tools › Install Packages를 선택하고 대화상자를 사용하여 “ggplot2″라는 package 설치
한글을 읽으려면… R Studio에서 Tools › Global Options › Code › Saving을 선택하고 Defaulting text encoding을 UTF-8로 변경하여 Apply 버튼 클릭
분석 프로젝트 디렉토리 생성 모든 분석은 프로젝트별로 다른 디렉토리로 만들어 관리하는 것이 편리 File › New Project › New 디렉토리 › New Project 대화상자에서 프로젝트 – 디렉토리 이름 : lear-ning_from_data 상위 디렉토리 : browsing을 통해 적절한 디렉토리 선정
데이터 가져오기 The Art of Statistics에 사용된 모든 자료와 Rcode는 책의 Github 페이지에서 다운로드 가능 code라고 표시되어 있는 녹색 버튼을 클릭하고 “Download ZIP”를 클릭하면 전체 파일을 하나의 압축파일로 다운로드 가능
자료가 가져온 압축파일을 이전 프로젝트 디렉토리에서 풀면 “Art of Statistics-master”라는 sub-directory가 나오고 그 아래 05-1-sons-fathers-heights라는 subdirectory 아래 05-1-galton -x.csv를 클릭하면 “Import Datset..” 메뉴를 클릭하면 필요한 Rlibrary “readr”, “Rcpp” 설치 여부를 물어보면 창 아래 오른쪽 버튼을 오른쪽에 표시하면
Art of Statistics의 Github 페이지에 이 자료의 분석에 사용된 Rcode가 있다
Art of Statistics의 Github 페이지에 이 자료의 분석에 사용된 Rcode가 있다