2015. 4. 15. 19:27
http://www.moneyweek.co.kr/news/mwView.php?no=2015041414328094112&code=w0606
재현 가능한 연구(reproducible research)
● 새로운 발견을 하기 위해서 사용한 데이터와 코드가 다시 사용 가능해야 한다.
● 독립적인 또 다른 연구자가 그 발견을 다시 만들 수 있어야 한다.
학교가 아니라 실무에서도 필요한 이유는?
● 재현 가능한 연구를 염두에 두고 작업을 시작하면 더 체계적인 작업이 가능하다.
● 동료들과의 의사 소통이 크게 개선된다.
● 변화가 쉬워진다.
재현 가능한 연구를 위한 도구
● R
● knitr, Rmardown
● Markup language: markdown, html, tex
● Rstudio: IDE(R + knitr + markdown)
● Cloud storage, versioning: Dropbox, github
● CLI 재현 가능한 연구를 위한 팁
● 작업의 모든 사항을 기록한다.
● 모든 기록은 텍스트 파일로 남긴다.
● 모든 파일은 사람이 읽을 수 있게 한다.
○ literate programming
● 파일 사이의 관계를 명확하게 밝힌다.
○ make links between files
● 파일을 구조화하고 저장, 공유하기 위한 계획을 세운다
그래서 github을 쓰라는 말이다!!
ㅊㄴㅁ
'Fast Camp_DA' 카테고리의 다른 글
Fast Campus: Data Analytics 16일차 (4/19) Part 2 (0) | 2015.04.19 |
---|---|
Fast Campus: Data Analytics 16일차 (4/19) (0) | 2015.04.19 |
Fast Campus: Data Analytics 15일차 (4/15) (0) | 2015.04.15 |
Fast Campus: Data Analytics 14일차 (4/12) (0) | 2015.04.15 |
Fast Campus: Data Analytics 5일차 (3/11) Part I (0) | 2015.03.11 |