최대한 친절하게 쓴 R 크롤러 만들기
살다 보면 가끔 인터넷에 있는 자료를 통째로 가져와서 데이터를 뽑아내고 싶다는 생각이 들 때가 있습니다. 이런 작업은 크롤링(crawling)이라고 부르기도 하고 (웹) 스크래이핑(scraping)이라고 부르기도 합니다. 전 세계에서 승객이 가장 많았던 공항 50군데를 시각화하면서 맛배기로 크롤링을 소개해 드렸던 적이 있습니다. 이번에는 한번 신문 기사를 긁어오는 과정을 알아보겠습니다. 이번에도 사용할 도구는 역시 R입니다. R 공식 홈페이지는 "R는 통계 계산과 그래픽에 활용하는 무료 소프트웨어 환경(R is a free software environment for statistical computing and graphics)"이라고 밝혀두고 있습니다. 러니 누구든 공짜로 이 프로그램을 사용할 수 있..