R에서 지저분한 데이터 청소하기(feat. janitor)
현직자 인터뷰와 전문가 추산에 따르면 데이터 과학자는 전체 작업 시간 가운데 50~80%를 멋대로 생긴 데이터를 수집하고 준비하는 재미없는 일에 쓴다. ─ 뉴욕타임스 "For Big-Data Scientists, ‘Janitor Work’ Is Key Hurdle to Insight" 맞습니다. 세상에 괜히 '데이터 노가다(土方)'라는 표현이 존재하는 게 아닙니다. 그래서 세상에는 거꾸로 이 노가다를 조금이라도 덜 수고스럽게 만들어주는 도구도 존재합니다. 예컨대 tidyverse 패키지에 들어 있는 tidyr는 데이터를 롱 폼에서 와이드 폼 또는 그 반대로 '깔끔하게' 바꿀 수 있도록 도와줍니다. 그런데 사실 데이터 구조 변경마저도 너무 거창합니다. 실제로 데이터를 하다 보면 아주 사소하지만 번거롭고 귀..