최대한 친절하게 쓴 R로 데이터 깔끔하게 만들기(feat. tidyr)
데이터 분석가들은 흔히 데이터를 정제하고 준비하는 데 전체 분석 시간 중 80%를 쓴다고 말한다(It is often said that 80% of data analysis is spent on the cleaning and preparing data). tidyr 패키지 설명서는 이 문장으로 시작합니다. 거꾸로 이야기하면 현실에 존재하는 많은 데이터가 그만큼 컴퓨터로 처리하기 불편한 형태로 존재한다는 뜻입니다. 이런 데이터를 깔끔하게 정리하도록 도와주는 R 패키지가 바로 tidyr입니다. R 초보자 분께는 바로 이 한 단락에도 참 어려운 낱말이 많이 들어 있습니다. 사실 R라는 이름부터 그렇습니다. tidyr라는 검색어를 인터넷 포털 사이트에 쳐서 들어오신 분이라면 물론 R가 뭔지 모르시지 않을 겁니다..