최대한 친절하게 쓴 R로 데이터 더 빨리 처리하기(feat. data.table)
R에는 느리다는 비판이 따라다닙니다. 틀린 말도 아닙니다. R는 메모리에 데이터를 불러들여 작동하는 인메모리(in-memory) 방식이기 때문에 한 번에 다를 수 있는 행과 열 숫자가 적을 수밖에 없고, 그 때문에 속도에서 손해를 볼 수밖에 없습니다. R는 대신 누구나 기능을 추가할 수 있는 오픈 소스(open source) 프로그램이라 이런 단점을 극복하려는 시도도 계속 이어지고 있습니다. 그 대표 사례가 바로 이번 포스트에서 우리가 다룰 data.table입니다. 구글링을 잠깐만 해보셔도 이 패키지 속도를 칭찬하는 글이 인터넷에 얼마나 많은지 금방 아실 수 있을 겁니다. 이 포스트에서는 국제축구연맹(FIFA)에서 주관한 국가대표 축구 경기(A매치) 데이터를 가지고 1872년 이후 A매치에서 가장 많이..