벤포드 법칙: 세상에는 1로 시작하는 숫자가 제일 많다
세계은행 홈페이지에 가면 전 세계 264개 국가와 지역 국내총생산(GDP) 데이터를 내려받을 수 있습니다. 오늘(2020년 2월 27일) 기준으로 이 데이터에는 1960년부터 2018년까지 총 1만2092개 자료가 들어 있습니다. 이 1만2092개 자료에서 첫 자리 숫자만 가져 오면 자연수 1~9는 어떤 비율로 분포할까요? 첫 자리만 가져온다는 건 12092 가운데 맨 앞에 있는 1만 가져온다는 뜻입니다. 언뜻 생각하면 각 숫자가 11.1%(≒1/9)씩 분포할 것 같은 느낌이 듭니다. 그런데 정말 그렇다면 이 글을 쓰고 있지 않겠지요? 실제로 각 숫자가 첫 자리에 몇 번 나오는지 세어서 비율을 따져 보면 아래처럼 나옵니다. 이상합니다. 마치 일부러 짠 것처럼 1이 제일 많이 나오고 그 뒤로 갈수록 숫자가..