국내정치

빅데이터는 알고 있다… 광화문집회가 서초동의 4배

Shawn Chase 2019. 10. 13. 14:26


조선일보 



입력 2019.10.12 03:00

[아무튼, 주말]
휴대전화로 집회 인구 추산

빅데이터는 알고 있다… 광화문집회가 서초동의 4배
일러스트= 안병현
200만명이냐, 5만명이냐. 숫자가 정치 문제가 됐다. 이번에도 조국 법무부 장관이 발단이다. 지난달 28일 서울 서초동에서 열린 '조국 수호 검찰개혁 촛불문화제'(촛불 집회)의 주최 측은 200만명이 참가했다고 주장했고, 더불어민주당도 이를 그대로 받아들였다. 자유한국당은 "집회 장소 면적을 보면 많아야 5만명"이라고 반박했다. 지난 3일 열린 '조국 퇴진 범보수 집회'(태극기 집회) 측도 "촛불 집회가 200만명이면 우린 300만명"이라고 꼬집었다. 양측 다 머릿수로 상대를 압도하겠단 속셈이다.

집회 인원을 두고 진영 간에 큰 격차가 나는 건 신뢰할 만한 집계 방식이 없기 때문이다. 통상 집회 주최 측은 연인원(延人員·드나든 사람 숫자)을 기준으로 참가자를 추산한다고 주장한다. 하지만 어느 주최 측도 정확한 방법을 공개한 적은 없다. 이 때문에 연인원 계산법은 주최 측 구미대로 집회 크기를 부풀리는 수단일 뿐이란 비판이 많았다. 그나마 믿을 만한 계산법은 경찰이 쓰는 '페르미 추정법'이다. 단위 면적당 서 있을 수 있는 사람 숫자(1㎡당 9명)를 전체 집회 면적에 곱해서 추정하는 방법이다. 하지만 집회 면적이 넓어지면 면적당 인구 밀도도 불규칙해진다. 이 방법은 구경꾼과 참가자도 구분하지 못한다. 그래서 대규모 집회엔 페르미 추정법을 쓰는 게 적절치 않다는 지적도 끊이지 않는다.

최근 데이터 전문가들 사이에서 각광받는 집회 규모 추산법은 휴대전화 접속 기록을 이용한 방법이다. 한국의 휴대전화 보급률은 100%(만 10세 이하 제외)이다. 그러니 특정 지역 기지국에 접속된 휴대전화 숫자를 집계하면 정확한 집회 참가 인원을 추산할 수 있단 가설에 기반한 방법이다. '아무튼, 주말'은 이 방법으로 논란이 된 촛불 집회와 태극기 집회 규모를 추산해봤다. 관련 데이터가 집계일로부터 5일 뒤에 공개되기 때문에 9월 28일과 10월 3·5일 집회 규모만 조사할 수 있었다.

지난달 28일 서울 서초동에서 열린 촛불집회(왼쪽 사진)와 지난 3일 서울 광화문 일대에서 열린 태극기 집회 현장. 빅데이터를 이용해 규모를 비교해보니 광화문 집회가 서초동 집회보다 4배가량 컸다.조선일보 DB
지난달 28일 서울 서초동에서 열린 촛불집회(왼쪽 사진)와 지난 3일 서울 광화문 일대에서 열린 태극기 집회 현장. 빅데이터를 이용해 규모를 비교해보니 광화문 집회가 서초동 집회보다 4배가량 컸다. /조선일보 DB
휴대전화 기록 보니… 태극기 집회가 촛불 집회보다 4배 규모

서울시에선 휴대전화 기록을 바탕으로 매일·매시간 서울 각 지역에 얼마나 많은 사람이 있었는지 데이터를 수집해 일반에 공개하고 있다. 이른바 '생활인구' 데이터다. 이를 활용해 촛불 집회와 태극기 집회 참가 인원을 추산해볼 수 있었다. 추산은 두 단계로 이뤄졌다. 먼저, 촛불 집회와 태극기 집회가 열린 일시에 그 집회가 열린 지역에 있었던 사람 숫자를 파악한다. 그리고 집회가 열리지 않았을 때 해당 지역에 있던 사람들, 즉 '배경인구(상주인구+유동인구)'를 파악해 전자에서 후자를 빼면 된다.

지난달 28일 촛불 집회의 경우 서초동 일대 집회가 열린 지역에서 가장 사람이 많았던 시점은 오후 7~8시 사이였다. 생활인구 데이터에 집계된 인원은 10만6340명. 여기서 '배경인구'를 빼야 하는데, 중요한 건 촛불 집회가 있던 날 서리풀축제도 열렸단 점이다. 그렇기 때문에 서리풀축제가 열리면서 토요일이란 조건이 충족되는 날인 9월 21일의 서초동 생활인구를 찾아야 한다. 9월 21일 오후 7시 서초동 일대 생활인구는 2만9487명이었다. 따라서 28일 서초동에 모인 사람들은 평소보다 7만6853명가량 많았고, 이 인원이 촛불 집회에 온 사람들이라고 추론할 수 있다. 1주일 뒤인 지난 5일 같은 장소에서 열린 촛불 집회 참가 인원도 이 방식을 적용해보니 10만6462명이란 결과가 나왔다.

지난 3일 태극기 집회도 같은 방법으로 추산해봤다. 3일 광화문·시청 일대에 모인 사람들이 가장 많았던 건 오후 2~3시 사이였고 총 40만371명이 집계됐다. 여기서 광화문·시청 일대의 배경인구를 빼야 하는데, 주의할 점은 지난 2년간 거의 매주 토요일이나 공휴일마다 이 지역에서 태극기 집회가 열렸단 점이다. 따라서 일요일에 광화문·시청 일대에 모인 사람들의 숫자가 실제 이 지역 배경인구일 가능성이 높다. 10월 3일과 가장 가까운 휴일이었던 9월 29일 일요일 오후 2시 광화문·시청 일대에 모인 사람들은 7만8041명. 전자에서 후자를 빼면 태극기 집회에 온 사람들은 32만2330명이다. 집회가 최고조에 이른 시점에서 규모를 비교해보면 태극기 집회 참가자가 촛불 집회의 4배 이상이었다고 볼 수 있다. 또한 이는 2016년 12월 3일 제6차 박근혜 전 대통령 탄핵 촛불 집회 참가 인원(경찰 추산치 기준)이 가장 많았을 때와 비슷하다.

휴대전화 접속 데이터를 통해 연령대별로 집회에 얼마나 왔는지도 파악할 수 있다. 9월 28일 서초동 촛불 집회의 경우엔 40~50대가 전체의 56.3%로 가장 많았고, 20~30대는 19%였다. 1주일 뒤 열린 촛불 집회 구성비도 비슷했다. 10월 3일 광화문 태극기 집회는 60대 이상의 참가 비율이 75.9%로 압도적이었다. 그 뒤를 이어 40~50대 비중이 19.8%, 20~30대는 3.6%였다. 두 집회 모두 10대의 비중은 10% 미만으로 적었다.

물론 이 방법이 100% 정확한 건 아니다. 하지만 다른 방법들에 비해 그 근거가 명확하고, 골목 등 사각지대에 있는 사람들까지 비교적 정확하게 파악해 대강의 집회 규모를 파악할 수 있단 장점이 있다. 또 각기 다른 집회에 같은 방식을 적용하기 때문에 집회의 절대 규모뿐 아니라 상대 규모도 비교 가능하다. 이 방법도 집회에 드나든 연인원을 파악하지 못하는 건 마찬가지다. 하지만 보통 집회는 규모가 절정에 이를 때까진 유입 인구가 대부분이고, 정점을 찍은 뒤엔 사람들이 급격히 빠져나가는 경향이 일반적이다. 경찰청 고위 관계자는 "대규모 집회에서 메인 이벤트나 거리 행진이 시작되기 전에 빠져나간 사람이라면 참가자라기보단 구경꾼에 가까울 테니 집계에 넣을 필요가 없을 것"이라고 말했다.

태극기 집회 對 촛불 집회, 어디에 더 많이 왔나
집회 참가자 세려고 인공지능까지 동원

집회 규모가 곧 여론의 크기는 아니다. 하지만 집권 세력이든 반대 세력이든 집회 규모를 지렛대로 삼는다. 그렇기 때문에 대규모 집회 정국이 열릴 때마다 인원 추산은 첨예한 정치 문제가 됐다. 2016년 촛불 집회를 둘러싼 참가 인원 논란이 그 절정이었다. 집회 참가 인원을 정확히 계산하기 위해 온갖 방법이 나왔다. 집회 장소 인근 지하철 하차 인원수를 세거나, 근처 카페나 가게의 와이파이 중계기에 접속한 휴대전화 숫자를 바탕으로 한 추산치도 나왔다. 인공지능(AI)을 이용해 집회 사진에 찍힌 촛불 숫자를 세어서 집회 참가자를 계산할 수 있단 주장도 등장했다. 이때 여러 수치가 등장했지만 공식적으로 가장 많이 인용된 수치는 결국 경찰 추산치였다. 당시 경찰 지휘 라인에 있었던 전직 고위 간부는 "그땐 청와대가 사실상 마비 상태였는데도 집회가 열릴 때마다 (경찰 지휘부에) 실시간으로 참가 인원 추산치를 집계해 보고하라고 압박했다"며 "결국 국회에서 대통령 탄핵소추안이 통과된 것도 촛불 집회 규모를 보고 놀란 새누리당(현 자유한국당) 의원들이 (탄핵 동참으로) 돌아선 덕분 아니냐"고 말했다.

경찰이 집회 규모 추산치 공표를 그만둔 것도 이때부터다. 참가자가 급격하게 불어난 3차 촛불 집회 때부터 주최 측과 경찰 간에 추산치 차이가 커졌다. 규모가 가장 컸던 6차 집회에서 주최 측은 서울 도심에 170만명이 모였다고 발표했지만, 경찰은 32만명이라고 밝혔다. 주최 측은 연인원, 경찰은 일시점 최대 인원을 말한 것이었지만, 주최 측을 비롯한 진보 진영에선 경찰이 의도적으로 집회 규모를 축소한다고 거세게 비판했다. 하지만 주최 측도 정확한 인원 집계 방식을 밝히진 않았다. 결국 경찰은 비판 여론에 밀려 추산치를 비공개하기로 결정했고 이번에도 추산치를 공표하지 않고 있다. 이 때문에 공신력 있는 기관이나 주체가 발표하는 집회 규모 추산치 자체가 없어졌다. 그러다보니 집회 규모가 조금만 커져도 주최 측에서 100만명이 참가했다고 공표해 버리는 일이 일상다반사가 됐다. 동국대 경찰행정학과 곽대경 교수는 "대규모 집회 참가 인원은 역사적 기록이기도 하기 때문에 주최 측이 터무니없는 수치를 부르면 자칫 역사 왜곡이 될 위험도 크다"며 "경찰이 반드시 집회 추산치를 공개할 이유는 없지만 해외에서도 주최 측과 경찰 추산치 간에 차이가 클 경우 경찰이 정확한 정보 제공 차원에서 추산치를 발표하는 사례도 참고할 필요가 있다"고 말했다.

: 서울시 생활인구

서울시가 KT와 협업해 매일·매시간 서울 전 지역별로 사람이 얼마나 있었는지 집계한 데이터. 해당 일시에 각 지역 KT 기지국에 접속된 휴대전화 숫자에 KT·SKT·LG유플러스 시장점유율, 휴대전화를 켜두는 사람 비율 등 여러 변수를 감안해 보정한 수치다. 통상 매시간 집계 인원이 수천~수만 명에 이르기 때문에 ‘큰 수의 법칙’에 따라 특정 일시·특정 장소에 있는 사람 숫자를 가장 정확하게 파악할 수 있는 기법 중 하나로 꼽힌다.

: 휴대전화로 집회 참가 인원 어떻게 추산하나

1 집회가 열린 날 해당 장소 일대에 모인 사람 숫자 집계(휴대전화 접속 기록)
2 같은 장소에서 집회가 열리지 않았던 날 모인 사람 숫자 집계
3 ①에서 ②를 빼면 집회 참가 인원 추산 가능

美는 드론 이용 집계… 日은 경찰이 미리 답사해 추정

다른 나라는 어떻게 추산하나


과거 대규모 집회가 열릴 때마다 주최 측과 경찰 추산치 간에 차이가 컸던 이유는 양측의 집계 기준점이 다르기 때문이다. 주최 측은 연인원을 기준으로 하고 경찰은 일시점 최대 인원을 기준으로 잡아 집회 규모를 추산한다. 경찰은 집회 안전 관리를 위해 현장에 경찰력을 얼마나 동원할지 판단해야 한다. 그래서 실시간으로 사람이 얼마나 있는지 파악해 그 규모에 맞춰 대응하기 위한 목적에서 집회 규모를 추산한다. 경찰청 관계자는 “사실 경찰이 연인원까지 고려해 집회에 사람이 얼마나 왔는지 정확히 파악할 필요가 없고 그럴 능력도 없다”며 “현장 경비 목적에서 집계하는 수치가 마치 집회 규모를 결정짓는 공식적 ‘팩트’인 것처럼 비치는 건 경찰 조직 입장에서도 부담이 크다”고 말했다.

최근 반정부 시위가 커지고있는 홍콩에서도 집회 참가인원이 항상 논란거리다.
최근 반정부 시위가 커지고있는 홍콩에서도 집회 참가인원이 항상 논란거리다. /조선일보 DB

미국이나 일본·영국·프랑스·독일 등 선진국 경찰도 집회 규모를 추산할 때 일시점 최대 인원을 기준으로 잡는다. 다만 세부적 방식에서 약간씩 차이가 난다. 미국은 주(州)마다 차이가 있지만 최근 추세는 드론을 띄워 촬영한 항공사진을 바탕으로 ‘페르미 추정법’을 기본으로 한 자체적인 계산 공식을 적용해 집회 규모를 추산한다. 국립공원 경찰대는 1000명 이하의 집회에선 말을 탄 경찰들이 참가 인원을 직접 세는 방식을 쓴다. 일본은 집회가 열릴 때 ‘선제 대응’한다. 집회 장소를 미리 답사해 최대 몇 명이 수용 가능한지 미리 계산해두고, 현장 상황에 맞춰 사전에 계산해둔 수치를 보정해가면서 집회 규모를 추산한다.

한국처럼 집회 규모가 항상 논란이 되는 곳이 있다. 최근 반정부 시위로 긴장이 고조되고 있는 홍콩이다. 2003년 반체제처벌법 제정에 항의하는 반정부 시위가 벌어졌을 때 주최 측이 50만명이 참가했다고 한 반면 경찰은 34만명이 참가했다고 발표해 논란이 불붙었다. 이후 홍콩대 연구자들이 나서 전화 조사까지 동원해 집회 참가 인원을 측정했다. 당시 연구진은 “경찰 측 추산치가 좀 더 현실에 맞는 것 같다”는 결론을 내렸지만, 지금도 여전히 주최 측과 경찰 사이의 집회 규모 다툼이 이어지고 있다.



출처 : http://news.chosun.com/site/data/html_dir/2019/10/11/2019101102012.html