1만 개 데이터 분석 단 6분 ‘그놈 목소리’ 잡아내 보이스피싱 조직원 소탕 > 정책소식 | 정보모아
 
정책소식

1만 개 데이터 분석 단 6분 ‘그놈 목소리’ 잡아내 보이스피싱 조직원 소탕

작성자 정보

  • 공감 작성
  • 작성일

컨텐츠 정보

본문

btn_textview.gif



‘음성분석 모델’ 개발 보이스피싱범 잡는 국과수를 가다
“영상 합의보려고 전화드렸습니다. 합의 의사 없으면 지금부터 본인 가족이랑 지인들한테 먼저 보내드릴까 하는데….”
피해자의 휴대전화에 녹음된 전화금융사기(보이스피싱) 범죄자의 음성이다. 범인은 성매매 영상을 유포하겠다며 금품을 요구했다. 이 같은 수법으로 약 70명에게 6억 원을 가로챈 보이스피싱 범죄 조직을 최근 경찰이 검거하는 데 성공했다. 직접 사건에 가담한 16명을 비롯해 올해 10월 말까지 붙잡은 조직원은 51명에 달한다.
이처럼 경찰이 보이스피싱 조직원을 무더기로 잡을 수 있었던 데는 ‘보이스피싱 음성분석 모델’이 큰 역할을 했다. 행정안전부 소속 통합데이터분석센터와 국립과학수사연구원은 올해 2월 음성분석 모델을 개발했다. 이 모델은 여러 음성을 비교해 동일인 여부를 판별하는 데 쓰인다. 즉 범죄 혐의자의 목소리를 앞서 확보한 범죄자의 음성 데이터와 비교해 동일인을 찾아내는 것이다. 여기에는 인공지능(AI) 기술이 적용됐다. AI는 약 6000명으로부터 추출한 100만 개의 음성을 학습해 판별 능력을 갖췄다. 행안부는 2022년부터 기술 개발에 착수해 올해 2월부터 본격적으로 음성분석 모델을 사용해왔다. 개발에 참여한 국과수 박남인 연구사(디지털과 오디오미디어연구실)는 “이번 사건은 발신번호를 조작하는 중계기 단속 과정에서 검거한 조직원 5명의 목소리를 기존 범죄자들의 음성 데이터와 비교함으로써 미제사건 범죄자까지 추가로 검거할 수 있었다”고 설명했다.

이틀 걸리던 음성분석 ‘6분’으로 단축
강원 원주시에 자리한 국과수를 찾아 음성분석 모델로 어떻게 보이스피싱 범인을 잡는지 살펴봤다. 해당 모델은 컴퓨터에 탑재해 사용한다. 박 연구사가 실험군으로 사용할 음성파일을 선택한 뒤 간단한 명령어를 입력하자 화면에 작업시간이 나타나면서 곧장 분석이 시작됐다. 앞서 선택한 음성과 비교할 대조군 음성파일은 무려 1만 3000개. 국과수와 금융감독원이 양해각서(MOU)를 체결해 2015년부터 확보해온 보이스피싱 관련 데이터다. 잠시 대화를 나누는 동안 어느새 분석이 완료됐다. 1만 개가 넘는 파일을 분석하는 데 걸린 시간은 단 ‘6분’이었다. 화면에는 실험군 목소리와 유사한 음성파일이 순서대로 나열됐다. 10점 만점인 ‘유사도’가 6.2를 넘으면 동일한 목소리로 본다. 유사도가 6.5인 음성파일을 클릭하자 실험군 음성과 매우 비슷한 목소리가 흘러나왔다. 분석의 정확도, 즉 판독률은 97%에 달한다. “기준치는 마음대로 설정할 수 있다. 다만 그걸 높게 잡으면 분석의 정확도는 올라가지만 분석 대상이 편협해질 수 있다. 같은 의미에서 기준치를 낮게 설정하면 정확도는 떨어지지만 혹시라도 AI가 놓칠 수 있는 분석대상까지 수사선상에 놓을 수 있게 된다. 따라서 기준치를 어떻게 설정하느냐도 중요한 부분이다.” 박 연구사의 설명이다.



범죄자 ‘그룹화’ 기능 세계 최초 개발
국과수는 기존에 러시아, 영국 등에서 수입한 음성분석 모델을 사용했다. 수입 모델은 한국어 판별 능력이 다소 떨어졌다. 또한 고가인 데다 해당 국가의 사정에 따라 수급에 차질이 생기는 경우도 있다. 무엇보다 큰 문제는 해외 모델의 경우 두 음성의 일대일 비교만 가능하다는 것이다. 즉 한 혐의자와 동일한 목소리를 찾기 위해 수백, 수천 건의 데이터를 하나씩 비교해야 한다는 얘기다. 반면 행안부가 개발한 모델은 한 번에 여러 음성을 비교하는 게 가능하다. 하나의 목소리와 여러 음성을 대조하는 ‘일대다’ 비교는 물론 여러 명의 목소리를 더 많은 음성과 대조하는 ‘다대다’ 비교까지 할 수 있다. 가령 경찰이 수사 과정에서 100개의 음성파일을 확보했다면 이를
1만 3000개의 데이터와 한 번에 비교할 수 있다는 의미다. 이 역시 단 몇 분이면 가능하다. 박 연구사는 “하나의 음성을 분석하는 데만 하루 이틀이 걸렸던 걸 생각하면 매우 획기적인 변화”라고 했다.
행안부의 음성분석 모델은 범죄 가담자들을 ‘그룹화’하는 기능도 갖췄다. 범죄자 한 명의 목소리가 정확히 판별되면 그가 연루된 또 다른 범죄를 연쇄적으로 추적하는 게 가능하다. 박 연구사가 대형 스크린에 띄운 자료에는 조직원을 의미하는 원 수천 개가 서로 얽혀 하나의 거대한 그물망을 형성하고 있었다. 동일범일 경우 원은 같은 색깔로 표시되는데 한눈에 봐도 동일한 색의 원이 많았다. 범죄자 한 명 한 명이 여러 사건에 걸쳐 있고 대부분의 보이스피싱이 조직적으로 이뤄진다는 뜻이다. 박 연구사는 “그룹화 기능을 탑재한 음성분석 모델은 우리가 개발한 것이 세계 최초”라고 강조했다. 이 같은 공로를 인정받아 행안부의 보이스피싱 음성분석 모델은 11월 8일 열린 ‘2023 적극행정 우수사례 경진대회’에서 대상을 수상했다.
“보이스피싱 범죄는 한 번으로 끝나는 경우가 드물어요. 저희가 확보하고 있는 1만 3000개 데이터 중 약 6000개가 두 번 이상 범행을 저지른 조직원의 목소리예요. 한 사람이 34번까지 보이스피싱을 시도한 경우도 있고 한 명이 총 18개 조직에 가담해 있는 것도 봤습니다. 게다가 조직원들은 새로운 범죄를 시도할 때마다 검사와 수사관 등 역할을 바꿔 활동해요. 그래서 한 명을 검거했다고 해도 여죄를 밝히거나 수사를 확대하는 게 어려웠죠. 보이스피싱 범죄는 그룹화하는 게 반드시 필요한데 음성분석을 통해 그게 가능해진 겁니다.”

전국 경찰 수사지원시스템에 탑재
금감원에 따르면 2022년 보이스피싱과 관련한 피해자 수는 1만 2816명, 피해 금액은 1451억 원에 달한다. 피해 금액은 2019년 코로나19 이후 감소하고 있지만 감소율은 지속적으로 둔화하는 모양새다. 특히 오픈뱅킹이나 간편송금 등 금융거래의 간편성을 악용한 사기가 늘어나고 있다. 여전히 보이스피싱 범죄가 우리 생활 곳곳을 노리고 있다는 뜻이다.
지난 10월부터는 경찰에서도 행안부의 보이스피싱 음성분석 모델을 사용하고 있다. 전국 경찰 누구나 접속할 수 있는 수사지원시스템에 탑재됐다. 국민에게 막대한 피해를 입히는 보이스피싱 범죄에 더 적극적으로 대응하기 위해서다. 그간 경찰은 음성 감정이 필요할 경우 국과수에 의뢰해 결과를 받아야 했다. 이 과정이 2~3주가량 소요돼 영장신청 등 발 빠른 수사가 어려웠다. 하지만 이제는 경찰이 현장에서 즉시 음성 비교를 할 수 있게 돼 보이스피싱 사건 해결에 속도가 붙을 것으로 기대된다. 앞서 51명의 조직원을 검거한 사건 역시 경찰이 직접 음성분석을 한 뒤 수사를 확대해나간 결과다. 국과수는 현직 경찰을 대상으로 모델 사용법과 분석 방법에 대해 연 2회 이상 교육을 이어나갈 예정이다.



음성 제보가 결정적 단서… “의심 전화는 녹음부터”
한편 음성분석 모델은 보이스피싱뿐 아니라 다양한 범죄에 적용할 수도 있다. “대리시험, 협박, 사기 등 범죄의 종류와 무관하게 음성을 통해 추적 가능한 사건이라면 뭐든 적용할 수 있다”는 게 박 연구사의 설명이다. 국과수는 개발도상국을 대상으로 공적개발원조(ODA) 차원에서 음성분석 모델을 지원할 계획도 가지고 있다. 해당 모델이 영어 서비스를 지원하는 것도 개발 단계에서부터 이를 염두에 뒀기 때문이다.
다만 아직 기술 적용의 한계도 있다. 두 명 이상이 동시에 말하는 경우 음성을 분석하기 까다롭다. 사람의 목소리가 노화에 따라 계속 변화하는 것도 관건이다. 최근 해외에서는 타인의 목소리를 모방하는 ‘딥보이스’ 기능을 보이스피싱에 악용한 사례까지 생겼다. 행안부 모델에는 합성음(기계음)을 구분하는 기능만 있다. 계속해서 기술을 발전시켜나가야 하는 이유다.
무엇보다 음성분석 모델이 실질적인 효과를 거두기 위해 가장 중요한 것은 ‘데이터 축적’이다. 일단 많은 데이터가 쌓여야 비교·분석이 의미를 가질 수 있다. 데이터는 피해자들로부터 나온다. 보이스피싱 의심 전화가 걸려올 땐 일단 녹음하는 게 중요하다. 범인 검거의 결정적인 단서가 될 수 있다. 박 연구사는 “보이스피싱은 피해 사례를 공유하는 것이 범죄 예방에 핵심적인 요소”라고 강조했다.
“국과수가 보유한 1만 3000개의 음성 데이터는 모두 국민이 제공한 거예요. 보이스피싱 피해를 입었을 때 범죄자의 음성을 공유하는 게 중요합니다. 경찰(112)이나 금감원을 통해 제보하면 돼요. 금감원에서는 보이스피싱 상습범의 목소리를 공식 유튜브 채널 등에 공유해 연쇄 피해를 예방하는 데 힘쓰고 있습니다. 최근 이러한 목소리로 보이스피싱 의심 신고 전화가 많이 오니 조심하라는 거죠. 보이스피싱 의심 전화가 걸려올 땐 반드시 녹음하길 당부드립니다. 저희는 계속해서 기술을 개발하고 관련 기술이 더 널리 쓰일 수 있도록 노력하겠습니다.”

조윤 기자

박스기사
금융감독원이 알려주는 ‘보이스피싱 예방법’

1. 금융거래정보 요구는 일절 응대하지 말 것
개인정보 유출, 범죄사건 연루 등을 이유로 계좌번호, 카드번호, 인터넷뱅킹 정보를 묻거나 인터넷 사이트에 입력을 요구하는 경우 절대 응하지 말아야 한다. 특히 텔레뱅킹은 공인인증서 재발급 등의 절차가 필요하지 않으므로 관련 정보 관리에 더 신경써야 한다.

2. 현금지급기로 유인하면 100% 보이스피싱
현금지급기를 이용해 세금, 보험료 등을 환급해준다거나 계좌 안전조치를 취해주겠다면서 현금지급기로 유인하는 경우 절대로 응해서는 안 된다.

3. 자녀납치 보이스피싱에 미리 대비
자녀납치 보이스피싱에 대비하기 위해 평소 자녀의 친구, 선생님, 인척 등의 연락처를 미리 확보해놔야 한다. ‘암구호’를 만들어두는 것도 좋다.

4. 금융거래정보를 미리 알고 접근해도 진위 확인
최근 개인·금융거래정보를 미리 알고 접근하는 경우가 많으므로 전화, 문자메시지, 인터넷메신저 내용의 진위를 반드시 확인해야 한다.

5. 발신번호는 조작이 가능하다는 점에 유의
등록된 전화번호로만 텔레뱅킹이 가능한 ‘사전지정번호제’에 가입했더라도 인터넷 교환기(중계기)를 통해 발신번호 조작이 가능하다는 점에 유의해야 한다. 사기범들이 “사전지정번호제에 가입한 본인 외에는 누구도 텔레뱅킹을 이용하지 못하니 안심하라”고 하는 말에 현혹되면 안 된다.

6. 금융회사 등의 정확한 누리집 주소 여부 확인
피싱사이트의 경우 정상적인 주소가 아니다. 따라서 문자메시지, 이메일 등으로 수신한 금융회사 및 공공기관의 누리집 주소가 실제와 동일한지 반드시 확인해야 한다.

박스기사2
보이스피싱 신고는 ‘112’로

신고 일원화 사건 접수서 피해구제까지 한번에
정부가 보이스피싱 신고를 국번 없이 ‘112’번, 인터넷은 ‘보이스피싱 지킴이’ 누리집으로 일원화했다. 보이스피싱 신고를 위해 직접 소관 부처를 찾아야 했던 불편을 개선한 조치다. 과거에는 정부 부처가 신고·대응창구를 개별적으로 운영한 탓에 동일한 내용을 각 기관에 여러 번 반복 신고해야 하는 불편함이 따랐다. 앞으로는 보이스피싱 피해를 입었을 경우 112에 신고하면 사건 접수뿐 아니라 악성 애플리케이션 차단, 피해구제 등의 지원 서비스를 한번에 받을 수 있다. ‘보이스피싱 지킴이’는 금융감독원 누리집(www.fss.or.kr)을 통해 접속하거나 포털사이트에서 검색하면 된다. 보이스피싱 사전 예방법, 피해 신고 및 대처법 등이 자세히 소개돼 있다. 


[자료제공 :icon_logo.gif(www.korea.kr)]

관련자료

댓글 0
등록된 댓글이 없습니다.

최근글


  • 글이 없습니다.

새댓글


  • 댓글이 없습니다.
알림 0