본문 바로가기 메인메뉴 바로가기

전자정부이 누리집은 대한민국 공식 전자정부 누리집입니다.

뉴스

콘텐츠 영역

세계 최초 AI 활용 ‘보이스피싱 음성분석’ 모델 개발

음성 판독률, 기존 외산 분석모델 대비 약 77% 향상 확인

2023.02.22 행정안전부
목록

세계 최초로 전화사기 검거에 초점을 맞춘 ‘보이스피싱 음성분석 모델’이 개발되어 범죄 수사와 범죄자 검거에 속도가 붙게 될 것으로 기대된다.

행정안전부는 보이스피싱 사기범 검거에 활용할 수 있는 ‘보이스피싱 음성분석 모델’을 개발하고, 2월 말부터 음성 감정 등 사기범 수사 과정에 활용한다고 22일 밝혔다.

이번 모델은 보이스피싱범 검거 핵심인 범죄조직 군집화 기능을 세계 최초로 구현한 것으로, 특히 한국어 음성 학습을 통해 기존 외산 분석모델 대비 77% 성능 향상을 보인것으로 나타났다. 

보이스 피싱 범죄 건수 등. (자세한 내용은 본문에 설명 있음)
보이스 피싱 범죄 건수 등. (자세한 내용은 본문에 설명 있음)

그동안 국내에서는 국립과학수사연구원이 러시아와 영국에서 개발한 음성분석 모델을 활용해 보이스피싱 수사에 필요한 음성감정을 진행해왔다. 

하지만 외국어로 학습된 음성분석 모델 특성상 한국어를 사용하는 범죄자의 동일인 여부를 판별하는 정확도에 한계가 있었다.

또한 단일 범죄자의 음성 일치 여부 확인뿐 아니라 보이스피싱 범죄조직의 특성상 역할을 나누어 그룹별로 활동하고 있어, 범죄에 연루된 범죄자들을 군집화하는 기능이 반드시 필요했으나 기존모델에는 이러한 기능이 없었다.

이에 행안부 통합데이터분석센터는 국립과학수사연구원와 함께 지난해부터 보이스피싱 범죄자 검거에 초점을 두고 화자 구분 정확도 개선과 범죄연루자 그룹화가 가능한 모델 개발을 추진했다.

이번 모델은 최신 인공지능학습(AI 딥러닝) 기술로, 개발과정에서 국내외 6000여 명으로부터 추출한 100만 개 이상의 외국어와 한국어 음성데이터를 활용했다.

특히 한국어의 경우 10만 개 이상의 일반인 음성데이터와 국과수가 보유 중인 실제 보이스피싱 사기범 음성데이터를 함께 사용해 다양한 학습 과정과 성능 검증과정을 반복 시행함으로써 보이스피싱 화자 구분 등에 필요한 최적의 알고리즘을 만들어 낼 수 있었다.

모델 개발 이후 두 차례에 걸쳐 진행된 정확도 검증은 1차에서 150명 660여 개, 2차는 200명 1만 2000여 개의 별도 음성데이터를 사용해 다양한 상황 가정하에 이루어졌다.

이 결과 범죄자의 음성을 정확하게 판별해내는 판독률이 기존 외국산 분석모델 대비 77% 향상된 것이 확인됐고, 기존 모델에서는 기대할 수 없었던 범죄가담자 그룹화 기능도 세계 최초로 구현할 수 있게 됐다. 

범죄가담자 그룹화 기능. (분석과정을 거쳐 가담자①~④가 동일 범죄조직에 소속되어 있음을 확인 가능)
범죄가담자 그룹화 기능. (분석과정을 거쳐 가담자①~④가 동일 범죄조직에 소속되어 있음을 확인 가능)

최근 경찰청 발표 자료에 따르면 지난 5년 동안 국내에서 발생한 보이스피싱 피해 건수는 15만 6249건, 피해액은 3조 원을 넘어서는 등 국민 생활에 심각한 영향을 미치고 있는 것으로 나타났다. 

이로 인해 범죄예방 등을 위한 사회 경제적 비용도 급증하고 있는 것으로 분석되고 있다.

이에 행안부 통합데이터분석센터는 모델 개발이 성공적으로 완료됨에 따라 국과수 및 경찰청과 협력해 보이스피싱범 수사와 검거 과정에 적극적으로 활용하고 해외 확산도 추진할 방침이다.

먼저 국과수는 새로 개발된 모델을 2월 말부터 보이스피싱 사기범 목소리 감정에 활용해 보유 중인 1만 개의 보이스피싱범 음성데이터를 분석해 범죄조직 그룹화와 이미 검거된 범죄자의 여죄 추궁 등에 사용한다.

경찰청과도 모델을 공유해 보이스피싱 범죄 초동수사의 속도와 검거율을 높이는데 활용하고, 기관사칭 및 전세사기 등 다양한 음성관련 범죄 수사 전반에 적용해 나갈 예정이다.

나아가 이번에 개발한 새로운 모델로 분석한 보이스피싱범의 음성은 금융감독원 누리집(보이스피싱지킴이)에도 공개해 보이스피싱 범죄에 대한 경각심과 사전예방 수준도 높여나갈 방침이다. 

한창섭 행안부 차관은 “새로 개발된 보이스피싱 음성분석모델은 데이터 분석을 통해 사회현안을 해결하는 디지털플랫폼정부의 구체적 성과물에 해당한다”고 평가했다. 

이어 “앞으로도 데이터기반의 일 잘하는 정부구현을 위해 국민이 필요로 하는 분석과제를 발굴하고, 분석된 결과를 현장에 적극 활용해 나갈 것”이라고 강조했다. 

한편 행안부는 새로운 행정한류 상품으로 해외 확산도 추진하는데, 우리의 최신 음성 과학수사 기법을 전수받고자 하는 국가에는 올 하반기에 이루어지는 교육과 다양한 국제행사 등을 계기로 모델의 우수성과 확장 가능성을 알려 나갈 계획이다. 

문의 : 행정안전부 정부혁신조직실 통합데이터분석센터(044-205-2286), 국립과학수사연구원 디지털과(044-205-2286)

이전다음기사

다음기사영세 소상공인 중심으로 ‘지역사랑상품권 사용처’ 재편

히단 배너 영역

추천 뉴스

2024 정부 업무보고 국민과 함께하는 민생토론화
정부정책 사실은 이렇습니다

많이 본, 최신, 오늘의 영상 , 오늘의 사진

정책브리핑 게시물 운영원칙에 따라 다음과 같은 게시물은 삭제 또는 계정이 차단 될 수 있습니다.

  • 1. 타인의 메일주소, 전화번호, 주민등록번호 등의 개인정보 또는 해당 정보를 게재하는 경우
  • 2. 확인되지 않은 내용으로 타인의 명예를 훼손시키는 경우
  • 3. 공공질서 및 미풍양속에 위반되는 내용을 유포하거나 링크시키는 경우
  • 4. 욕설 및 비속어의 사용 및 특정 인종, 성별, 지역 또는 특정한 정치적 견해를 비하하는 용어를 게시하는 경우
  • 5. 불법복제, 바이러스, 해킹 등을 조장하는 내용인 경우
  • 6. 영리를 목적으로 하는 광고 또는 특정 개인(단체)의 홍보성 글인 경우
  • 7. 타인의 저작물(기사, 사진 등 링크)을 무단으로 게시하여 저작권 침해에 해당하는 글
  • 8. 범죄와 관련있거나 범죄를 유도하는 행위 및 관련 내용을 게시한 경우
  • 9. 공인이나 특정이슈와 관련된 당사자 및 당사자의 주변인, 지인 등을 가장 또는 사칭하여 글을 게시하는 경우
  • 10. 해당 기사나 게시글의 내용과 관련없는 특정 의견, 주장, 정보 등을 게시하는 경우
  • 11. 동일한 제목, 내용의 글 또는 일부분만 변경해서 글을 반복 게재하는 경우
  • 12. 기타 관계법령에 위배된다고 판단되는 경우
  • 13. 수사기관 등의 공식적인 요청이 있는 경우