본문 바로가기 메인메뉴 바로가기

전자정부이 누리집은 대한민국 공식 전자정부 누리집입니다.

콘텐츠 영역

통계청, 개인정보 노출위험 통계적 방지 프로그램(KOSTAT-Did) 보급

2025.09.04 통계청
글자크기 설정
목록
통계청(청장 안형준)은 통계자료(마이크로데이터)의 개인정보 노출 위험을 평가하고 특정 개인·사업체를 식별할 수 없도록 처리하는 프로그램인 'KOSTAT-Did (De-identification)'를 개발, 국가통계작성기관을 대상으로 9월 4일(목)부터 서비스한다고 밝혔다.

최근 인공지능 대전환(AX) 시대를 맞아 인공지능 학습용 데이터 개방 등 개인·사업체 단위의 상세 자료제공 요구가 증가하고 있다. 그러나, 국가통계작성 기관들은 마이크로데이터 전면 개방의 가장 큰 장애 요인으로 개인정보 노출 위험을 꼽고 있다. 제공되는 자료가 상세해질수록 정보의 유용성은 높아지지만, 개인정보 노출 위험도 함께 증가하기 때문이다. 

통계청은 2023년 「통계작성 및 통계자료 제공을 위한 비식별화 가이드라인」을 배포해 개인 및 단체 기밀 보호와 통계적 유용성 간 균형을 권고한 데 이어, 2024년에는 담당자들이 수작업으로 처리해 온 비식별화 업무를 지원하기 위해 엑셀 기반의 자동 프로그램인 KOSTAT-Did를 개발했다. 이후 통계청 및 외부 기관 실무자와 전문가의 테스트를 거쳐 최종 프로그램을 확정했으며, 오늘부터 통계정책관리시스템(www.narastat.kr/pms/index.do)을 통해 제공한다. 10월부터는 국가통계작성 기관을 대상으로 맞춤형 사용자 교육도 실시할 예정이다.

KOSTAT-Did는 통계자료의 특성을 고려해 마스킹, 범주화, 통계적 잡음(노이즈)첨가, 자료교환(스와핑) 등 15종의 비식별화 기법을 지원한다. 예를 들어 마스킹은 "김OO"와 같이 기호를 사용하여 일부를 가리는 방식이다. 범주화는 유일한 속성을 가지고 있어 개체가 식별될 위험이 있는 경우, 보다 큰 범주의 값으로 대체하는 방식(초고령자 연령은 102세 → "100세 이상"으로 범주화 등)이다.

이 프로그램상에서 마이크로데이터의 비식별화 처리가 완료되면 표준화된 평가 보고서가 자동 생성된다. 처리 전후의 정보손실도 및 노출위험도를 시각화된 그래프와 정량화된 지표로 비교할 수 있는 것 또한 이 프로그램의 특징 중 하나이다. 이를 통해 통계담당자는 통계자료의 객관적인 정보보호 수준 측정 및 평가를 할 수 있다. 기관 차원에서는 프로그램에서 제공하는 정량화된 측정 지표와 기준을 활용, 최적의 마이크로데이터 공개 범위를 설정할 수 있다.

안형준 통계청장은 "통계청이 통계자료 개방과 관련한 지침이나 가이드라인 제공을 넘어, 실무에 적용할 수 있는 자동 프로그램을 보급한 것은 이번이 처음이다. 보급하게 된 계기는 정부가 AI 대전환을 통한 세계 3대 AI 강국 도약을 목표로 하고 있고, 이를 위해서는 양질의 데이터인 국가통계를 안전하게 개방할 수 있는 인프라 지원이 반드시 필요하기 때문"이라고 밝혔다. "이번 비식별화 프로그램 보급을 계기로 통계청은 최신 정보보호 신기술 연구와 인프라를 확충, 437개 국가통계작성 기관 전체가 보다 많은 데이터를 손쉽고 안전하게 개방할 수 있도록 적극 지원하겠다"라고 말했다.

“이 자료는 통계청의 보도자료를 전재하여 제공함을 알려드립니다.”

공공누리 출처표시의 조건에 따라 자유이용이 가능합니다. (텍스트)
단, 사진, 이미지, 일러스트, 동영상 등의 일부 자료는 문화체육관광부가 저작권 전부를 보유하고 있지 아니하므로, 반드시 해당 저작권자의 허락을 받으셔야 합니다.
정책브리핑 공공누리 담당자 안내 닫기

이전다음기사

다음탈플라스틱 순환경제로의 전환, 제17회 자원순환의 날

정책브리핑 게시물 운영원칙에 따라 다음과 같은 게시물은 삭제 또는 계정이 차단 될 수 있습니다.

  • 1. 타인의 메일주소, 전화번호, 주민등록번호 등의 개인정보 또는 해당 정보를 게재하는 경우
  • 2. 확인되지 않은 내용으로 타인의 명예를 훼손시키는 경우
  • 3. 공공질서 및 미풍양속에 위반되는 내용을 유포하거나 링크시키는 경우
  • 4. 욕설 및 비속어의 사용 및 특정 인종, 성별, 지역 또는 특정한 정치적 견해를 비하하는 용어를 게시하는 경우
  • 5. 불법복제, 바이러스, 해킹 등을 조장하는 내용인 경우
  • 6. 영리를 목적으로 하는 광고 또는 특정 개인(단체)의 홍보성 글인 경우
  • 7. 타인의 저작물(기사, 사진 등 링크)을 무단으로 게시하여 저작권 침해에 해당하는 글
  • 8. 범죄와 관련있거나 범죄를 유도하는 행위 및 관련 내용을 게시한 경우
  • 9. 공인이나 특정이슈와 관련된 당사자 및 당사자의 주변인, 지인 등을 가장 또는 사칭하여 글을 게시하는 경우
  • 10. 해당 기사나 게시글의 내용과 관련없는 특정 의견, 주장, 정보 등을 게시하는 경우
  • 11. 동일한 제목, 내용의 글 또는 일부분만 변경해서 글을 반복 게재하는 경우
  • 12. 기타 관계법령에 위배된다고 판단되는 경우
  • 13. 수사기관 등의 공식적인 요청이 있는 경우

히단 배너 영역

정책 NOW, MY 맞춤뉴스

정책 NOW

저출생 극복 나도 아이도 행복한 세상
정부정책 사실은 이렇습니다

MY 맞춤뉴스 AI 추천

My 맞춤뉴스 더보기

인기, 최신, 오늘의 영상 , 오늘의 사진

오늘의 멀티미디어

정책포커스