콘텐츠 영역
금융 특화 AI 개발의 밑거름을 제공하겠습니다 |
3월 31일부터 금융권 생성형 AI 활용 지원을 위한 「금융 특화 한글 말뭉치」 제공 시작
금융 법규·가이드라인, 금융정책·제도 설명자료 등을 활용하여 금융 공통분야 말뭉치 총 12,600건, 약 45GB 이상 시범 제공 |
금융위원회는 작년 12월 12일 발표한 「금융권 생성형 AI 활용 지원 방안」의 후속조치로 오늘(3.31일)부터 '금융 특화 한글 말뭉치' 제공을 시작한다.
'금융 특화 한글 말뭉치'란 금융 분야의 다양한 전문지식들을 AI 모델이 가공·처리·분석할 수 있는 형태로 모은 대규모 한국어 언어자료 집합으로, 국내 금융권에 특화된 AI 서비스를 개발하기 위해서는 필수적인 요소이다.
그간 금융회사들은 해외에서 일반 사용자들을 위해 개발된 상용 AI(Chat GPT, HyperCLOVA 등), 오픈소스 AI(LLaMA3.3, EXAONE 등)를 활용하여 챗봇, 뉴스 요약, 번역 등 일반화된 서비스를 제공하는 데 사용해 왔다. 그러나, 한국어로 된 금융 용어, 우리나라 금융 법규 등 전문화된 데이터가 부족하여, 금융에 특화된 업무를 수행함에 있어 AI를 활용하는 데에는 어려움이 있었다.
「금융권 AI 협의체」 논의 과정에서도 은행 등 모든 금융업권이 공통적으로 한국어로 된 금융 말뭉치의 필요성을 제기하였으며, 이에 따라 금융위원회는 금융권 AI의 신뢰성과 전문성을 향상시킬 수 있도록 「금융권 생성형 AI 활용 지원 방안」을 발표하면서 '금융 특화 한글 말뭉치' 구축 지원 방안을 발표한 바 있다.
금융 특화 한글 말뭉치는 AI 모델의 금융 전문지식 학습과 답변의 정확도 제고, 성능과 윤리 평가 등에 활용할 수 있도록 다양한 형태로 제공된다.
첫 째, AI 모델의 금융 전문지식 습득을 위한 학습용 말뭉치를 지원한다.
금융 분야 일반 지식을 학습하기 위한 사전학습용 말뭉치는 금융감독원, 은행연합회, 금융연수원 등의 금융용어 사전, 금융 일반지식 자료를 활용하였으며, 금융에 특화된 AI 서비스 개발을 위한 추가학습용 말뭉치는 국내 금융정책·제도 설명자료, 금융 법규·가이드라인 및 보험연수원의 기초 연수자료를 활용하여 구축하였다. 일반적인 AI 모델에 학습용 데이터를 적용할 경우, 한국어로 된 금융 용어에 대한 이해력과 국내 금융제도·법규 등에 대한 전문성을 향상시킬 수 있다.
< 금융 특화 '학습용 말뭉치' 활용 예시 > |
둘 째, AI 모델이 외부의 최신 정보, 전문 데이터를 참조하여 보다 정확한 답변을 도출하도록 하는 검색증강생성(RAG*)용 말뭉치를 지원한다. 검색증강생성용 말뭉치는 「금융소비자보호법」 및 관련 참고자료, 전자금융거래법 등 연계법의 관련 조문을 활용하여 구축하였다. 금융권에 활용되는 AI가 관련 제도나 법규의 최신 개정 내용이 반영되지 않은 잘못된 답변을 도출하는 경우 이용자의 권리를 침해하거나 재산상 손해를 입힐 수 있어, 적기에 현행화된 검색증강생성(RAG*)용 말뭉치의 활용이 필수적이라고 할 수 있다.
* RAG(Retrieval-Augmented Generation) : AI 모델이 외부 특화 데이터, 최신 정보 등을 검색한 후 결과물을 생성하도록 하여 정확도와 신뢰도를 향상시키는 방법
< 금융 특화 '검색증강생성(RAG)용 말뭉치' 활용 예시 > |
셋 째, AI 모델의 금융 지식, 추론능력 및 잠재적 유해성을 평가하기 위한 평가지원용 말뭉치를 지원한다. 생성형 AI가 허구의 정보를 생성하는 환각(Hallucination)이나 성별, 인종 등에 대한 선입견을 학습하는 편향(Bias) 등의 문제는 금융분야 AI 활용의 주요 장애요인으로 작용해 왔다. 학습데이터와 별도로 구축된 평가지원용 말뭉치를 활용하여 AI의 객관적인 성능과 공정성을 검증함으로써 이러한 우려를 상당 부분 해소할 수 있을 것으로 기대된다.
< 금융 특화 '평가지원용 말뭉치' 활용 예시 >
|
이번에 제공되는 금융 공통분야 말뭉치는 총 12,600건, 약 45GB 이상 규모이며, ①사전학습용 6,700건, ②추가학습(Fine-tuning)용 1,100건, ③검색증강생성(RAG)용 3,800건, ④평가지원용 1,000건으로 구성되어 있다.
금융 공통분야 말뭉치 이용을 희망하는 모든 금융회사는 금융결제원 데이터 공유 플랫폼(www.datop.or.kr)을 통해 신청하고 말뭉치를 다운로드 받을 수 있다. '25년 6월 말까지 진행되는 이번 시범사업 기간에는 금융회사들의 말뭉치 조기 활용을 촉진하고, 이용 기관들의 다양한 경험과 의견을 확보하기 위해 말뭉치를 무료로 제공할 예정이다.
금융권 공동의 특화 한글 말뭉치 구축을 통해 개별 금융회사의 AI 학습 및 평가 데이터 확보에 소요되는 시간과 비용을 절약하고, 국내 금융 제도 및 서비스에 전문화된 혁신적 AI 서비스 개발이 촉진될 것으로 기대된다.
금융위원회는 이번 시범사업 과정에서 제기되는 금융회사들의 추가 수요와 의견을 반영하여 '25년 하반기에는 금융 공통분야 말뭉치의 유형과 규모를 확대하고 '26년부터는 금융 업권별 특화 말뭉치를 지원할 수 있도록 다양한 원천 데이터 보유기관 및 유관기관과 지속적으로 협의해나갈 계획이다.
“이 자료는 금융위원회의 보도자료를 전재하여 제공함을 알려드립니다.”
- 공공누리 출처표시의 조건에 따라 자유이용이 가능합니다. (텍스트)
- 단, 사진, 이미지, 일러스트, 동영상 등의 일부 자료는 문화체육관광부가 저작권 전부를 보유하고 있지 아니하므로, 반드시 해당 저작권자의 허락을 받으셔야 합니다.
문의처 : 문화체육관광부 정책포털과
뉴스 |
|
---|---|
멀티미디어 |
|
브리핑룸 |
|
정책자료 |
|
정부기관 SNS |
|
※ 브리핑룸 보도자료는 각 부·처·기관으로부터 연계로 자동유입되는 자료로 보도자료에 포함된 연락처로 문의
※ 전문자료와 전자책의 이용은 각 자료를 발간한 해당 부처로 문의
이전다음기사
다음기사[보도자료] 소액자금 때문에 불법사금융을 이용하지 마세요, 「불법사금융예방대출」이 있습니다!정책브리핑 게시물 운영원칙에 따라 다음과 같은 게시물은 삭제 또는 계정이 차단 될 수 있습니다.
- 1. 타인의 메일주소, 전화번호, 주민등록번호 등의 개인정보 또는 해당 정보를 게재하는 경우
- 2. 확인되지 않은 내용으로 타인의 명예를 훼손시키는 경우
- 3. 공공질서 및 미풍양속에 위반되는 내용을 유포하거나 링크시키는 경우
- 4. 욕설 및 비속어의 사용 및 특정 인종, 성별, 지역 또는 특정한 정치적 견해를 비하하는 용어를 게시하는 경우
- 5. 불법복제, 바이러스, 해킹 등을 조장하는 내용인 경우
- 6. 영리를 목적으로 하는 광고 또는 특정 개인(단체)의 홍보성 글인 경우
- 7. 타인의 저작물(기사, 사진 등 링크)을 무단으로 게시하여 저작권 침해에 해당하는 글
- 8. 범죄와 관련있거나 범죄를 유도하는 행위 및 관련 내용을 게시한 경우
- 9. 공인이나 특정이슈와 관련된 당사자 및 당사자의 주변인, 지인 등을 가장 또는 사칭하여 글을 게시하는 경우
- 10. 해당 기사나 게시글의 내용과 관련없는 특정 의견, 주장, 정보 등을 게시하는 경우
- 11. 동일한 제목, 내용의 글 또는 일부분만 변경해서 글을 반복 게재하는 경우
- 12. 기타 관계법령에 위배된다고 판단되는 경우
- 13. 수사기관 등의 공식적인 요청이 있는 경우
정책 NOW, MY 맞춤뉴스
정책 NOW
인기, 최신, 오늘의 영상 , 오늘의 사진
인기 뉴스
-
다음주부터 '폭염 시 2시간마다 20분 이상 휴식 보장' 의무화
-
7월부터 어린이집 0∼2세·장애아 보육료 지원금 오른다
-
'국민비서'가 소비쿠폰 금액·신청방법 등 미리 알려드려요
-
민생회복 소비쿠폰 대상과 일정이 궁금하다면!?
-
이 대통령 "폭염 극심…국민 건강·재산 지키는데 가용 행정력 총동원"
-
해수부, 부산 청사 자리 확정…연내 일괄 이전 마무리
-
'소비쿠폰' 문자에 URL 링크있다면 100% 사기…"118번 신고를"
-
금융당국, 주가조작 근절 '합동대응단' 가동…불공정거래 '원스트라이크 아웃'
-
내년 '최저임금 시간급' 2.9%↑, 1만 320원…"17년만에 합의"
-
1년 이상 성실상환 채무자 '개인회생 기록' 즉시 삭제 추진
최신 뉴스
- [국방신속획득기술연구원] 신속시범사업 군 관심 과제, 전격 공개!
- 중앙행정심판위원회 행정심판 재결 사례 발표
- 2025년 제57회 국제화학올림피아드 한국대표단 전원 메달 획득(금 1은 3)
- 관세청, 국민 건강안전 위협하는 불법 수입품 310만 점 적발
- 인공지능(AI) 기술… 조달 행정에 활용, 접목시킨다
- 조달청, 공공조달 AI 대전환을 위한 현장 목소리 청취
- 공공건축물 탄소중립, 설계단계부터 강화된다
- 조달청 물품구매 금주('25.07.21. ~ '25.07.25) 입찰동향
-
영상
입대 전에 '이것' 없으면 곤란하지 말입니다
- 비 오면, 산사태 정보를 실시간으로 확인하세요