본문 바로가기 메인메뉴 바로가기

전자정부이 누리집은 대한민국 공식 전자정부 누리집입니다.

뉴스

콘텐츠 영역

AI 학습용 데이터 190종 추가 개방…총 381종으로 늘어

12일부터 AI허브에 공개…데이터 활용 확산 논의도

2022.07.12 과학기술정보통신부
목록

과학기술정보통신부는 국내 인공지능 기술과 산업 발전을 견인할 AI 학습용 데이터 190종(5억 8000만 건)을 AI 통합 플랫폼 AI허브(aihub.or.kr)를 통해 추가로 개방한다고 12일 밝혔다.

과기정통부는 2017년부터 기업, 연구자 등이 시간·비용 문제 등으로 개별 확보하기 어려운 AI 학습용 데이터를 구축·개방해 왔고, 2020년부터 구축 규모를 대폭 늘린 후 18만 건 이상의 다운로드를 기록 중이다.

이번 데이터 개방은 지난해 6월 개방한 2020년 구축 데이터 170종(4억 8000만 건)에 더해 지난해 구축한 190종에 대한 품질·활용성 검증을 거쳐 순차적으로 개방하는 것으로 총 규모는 381종에 달하게 된다.

이번에 개방되는 AI 학습용 데이터는 기획부터 구축까지 산업계와 전문가, 국민이 대거 참여한 결과물이다. 데이터 구축 과정에만 811개 기업·대학·병원·기관과 4만 3000여명에 이르는 국민이 참여했다.

데이터는 한국어 음성·자연어(아동, 다화자 음성 등 44종), 영상·이미지(스포츠 동작, 반려동물 등 39종), 교통·물류(로봇주행, 교통사고 등 22종), 헬스케어(심장질환, 정신건강 등 32종), 재난·안전·환경(과적차량, 물류창고 등 27종), 농·축·수산(정밀 농업, 스마트 양식 등 26종) 등 6대 분야로 구성됐다.

인공지능 허브(AI Hub) 기능개선 사례
인공지능 허브(AI Hub) 기능개선 사례

과기정통부는 데이터 개방과 함께 AI 허브 데이터 활용 촉진과 성과 확산 방안을 논의하는 ‘제3회 AI 데이터 활용협의회’를 박윤규 2차관 주재로 열어 인공지능·데이터 산업·연구현장의 생생한 의견을 수렴했다.

이날 협의회에는 인공지능 서비스를 직접 개발·활용하고 있는 주요 대기업, 중소·스타트업과 유관기관 등 14개 기업·기관 관계자가 참석했다.

과기정통부와 지능정보원은 AI 학습용 데이터 구축·활용 주요 성과와 AI 허브 기능 개선사항 등을 공유하고 데이터 이용 활성화를 위한 지원 방안 등을 제시했다.

이어 민간의 AI 허브 데이터 활용 우수사례 발표에서는 KT의 다양한 한국어 음성 데이터를 활용한 콜센터 상담 내용 분류 및 요약 성능 향상 사례와 함께 에이아이포펫의 AI 허브 ‘반려동물 안구질환 이미지 데이터’를 활용한 반려동물 질병 판독 서비스 ‘티티케어(TTcare)’ 개발 사례(CES 2022 혁신상 수상)를 소개했다.

참석자들은 계속되는 간담회를 통해 인공지능 산업·연구·교육 등 다양한 현장에서 AI 허브 데이터 활용을 더욱 촉진할 수 있는 각종 정책지원 방안 등에 대해 가감 없이 의견을 나눴다.

박윤규 차관은 “우리 데이터로 우리 기업이 개발한 서비스가 세계적으로 인정받고 있다는 점이 자랑스럽기도 하지만, 동시에 막중한 책임감을 느끼고 있다”며 “앞으로도 다양한 분야에서 의미 있는 활용성과가 나타날 수 있도록 데이터의 양적·질적 가치를 계속 높여가나는 것이 협의회를 통해 모색할 중요한 과제”라고 말했다.

문의 : 과학기술정보통신부 인공지능산업팀(044-202-6282) 

이전다음기사

다음기사반도체 등 초격차 스타트업 1000개 육성…납품단가 연동제 추진

히단 배너 영역

추천 뉴스

2024 정부 업무보고 국민과 함께하는 민생토론화
정부정책 사실은 이렇습니다

많이 본, 최신, 오늘의 영상 , 오늘의 사진

정책브리핑 게시물 운영원칙에 따라 다음과 같은 게시물은 삭제 또는 계정이 차단 될 수 있습니다.

  • 1. 타인의 메일주소, 전화번호, 주민등록번호 등의 개인정보 또는 해당 정보를 게재하는 경우
  • 2. 확인되지 않은 내용으로 타인의 명예를 훼손시키는 경우
  • 3. 공공질서 및 미풍양속에 위반되는 내용을 유포하거나 링크시키는 경우
  • 4. 욕설 및 비속어의 사용 및 특정 인종, 성별, 지역 또는 특정한 정치적 견해를 비하하는 용어를 게시하는 경우
  • 5. 불법복제, 바이러스, 해킹 등을 조장하는 내용인 경우
  • 6. 영리를 목적으로 하는 광고 또는 특정 개인(단체)의 홍보성 글인 경우
  • 7. 타인의 저작물(기사, 사진 등 링크)을 무단으로 게시하여 저작권 침해에 해당하는 글
  • 8. 범죄와 관련있거나 범죄를 유도하는 행위 및 관련 내용을 게시한 경우
  • 9. 공인이나 특정이슈와 관련된 당사자 및 당사자의 주변인, 지인 등을 가장 또는 사칭하여 글을 게시하는 경우
  • 10. 해당 기사나 게시글의 내용과 관련없는 특정 의견, 주장, 정보 등을 게시하는 경우
  • 11. 동일한 제목, 내용의 글 또는 일부분만 변경해서 글을 반복 게재하는 경우
  • 12. 기타 관계법령에 위배된다고 판단되는 경우
  • 13. 수사기관 등의 공식적인 요청이 있는 경우