본문 바로가기 메인메뉴 바로가기

전자정부이 누리집은 대한민국 공식 전자정부 누리집입니다.

콘텐츠 영역

제3차 국가인공지능위원회 사후 브리핑

2025.02.20 과학기술정보통신부
글자크기 설정
목록
기자 여러분, 반갑습니다. 국가인공지능위원회 지원단장 이경우입니다.

오늘 최상목 권한대행 주재로 관계부처 장관, 민간 전문가 등 40여 명이 참여한 가운데 제3차 국가인공지능위원회가 개최되었습니다.

지난 9월 출범한 국가인공지능위원회는 그동안 5개 분과위원회를 운영하며 우리나라 민관 합동 AI 정책 컨트롤타워로 작동하고 있습니다.

오늘 전체회의에서는 최근 주요국의 대규모 AI 투자계획 발표, 중국의 딥시크 사례 등 새로운 글로벌 경쟁 환경을 면밀히 진단하고 AI 3대 강국으로 도약하기 위해 범국가적으로 시급히 추진해야 할 정책 과제를 논의하였습니다.

오늘 회의의 주요 논의 내용에 대해 설명드리겠습니다.

먼저, 최 권한대행은 모두발언에서 글로벌 AI 환경이 급변하면서 위기감이 고조되고 있지만 우리에게 새로운 기회라고 확신하며 민관이 힘을 모아 AI 3대 강국 도약을 위해 필요한 일들을 발 빠르게 추진해야 할 중대한 시점이라고 설명하였습니다.

구체적으로 글로벌 경쟁력을 갖춘 독자적인 AI 모델을 개발하고, 인재 확보, 인프라 구축, AI 산업화를 전면적으로 추진해야 한다고 강조하였습니다.

이어서, 관계부처가 첫째, AI 컴퓨팅 인프라 확충을 통한 국가 AI 역량 강화 방안, 둘째, AI 스타트업 육성을 통한 AI 활용 확산 방안, 셋째, AI 데이터 확충 및 개방 확대 방안 등 총 3건의 안건을 발표하고 참석자 간 토론이 진행되었습니다.

먼저 첫 번째 안건, AI 컴퓨팅 인프라 확충을 통한 국가 AI 역량 강화 방안 주요 내용을 설명드리겠습니다.

현장의 시급한 AI 컴퓨팅 수요에 신속히 대응하기 위해 2026년 상반기까지 총 1.8만 장 규모의 고성능 GPU를 확보하고 AI 인프라 관련 세제지원과 전력·입지 제도 개선으로 민간투자를 활성화할 계획입니다.

또한, AI 국가대표 정예팀을 선발하여 글로벌 Top 수준의 대형언어모델 개발을 목표로 데이터 및 GPU 등 연구자원을 집중 지원하고, 정예팀에 필요한 글로벌 AI 핵심인재를 유치할 수 있도록 연구비 등 지원을 확대하겠습니다.

최고급 AI 인재 양성·확보를 위해서 AI 분야 도전적 문제를 해결하는 '글로벌 AI 챌린지'를 개최하고, 작년 미국에 개소한 글로벌 'AI 프로티어 랩'을 유럽, 중동 등으로 확대할 계획입니다.

아울러, 국내 신진연구자 집중 지원 프로그램도 신설하겠습니다.

우리 기업이 개발한 혁신적 AI 서비스가 국내외 시장에 조기 확산될 수 있도록 의료, 법률, 공공 등 분야별 선도 프로젝트도 추진할 계획입니다.

두 번째 안건, AI 스타트업 육성을 통한 AI 활용 확산 방안 주요 내용에 대해 설명드리겠습니다.

분야별 AI 서비스 스타트업을 육성하기 위해 기업 간 협력을 통한 AI 모델 공동개발을 지원하고, 제조 AI 전문기업 100개를 지정하여 기업당 최대 100억 원 규모의 융자·보증 등 자금, 인력, 판로 확대를 집중 지원합니다.

산업·업종별 자율제조 선도 프로젝트를 추진하고 그 성공 사례를 스마트 공장 지원사업을 통해 확산해 나가는 등 스타트업이 개발한 AI 서비스의 수요 시장 창출도 지원할 계획입니다.

아울러, 2025년 융자·보증 등 중소기업 정책금융에 약 60% 5.7조 원을 AI와 반도체 등 혁신성장 분야에 집중 지원하고, 2027년까지 약 3조 원 규모의 AI 스타트업 집중형 펀드를 조성·운영하여 자금 지원을 대폭 확대하겠습니다.

끝으로, AI 데이터 확충 및 개방 확대 방안 주요 내용을 설명드리겠습니다.

AI 학습용 데이터 부족 문제를 해결하기 위해 그동안 데이터 활용을 저해해 왔던 개인정보 관련 제도적 불확실성을 제거하고 AI 학습을 위한 양질의 공공 및 민간데이터 제공을 대폭 확대하겠습니다.

비정형 원본데이터 활용을 확대하고, AI 연구에 필요한 기간 동안 데이터를 안정적으로 활용할 수 있도록 개인정보 활용특례를 마련할 계획입니다.

생성형 AI 고도화를 위한 미디어, 산업·제조, 금융 등 분야별 특화 데이터를 구축·개방하고, 공공연구데이터, 법령 해석, 심결례 등 AI 수요가 높은 공공데이터 개방도 확대합니다.

아울러, 민간이 필요로 하는 공공데이터가 적극적으로 개방·활용될 수 있도록 공공기관에 가명처리 내부 운영체계를 개선하고, 공공기관 경영평가 등에 가명정보 제공실적을 반영할 계획입니다.

범죄 예방 등 공익적 AI 개발을 위해 개인정보를 활용할 수 있도록 적법처리 근거를 확대하는 등 민간이 주저 없이 데이터를 활용할 수 있도록 법적 불확실성을 해소하겠습니다.

회의의 참석자들은 토론에서 혁신적 AI 모델 개발과 글로벌 AI 경쟁력 확보를 위해 AI 생태계를 구성하는 컴퓨팅 인프라, 인재, 데이터가 유기적 연계와 집중적인 지원이 중요하다고 강조하며, 범국가적 역량을 모아 오늘 논의된 내용을 신속하게 추진해 나가기로 뜻을 모았습니다.

또한, AI 학습을 위해서는 저작물 활용이 필수적이므로 해외 사례를 면밀히 분석하고 AI 산업계와 저작권 업계가 상생 발전할 수 있는 방안을 국가AI위원회를 중심으로 모색해 나갈 것을 확인하였습니다.

오늘 회의는 두 가지 측면에서 의미가 있다고 생각합니다. 첫째, 전 세계적으로 최첨단 AI 모델 확보 경쟁이 심화되는 상황에서 AI G3 도약을 위해 세계 최고 수준의 AI 모델을 개발하고 이를 뒷받침하는 최고급 인재, 대규모 컴퓨팅 인프라, 데이터 개방과 활용 확산을 위해 정부가 과감히 투자하고 신속하게 지원하겠다는 의미입니다.

둘째, AI가 우리 경제의 활력을 제고하고 성장 동력으로 이어질 수 있도록 AI 활용과 산업화를 집중 지원하여 새로운 AI 시대의 AI 활용은 우리나라의 기업들이 선도할 수 있도록 정책적 의지를 표명한 것입니다.

지금까지 오늘 제3차 회의 주요 내용에 대해 말씀드렸습니다. 정부는 오늘 의결한 범부처 정책을 속도감 있게 실행해 나가고 국가인공지능위원회를 구심점으로 민관의 AI 역량을 결집하여 국가 AI 정책의 추동력을 확보하겠습니다.

이상으로 제 브리핑은 마치고 기자님들께 질의응답을 받도록 하겠습니다. 감사합니다.


[질문·답변]
※마이크 미사용으로 확인되지 않는 내용은 별표(***)로 표기하였으니 양해 바랍니다.

<질문> 일단 두 가지 질문이 있는데 둘 다 과기정통부 쪽 질문일 것 같고요. 약간 벗어날 수도 있겠지만 이미 앞서서 연내 GPU 확보 목표가 1.5만 장이었잖아요. 그런데 이제 1만 장으로 됐는데 그 배경이 궁금하고요.

관련해서 또 슈퍼컴퓨터 6호기는 계속 밀려 왔는데 내년 상반기까지 8,000장 확보하면서 다 한다고 하니까 그거 돌파구가 따로 있는 건지, 마련된 건지 그게 궁금합니다.

그리고 두 번째 질문은 월드베스트 LLM 프로젝트 관련해서 조금 더 내용이 있었으면 좋겠는데요. 예를 들어서 이게 어떠한 기준으로 어떤 계획을 갖고 추진이 되는 건지, 그리고 지금 추가 자료 보니까 sLLM 쪽에 포커싱이 돼 있지 않나 생각이 드는데 이런 거에 대해서도 관련해서 내용 공유 부탁드립니다.

<답변> 중요한, 구체적인 질문 내용은 우리 말씀 주신 것처럼 과기정통부에서 엄열 국장님께서 답변을 해 주시고, 부족한 부분이나 또 다른 내용은 또 다른 분들이 답변할 수 있도록 하겠습니다.

<답변> (엄열 정보통신정책관) 배 기자님 질문 답변드리도록 하겠습니다. 올해 GPU 1.5만 장, 그다음에 1.8만 장 그것은 하여튼 먼저 과기정통부 유상임 장관님께서 1.5만 장 말씀하신 것은 일단 의지의 표명, 그 당시, 추경을 전제하지 않고 의지 표명을 하신 말씀이시고요. 지금 1.8만 장 관련된 계획을 수립해서 추진 중에 있습니다.

1만 장 확보를 위해서는 일단 국가AI컴퓨팅센터 출자를 통한 저리 대출을 통해서 연내 1만 장을 확충할 계획입니다. 일단 2005년도 출자분이 1,000억 원이 마련돼 있는 부분이 있고 가능... 대출 가능분 6,000억을 더 포함해서 1만 장을 조기에 연내에 확충할 계획입니다. 말씀 주신 것처럼 8,000장은 내년도 하... 상반기까지 국가컴퓨팅센터에 관련된 부분들을 추가하도록 그렇게 하겠습니다.

월드베스트 랭귀지 모델 관련된 사업은 사실은 비서관님께서... 우리 단장님께서도 말씀 주셨습니다만 세계 최고 수준의, 딥시크 이후에서 가능성을 열어준 세계 최고 수준의 AI 모델을 우리 국내의 최정예 또는 최고의 기술력을 가지고 있는 우리 스타트업이나 청년 기업에게 최대한 지원을 통해서 말씀드린 것처럼 데이터나 컴퓨팅 인프라 관련된 걸 핵심 자원을 집중 지원해서 세계 글로벌로 최고 수준의 AI 모델을 한번 개발해 보자, 라는 어떤 획기적인 R&D 모델입니다.

관련된 구체적 계획이 수립 중에 있다고 말씀드리고요. 실력 있는 스타트업과 청년 기업들이 한번 최대한의 역량을 발휘할 수 있는 놀이터 개념으로 우리가 기회로 공모를 통해서 선발하고 지원할 계획입니다.

<질문> 안녕하십니까? 저도 앞서 말씀 주신 것처럼 월드베스트 LLM 관련된 질문인데요. 조금 더 추가 설명 있었으면 좋겠는데 이 모집을 제가 알기로는 다섯 팀 정도, 기업 다섯 팀을 모집한다고 앞서 과기정통부 관계자분 통해서 이야기를 들었었고, 그리고 아직 모집 시기라든지 구체적인, 얼마나 예산을 투입할지에 대해 이야기를 못 들었거든요. 단장님도 저번에 저희 회의, 강도현 차관님 회의할 때도 들으셨겠지만 그 기업들이 이런 추경 쪽 이야기하시면서 강력히 원하셨던 거로 알고 있는데 언제쯤 이 공모가 진행될지도 여쭙고 싶습니다.

<답변> 그냥 제가 답변드리겠습니다. 아마 제가 부족한 부분은 우리 엄열 국장님이나 다른 분들이 답변을 드리면 될 것 같고요. 월드베스트 LLM 프로젝트에 대해서 구체적인 계획이나 이런 것들은 당연히 그때 말씀 주신 간담회에서도 이야기가 나왔었고 그다음 저희 국가AI위원회 분과위원회나 운영위 또 이런 데에서도 논의가 많이 되고 있습니다.

다만, 그냥 예를 들어서 구체적인 안을 아마 상당 부분 알고 계신 것 같아서 말씀드리면 그게 5팀이 될지, 10팀이 될지는 예산과 관련이 있는 부분이 있습니다. 예를 들어서 저희가 10팀을 뽑으면 각 팀에게 필요한, 예를 들어서 GPU 개수가 몇 개냐, 그다음에 인재를 위한 투자나 또 다른 연구비나 이런 부분에 있어서 분명히 필요한 자원이든 재원이 있을 겁니다.

그러면 예를 들어서 한 팀이 GPU가 1,024개가 필요하다, 그러면 1,024개를 1년 동안 마음껏 쓸 수 있도록 그 이상은 제공해야만 저희가 지금 말하는 월드베스트 LLM를 개발하는 데 최소한의 그 정도 이상은 투자해야 될 것 같고요.

그 말은 1,024개 10개 팀이면 1,024 곱하기 10이고 만약에 5개 팀이면 한 5,000장 정도의 GPU를 1년 동안 마음껏 사용할 수 있고 데이터를 사용할 수 있고 인재나 연구비 R&D도 집중적으로 투자할 수 있도록 그런 안을 생각하고 있습니다.

다만, 말씀 주신 시기나 이런 부분들은 국민들이나 산업체를 실망시킬 수는 없기 때문에 탄탄하고 그러한 부분들을 조금 더 구체적인 내용은 다듬어야 될 필요성이 있고요. 그 부분은 여기 나와 계신 부처의 분들뿐만 아니라 국가AI위원회 민간 위원들, 또 산업체분들과 협의해서 원하는 방향으로 만들어 나갈 것을 약속드리고 싶습니다.

<질문> 저도 숫자 관련 조금 알고 싶은데요. 지금 3만 장, 그러니까 지금 1만 장은 얘기해 주셨고 3만 장 같은 경우는 2027년, 2030년 왔다 갔다 하고 있어서 그 3만 장 시점을 어떻게 잡으신지 궁금하고요.

또 한 가지 연결해서 여기 국산 AI 반도체 비율을 50%로 한다고 했으면 2027년이든 2030년이든 한 1만 5,000장 정도일 텐데 그게 NPU 기준으로 잡으신 건지가 궁금해요.

그리고 지금 H100 기준으로 계속 말씀해 주고 계시지만 신제품이, H100도 나온 지가 좀 됐고 신제품이 나오고 있어서 칩 수급은 꼭 NVIDIA H100 기준으로 지금 삼고 계신지가 궁금합니다. 이게 첫 번째고요.

그리고 두 번째는 사실 이게 시점을 조금 말씀해 주셨으면 좋겠어요. 월드베스트 LLM 프로젝트 같은 경우는 이게 공모가 언제 나올 건지 그 정도는 얘기해 주실 수 있지 않을까 싶어서 그거 두 번째 질문드리겠습니다.

<답변> 3만 장에 대한 이런 것들은 사실은 이렇게 설명을 드리고 기자분들이 잘 해석을 해 주시면 어떨까 싶습니다. 저희가 목표로 했던 국가AI컴퓨팅센터에서 만들 때 이야기했던 것은 그게 3만 장이든 2만 장이든 그게 중요한 게 아니라 국가AI컴퓨팅센터라는 이름으로 어느 정도의 컴퓨팅 파워가 필요하냐, 라고 했을 때 최소한 1.5 엑사플롭스가 필요합니다. 그게 알려진 바로는 LLaMA나 챗GPT 3.5 정도가 그 정도를 가지고 트레이닝을 했기 때문에 적어도 늦더라도 그 정도는 필요하지 않겠느냐, 라는 거고요.

엑사플롭스를 굳이 설명드리면 한 10의 18제곱 정도 되거든요. 그러니까 10의 9제곱 정도 되는 기가플롭스가 10억 개 정도 있는 거니까 사실 컴퓨팅 파워는 매우 충분하다고는 못 하지만 마음껏 해 볼 수 있는 그런 걸 목표로 했던 거고요.

그 3만 장 질문하신 거 국가AI컴퓨팅센터는 그렇게 하고 있지만 말씀 주신 것처럼 엔비디아 GPU의 수급, 그다음에 가격, 여러 가지를 봤을 때 저희가 가진 예산을 가지고, 또 SPC 법인이 투자할 수 있는 여력을 가지고, 또 시장 상황과 수요를 가지고 판단을 해서 최소한 그 정도 이상은 하게 될 거고 따라서 그게 금액이 올라갈 수도 있고 조금 줄어들 수도 있고 그런 상황이 되겠습니다.

답변을 조금 더 드리면 NVIDIA GPU뿐만 아니라 국산 NPU 이야기도 있는데 여전히 마찬가지입니다. 저희가 계획은 처음에 당장 필요하기 때문에 국산 NPU가 지금 돌아가는 게 있다면 당연히 사용을 하겠지만, 소프트웨어 프레임워크까지 해서요. 만약에 그렇지 않다면 NVIDIA GPU를 구매해서 일단 국민들이나 산업체에게 연구계에 제공할 수밖에 없는 현실이고요.

다만, 목표치 전체를 국가AI컴퓨팅센터가 완... 완성이라기보다도 목표를 삼고 있는 2027년이나 2030까지는 저희가 50%까지 국산 NPU를 사용을 높이겠다, 그 목표에는 여전히 아까 말씀드린 컴퓨팅 파워를 위해서 NPU가 투자가 돼야 될 것 같고, 그 중간에 아무래도 저희가 그냥 특정 회사입니다만 NVIDIA GPU와 저희 국산 NPU가 어떤 트랜지션이 되는 그런 시기가 있을 테고 하이브리드 모델이 될 거고, 그러면서 오늘 국가AI위원회에서 나왔던 내용도 예를 들어서 2027년에 갑자기 다 바꿀 수가 없기 때문에 지금부터 국산 NPU를 가지고 소프트웨어나 클라우드 서비스나 시스템 소프트웨어 이런 프레임워크 전체를 개발을 해서 그게 잘 전환이 될 수 있도록 해야 된다, 라는 그런 이야기까지 나왔었습니다, 전체 토론 중에. 따라서 그런 모델을 가지고 저희가 준비를 하고 있다, 라고 보시면 될 것 같고요.

월드베스트 LLM 공모는, 시기는 조금만 시간을 주시면 어떨까 싶습니다. 그 이유는 저희가 오늘 처음으로 언론에 공개가 된 내용이고, 그게 예를 들어서 제가 '3개월 안에 하겠습니다.' 그렇게 말씀... 저희 목표는 3개월 이내입니다. 그러나 저희가 생각하는 것은 1년 이내에, 가능한 한 2025년 이내에 국민들이 기대하는 어떤 수준의 월드베스트 LLM 정도는 나와 주어야 그거에 대한 효과가 되지 않을까, 그렇기 때문에 신속하게 투자를 하고 그런 결과를 만들어내야 될 것으로 기대하고 있습니다. 답변이 되었길 바랍니다.

<질문> ***

<답변> 어떤 거요?

<질문> ***

<답변> 3만 장은 어디 말씀이신지, 이게.

<답변> (이주식 과기정통부 정보통신산업정책과장) 과기정통부 정보통신산업정책과장 이주식입니다. 국가AI컴퓨팅센터 구축 관련해서 말씀을 드리면요. 지금 일단은 저희가 지금 공모 중에 있는데요. 민간 SPC, 민간 참여사 공모 중에 있는데 여기에 어떤 GPU, 특정사의 GPU를 정해서 받고 있진 않습니다. 저희는 중요한 게 아까 지원단장님이 말씀하셨던 것처럼 장소보다도 이게 엑사 스케일로다가 컴퓨팅 성능 파워 지원되는 게 중요하기 때문에 그런 것들을 충족시키는 그런 고성능 GPU 이런 것들을 갖고 사업에 참여하시는 그런 민간 참여자를 중심으로다가 볼 거고요.

그다음에 한 번 말씀드렸었는데 저희가 국산 NPU, AI 반도체 이런 사용하는 거는 저희가 사실 아까 말씀하신 것처럼 이게 성능, 초기에는 고성능 GPU로 이 컴퓨팅센터를 운영해 나가고, 국산 반도체 관련해서는 여러 가지 검증 단계를 거쳐야 됩니다.

잘 아시겠지만 이 AI데이터센터라는 게 정말 안정성이 가장 최고로 그거를 갖다가 충족시켜야 되기 때문에 그런 부분을 정책적이나 시장 상황들 이런 부분들을 보면서 저희가 만약에 목표치를 갖다가 수정하는 사항이 발생하면 그 AI컴퓨팅인프라 특별위원회를 통해서 그런 부분들을 조율해 나갈 예정에 있습니다.

<질문> 질문 기회 주셔서 감사합니다. 저도 월드베스트 프로젝트에 대한 질문을 드리면 어쨌거나 고성능 AI 모델 한국... 한국형 챗GPT 이런 얘기를 하셨는데 그러면 목표가, 아까 살짝 말씀해 주신 것 같긴 한데 범용 파운데이션 모델을 정부 차원에서 만들겠다는 건지, 아니면 특정 영역에 특화된 sLLM이라든가 가벼우면서도 성능이 뛰어난 모델에 집중해서 그걸로 소버린 AI 체계를 구축하는 게 목표인 건지, 어떤 지향점이 뭔지가 자료에는 안 나와 있어서 조금 더, 다시 한번 여쭤보겠습니다.

또 이것 또 고성능이라고 했는데 세부적으로 목표하는 성능, 그런 수치화된 게 있는지가 궁금하고 이게 또 오픈 소스로 공개할 계획이 있는지도 궁금합니다. 그게 첫 번째 질문이고요.

그리고 두 번째 질문은 또 관련 질문인데 어쨌든 AI국가대표 정예팀에게 GPU나 데이터 등 각종 연구자원을 집중 지원한다고 했는데 자료에 예시가 나와 있지만, 이를테면 GPU, 어떻게 구체적으로 GPU라든가 데이터를 지원한다는 건지 설명을 좀 더 세부적으로 부탁드리겠습니다.

이를테면 데이터를 한다 그러면 양질의 데이터 구입을 지원한다고 했는데 그러면 기업이 원하는 데이터가 있을 텐데 그거를 전액 지원해 준다는 건지, 세부적인 지원 방안이 있으면 조금 더 설명 부탁드립니다. 이상입니다.

<답변> 참 답변드리기 어려운 질문을 주셨는데요. 그 이유는 이렇습니다. 제가 변명 아닌 변명이고요. 조금 전에 질문 주신 고성능 AI냐, 한국형 챗GPT냐, 그게 그래서 파운데이션 모델을 이야기하는 거냐, 소위 말하는 Large Language Model, LLM이냐, sLLM이냐, 그런 말씀이시잖아요.

정확한 말씀은 월드베스트 LLM은 파운데이션 모델이 맞습니다. 저희가 현재 생각하는 것은 파운데이션 모델입니다. 그 이유를 제가 굳이 기술적으로 설명드리는 게 아니라 기자님들도 많이 알고 계실 텐데요. 이 파운데이션 모델에 대한 기술적인 능력 또 그 개발 능력뿐만 아니라 알고리즘 설계 능력 그리고 그거에 대한 활용 능력이 많이 축적이 되고 저희 그게 기술자든 청년 스타트업 엔지니어든 학계든 그런 게 축적이 된다면 말씀해 주신 sLLM 쪽에 특화될 때 더 많은 엔지니어들이 또 개발자들이 공급될 거라고 생각합니다. 그런 생태계를 생각하는 거고요.

다만, 파운데이션 모델이 월드베스트 LLM은 맞고요. 그거에 대한 평가는 저는, 저라고 말씀드리기는 그렇지만 현재 생각하고 있는 것은 허깅 페이스나 이런 데 리딩보드에 과연 우리가 글로벌, 월드베스트 LLM이라고 돼 있잖아요. 그러면 세계적인 수준과 세계적인 모델과 비교해서 어느 정도가 되는지 냉정하게 평가를 받고 그 평가에 의해서 발전하는 팀이 있거나 기업체가 있다면 더 적극적으로 지원하겠다는 계획을 가지고 있는 것입니다.

그래서 월드베스트 LLM이 숫자적으로, 점수적으로 불러드리고 싶으나 전 세계 AI 개발자, 또 파운데이션 모델이 인정할 수 있는 그런 능력, 그걸 저희가 또 특정한 것처럼 하나 모델만, 그러니까 '하나의 스코어를 가지고 오세요.'가 아니라 본인들이 개발하고 본인들이 주장하는 리딩보드의 세계적인 기준에 있어서 자기들의 능력이 어느 정도 되는지를 냉정하게 보고, 아무것도 없는 팀을 지원하기는 어렵지 않겠습니까? 현재 가지고 있는 모델이 있다면 그런 모델에 대한 본인들의 능력을 저희들한테 설득해 줘야 하고 그런 팀에게 더 투자가 돼서 더 발전시킬 수 있는 것을 가져가겠다는 것이 월드베스트 LLM의 핵심적인 저희들의 방향이나 철학이라고 보시면 틀리지 않습니다.

말씀드린 대로 조금 더 저희가 산업체나 분명한 현장에서의 목소리를 조금 더 들어서 조금 더 개선시킬 수 있긴 하겠지만 현재는 그게 맞고요. 그럼 sLLM를 안 하느냐? 저희가 오늘 국가AI위원회 안건에서도 나온 부분이 있습니다.

즉, 한국에서 과연 AI를 어떻게 활용해서 산업을 일으키고 스타트업을 양성시키겠느냐? 그 부분은 우리나라에 있는 모든 스타트업들이 LLM를 개발할 수는 없지 않겠습니까? 각 산업 도메인에 각 데이터가 필요한데 제조면 제조, 유통이면 유통, 또 검색이면 검색 이런 데 필요한 LLM이나 혹은 AI 기술은 조금 다를 수가 있습니다.

그걸 예를 들어서 sLLM이라고 하고 ASI라고 부른다면 그들을 위한 투자도 잊지 않고, 또 중소기업이든 스타트업이 발전할 수 있는 그런 모델들을 지원하겠다, 라는 것도 저희 안건에 포함돼 있는 거라서 같이 살펴보시고 작성해 주시면 더 감사하겠습니다.

<질문> ***

<답변> 점점 제가 스스로 함정에 빠지는 게 아닌지 걱정이 되는데요. 제 생각은 이렇습니다. 초기 기업이나 스타트업 아마 '등'이라고 있었을 거라고 기대를 합니다. 저희는 저희 내부적으로 국가AI위원회나 논의를 했을 때는 어떤 조건을 두면 둘수록 사실은 이 판을 넓히기가 어렵다는 생각을 가지고 있습니다.

그러니까 다시 답변을 드리면 그 질문에 대해서 어느 정도의 규모가 아니라 저희는 일단 국가 AI 산업 경쟁력으로 월드베스트 LLM, 혹자는 국가대표라고도 사용을 하는데 그런 팀을 만드는 데 있어서 대기업이면 대기업, 중소기업이면 중소기업, 학계면 학계, 연구계면 연구계, 제한을 두고자 하고자 하지 않습니다.

아까 제가 말씀드리면서 LLM 능력이 있는 팀, 예를 들어서 지금 어떤 팀이 무엇을 가져왔는데 이거를 공모를 한다고 했을 때요. 그런데 LLM에 대한 게 아무것도 히스토리가 없으면 그걸 여러분들이 저희가 선발을 했을 때 인정하기는 매우 어려울 수도 있습니다.

그러나 LLM이 없다고 해서 하는 게 아니라 예를 들어서, 특정 회사니까 빼주세요. 네이버, LG, 구글, 무슨 오픈AI의 연구자들이 우리 회사는 아니지만 그들이 뭉쳐서 '우리가 한번 해보려고 하고 있었습니다.' 그런데 그 개발자들의 백그라운드가 LLM를 개발했던 경험이 있고 충분히 인정할 만한 분들이라면 그분들에게 기회를 주고 국가 AI 월드베스트 LLM 프로젝트에 참여를 시키는 게 당연하다, 라고 저는 생각하고 있습니다.

그리고 또 하나 뭐였... 글로벌 기업 파인튜닝, 이거 아까 어떤 분이 질문을 주셨는데 제가 답변을 못 드린 것 같은데요. 그래서 이것 가지고 무엇을 하느냐, 라고 연계가 될 것 같은데 분명한 것은 저희들이 가지고 있는 아마 유일한 조건 2개 정도는, 첫 번째는 월드베스트 LLM이니까 세계 최고 수준의 LLM을 개발할 수 있는 팀에게 국가가 할 수 있는 최선의 지원을, 최고의 지원을 다하겠다, 라는 거고요.

두 번째 조건은 그거 개발해서 그냥 자기네들이 이렇게 쓰는 게 아니라 국가에서 AI 생태계를 위해서 쓸 수 있는, 적어도 오픈소스든 오픈모델이든 할 수 있는 조건을 두려고 합니다.

그러면서 저희가 또 다른 인센티브를 생각하고 있는 게 그 모델을 가지고 공공데이터나 공공AI에 적용할 수 있는 인센티브를 주어서 장기적으로 저희가 이 생태계를 발전시키고 그 팀이 더 성장할 수 있도록 지원하는 방안도 총체적으로 고민하고 있음을 말씀드리고 싶습니다.

또 혹시 국장님.

<답변> (강기룡 기재부 정책조정국장) 기획재정부 정책조정국장 강기룡이고요. 여러분 다 아시겠지만 오늘은 위원회입니다. 대통령 직속 위원회에서 큰 방향을 밝히신 거고, 이후에 좀 세부적인 궁금하신 사항들은 과기정통부 중심으로 해서 한번 세부적인 방안 조만간 낼 거고요.

저는 다만 오늘 대통령 권한대행이자 우리 기재부 부총리, 부총리께서 이 작업을 준비하고 회의를 준비하시면서 요청하신 메시지나 의중을 간단히 말씀을 드리면 여기 지금 기자님들 말씀하셨다시피 제일 중요한 저희 이번의 과제들이 GPU 확보를 포함한 컴퓨팅센터를 구축하는 문제 그리고 LLM 챌린지 이런 거거든요.

그래서 이 부분에 대해서는 저희 권한대행 의중은 시기도 저희가 당초 생각했거나 설명했던 것보다 훨씬 빨리 해달라는 요청이 있었고요. 규모도 저희가 지금 구체적으로 상금이나 이런 재원을 저희 내부적으로 간략히 얘기한 건 있습니다만 세계적인 여러 가지 제도와 비교해서도 굉장히 파격적으로 지원하라는 요청들이 있었기 때문에 그런 취지들 다 감안하셔서 과기부에서도 조만간 그런 실행계획을 잡으실 거고요.

또 여러분 다 아시다시피 오늘 5시에 여야정 국정 협의체가 있지 않습니까? 여기서도 AI 관련된 그런 논의도 있을 거기 때문에 여야에서도 충분한 그런 논의를 거쳐서 지원할 수 있는 그런 방안을 강구해 주실 것으로 그렇게 믿습니다.

<답변> 국장님이 잘 정리해 주셨는데, 예.

<질문> 데이터 좀 질문하겠습니다. 행안부와 개인정보위에서 답해야 될 것 같은데요. 자료에도 AI 학습을 위한 양질의 공공·민간데이터 확충, 개방이 나와 있는데 데이터, 공공기관 데이터 개방은 저희가 10년 이상 된 저희의 화두이자 숙제였던 것 같아요.

지금 주신 자료에 따르면 지금 데이터가 800, 10개의 기관... 17개 기관에 1만 7,000, 900, 200 시스템에 35만 개 DB가 있는데, 아시다시피 AI에 유명한 격언이 garbage in, garbage out인데 혹시 이 235만 개 DB를 그러면 AI에 막 얼마나 클린 데이터인지 혹시 점검이라든가 그리고 지난 정부에서도 우리가 데이터 댐을 확충해서 많은 데이터를 가지고 있는데 그럼 이 중에서 이게 어느 정도가 AI에 좋은 데이터인지, AI에 좋은 데이터 확충 개방한다는데 혹시 그렇게 실태조사를 하신 게 있는지 궁금하고요.

관련해서 지금 또 자료를 보면 비정형 데이터를 연말까지 개방 확대하겠다고 그러는데 지금 비정형 데이터는 그러면 몇 종이나 되는지, 이 중에서.

그다음에 또 하나만 더 하겠습니다. 특례를 데이터 마련하겠다고 돼 있는데 세부 데이터는 그냥 2025년까지만 돼 있는데 혹시 조금 더 구체적으로 올 3분기, 4분기 그렇게 했으면 좋을 것 같고요.

하나만 더 하면 네 가지가 되는데, 분야별 특화데이터가 중요한데 그러면 이 데이터 중에서 저희가 산업별로 지금 제조도 있고 몇 가지 예를 들어주셨는데 그러면 가지고 있는 공공데이터든 민간데이터든 과연 그렇게 AI가 학습할 특화데이터가 중요한데 과연 그런 것들 제조는 몇 개, 각 결국 모든 필요한 특화데이터의 각 도메인들이 정부부처가 가지고 있잖아요. 과연 거기서 그러면 그 부처들이 가지고 있는 데이터가 얼마나 AI 학습에 맞는 클린 데이터인지, 이런 것들이 작업이 되고 그래야 될 것 같은데, 혹시 여기에 대해 답을 부탁드리겠습니다.

<답변> 개보위 국장님, 혹시 답이 있을까요?

<답변> (관계자) 굉장히 광범위하게 말씀을 주셨는데요. 일단 공공분야에, 우리나라 공공하고 민간에 데이터 자원이 상당히 있습니다. 우리 2010년대부터 사실은 공공데이터법을 만들고 공공데이터 개방을 해왔는데 그때의 공공데이터법에서는 사실은 진짜 가치 있는 데이터, 그러니까 개인정보와 연관된 데이터들은 전부 빠져 있거든요.

그래서 지금 우리 이번 대책의 큰 골자 중의 하나는 공공기관에 아까 817개 기관, 1만 7,000개 시스템 그리고 35만 개 파일이 있습니다. 많은 데이터들이 있는데, 이 데이터들을 지금 현행법으로도 사실 개인정보보호법으로도 과학적 연구라든지 AI 학습을 위해서 가명처리를 해서 활용할 수 있는 방법들이 있는데 이 가명처리를 해서 활용할 수 있도록 공공기관이 데이터를 적극적으로 제공하도록 하는 여러 가지 인센티브들이 마련돼 있지 않습니다.

그래서 그런 인센티브를 이번에 만들어 내고 평가에도 반영하고 그리고 공공기관이 느끼는 그 뭐랄까, 이 데이터 개방에 따른 법적 불확실성이나 불안감들 이런 것들을 해소할 수 있는 장치들을 전체적으로 만들겠다, 이렇게 하는 부분이고요.

그리고 또 하나, 비정형 데이터와 관련해서는 실제로 비정형 데이터, 특히 이미지를 보게 되면 우리나라 많은 인공지능 개발에 종사하고 있는 사업자라든지 업체들이 굉장히 원하고 있는 사업자들인데, 우리나라가 보게 되면 전국적으로 CCTV가 2,700만 대가 있고요. 그리고 공공분야에 100만 대가 있습니다. 그리고 공공분야에 100만 대가 있는데 216개 통합, 지자체에서 통합관제센터에 있는 CCTV가 65만 대가 있는데 이 65만 대에서 발생하는 여러 가지 재난·재해, 안전사고, 교통 이런 관리를 목적으로 CCTV가 설치돼 있는데 여기에서 CCTV 영상 중에 실제로 인공지능 개발에 굉장히 필요한 데이터들은 이벤트 데이터, 에지 데이터라고 해서 각종 사고 그다음에 재난·재해 이런 영상들을 체계적으로 저희들이 추출해서 학습데이터 DB를 앞으로 구축해 나가는 법령하고 시스템 이런 것들이 이제 전부 관계부처와 합동으로 해서 만들어지게 되겠습니다.

그래서 그런 내용들이 정리가 돼 있고, 원본 활용 특례는 지금 보면 자율주행 기술개발을 위해서 지금 원본 활용 특례가 규제 샌드박스로 5개 사업자한테 이렇게 허용이 돼 있는데, 이 원본, 규제 샌드박스를 통한 원본 활용은 최장 2+2년에서 4년 동안 제공되고 있고 한시적으로 제공된다는 그런 한계가 있어서 이거를 차제에 보호법의 원본 데이터 활용 특례를 아예 제도적으로 보장을 해서 목적 달성에 필요한 만큼, 연구나 사업에 필요한 만큼 법적·안정적으로 이렇게 원본을 활용할 수 있는 그런 메커니즘을 만들겠다는 거고 법안이 발의돼 있고 올해 저희들은 통과시켜서 원본 활용이 활성화되는 환경을 조성하려고 합니다.

<질문> 안녕하세요? 국내에서 쓸 만한 수준의 LLM이 아니라 월드베스트 LLM을 만들기 위해서는 해외 데이터도 어떻게 확보할지가 과제일 것 같은데요. 예를 들어서 프랑스 같은 경우에는 미스트랄이 불어권 자료들도 잘 갖추고 있지만 영어 서비스도 잘하고 힌디어, 아랍어 LLM도 이미 출시하고 있는데 혹시 영어 데이터나 비서구권 데이터 확보 같은 계획은 있으신지, 또 월드베스트 LLM에 다국어 서비스도 평가 기준에 들어가게 될지가 궁금하고요.

두 번째로는 인재 유치의 걸림돌로 대우의 격차가 자주 언급되고 있는데 제공해 주신 자료에는 박사급 초봉이 국내에서 지불할 수 있는 수준이 빅테크의 3분의 1 수준인데 이거를 격차를 맞춰주는 수준의 지원을 염두에 두고 계신 건지 이 점 질문드립니다.

<답변> 국장님, 괜찮으면 질문 하나만 더 받는데요. 우리 중기부 국장님도 오셨는데 스타트업이나 중기부에 질문을 하나 마지막으로 받아주셨으면 감사하겠습니다.

월드베스트 LLM의 좋은 지적이십니다. 해외 데이터, 미스트랄 AI도 사실 말씀 주신 것도 국가AI위원회 전체 토론 시간에 이야기가 나왔고요. 월드베스트라고 했는데 한국어만 잘되는 그런 우물 안 베스트가 아닙니다. 분명하게 영어권에 대해서도 당연히 최선의 결... 최고의 결과를 낳을 수 있는 다국어 평가 기준이라기보다도 지금은 일단 목표는 모든 언어이긴 하겠지만, 알고리즘이면 사실 다 잘해야 되고 그렇긴 하지만 일단 영어권이나 한국어권에서는 월드베스트 기준에서 최고 수준이라는 걸 말씀드리고요.

과연 이거 관련된 영어권 데이터가 있느냐? 그 부분은 솔직히 제가 지금 모르겠습니다. 그 말씀은 뭐냐 하면 산업체에서 할 때 영어권 데이터가 필요하고 그게 정부 재정이 필요하면 무작정 사주겠다는 게 아니라 충분히 합리적이고 그렇다면 만약에 그게 예를 들어서 그게 기업이고 저희가 마중물을 내어준다고 한다면 비용이 어느 정도라면 어느 정도 연구비에서 집행할 수 있는 방안도 저희가 제공해 줄 수 있지 않을까, 그런 생각이 듭니다, 영어권 데이터.

그다음에 박사급 초봉을 격차를 사실 오늘은 훨씬 더, 아까 우리 강기룡 국장님도 차마 수치를 말씀을 못 해 주셨지만 국가AI위원회 전체 토론회에서 훨씬 더 과격한 표현도 있었습니다. 예를 들어서 지금 박사급이 이 정도 받는데 말씀하신 건 한 5배 이상 인건비를 제공해야 된다, 라는 정도의, 그래야만 세계 최고 수준의 인재가 모이고, 또 적어도 세계 최고 수준의 인재가 저희... 말씀이 좀 섞이지만 그런 인재가 발전할 수 있는 토대를 마련해 주려면 그런 과감하고 신속한 투자가 필요하다, 라는 것이 말씀을 많이 드려서 그 격차를 채운다, 라는 것보다도, 그런 이야기도 있습니다.

예를 들어서 이 사람이 박사급 인재인데, 최고급 인재인데, 예를 들면 연봉이 10억을 받는 사람도 있고 20억을 받는 사람도 있고 2억을 받는 사람도 있을 겁니다, 저희 그거에. 그런데 저희한테 필요한 것이 예를 들어서 10억이나 20억의 연봉이 필요한 인재라면 과감히 저희 정부가 충분히 동의할 수 있는, 필요성이 동의된다면 그 인재의 인건비를, 아까 잠깐 말씀드렸지만 인건비도 과감하게 매칭해 줄 수 있는 그런 것도 도입해야 되지 않겠느냐, 라고 고민하고 있습니다.

아까 강기룡 국장님 말씀처럼 그런 부분에 있어 구체적인 것은 과기정통부든 국가AI위원회든 범부처적으로 준비를 할 테고 그때 다시 한번 조금 더 날카로운 질문을 해주시면 좋을 것 같습니다.

<답변> (사회자) 그럼 이상으로 질의·응답 시간 마치도록 하겠습니다. 감사합니다.

<답변> 고맙습니다.

<끝>
공공누리가 부착되지 않은 자료는 담당자와 협의한 후에 사용하여 주시기 바랍니다.
정책브리핑 공공누리 담당자 안내 닫기

이전다음기사

다음특허청 주간 홍보계획 브리핑

정책브리핑 게시물 운영원칙에 따라 다음과 같은 게시물은 삭제 또는 계정이 차단 될 수 있습니다.

  • 1. 타인의 메일주소, 전화번호, 주민등록번호 등의 개인정보 또는 해당 정보를 게재하는 경우
  • 2. 확인되지 않은 내용으로 타인의 명예를 훼손시키는 경우
  • 3. 공공질서 및 미풍양속에 위반되는 내용을 유포하거나 링크시키는 경우
  • 4. 욕설 및 비속어의 사용 및 특정 인종, 성별, 지역 또는 특정한 정치적 견해를 비하하는 용어를 게시하는 경우
  • 5. 불법복제, 바이러스, 해킹 등을 조장하는 내용인 경우
  • 6. 영리를 목적으로 하는 광고 또는 특정 개인(단체)의 홍보성 글인 경우
  • 7. 타인의 저작물(기사, 사진 등 링크)을 무단으로 게시하여 저작권 침해에 해당하는 글
  • 8. 범죄와 관련있거나 범죄를 유도하는 행위 및 관련 내용을 게시한 경우
  • 9. 공인이나 특정이슈와 관련된 당사자 및 당사자의 주변인, 지인 등을 가장 또는 사칭하여 글을 게시하는 경우
  • 10. 해당 기사나 게시글의 내용과 관련없는 특정 의견, 주장, 정보 등을 게시하는 경우
  • 11. 동일한 제목, 내용의 글 또는 일부분만 변경해서 글을 반복 게재하는 경우
  • 12. 기타 관계법령에 위배된다고 판단되는 경우
  • 13. 수사기관 등의 공식적인 요청이 있는 경우

히단 배너 영역

정책 NOW, MY 맞춤뉴스

정책 NOW

저출생 극복 나도 아이도 행복한 세상
정부정책 사실은 이렇습니다

MY 맞춤뉴스 AI 추천

My 맞춤뉴스 더보기

인기, 최신, 오늘의 영상 , 오늘의 사진

오늘의 멀티미디어

정책포커스