
'파운데이션(Foundation) 모델'부터 시작해 보자. '파운데이션'은 '기반'을 뜻한다. 모델은 뭘까? '모델하우스'란 말을 떠올리면 쉽다. 현실 세계의 복잡한 현상을, 수학적이고 논리적으로 추상화해서 구현했다는 뜻이다. 파운데이션 모델은 '방대한 데이터를 통해 세상의 패턴을 학습한 다음, 그것에 관해 질문하면 지능적인 답을 내놓는' 거대 AI 모델을 말한다. 그 분야에 관해 두루 잘 기능한대서 기반 모델이다.
'독자'는 우리가 스스로 이걸 만든다는 뜻이다. 이 셋을 합하면 '독자 파운데이션 모델'은 우리가 우리 힘으로 (세계 최고 수준의) 거대 AI 모델을 만들자는 것이다.
'독파모(독자 파운데이션 모델)'는 오는 2027년까지 세계 최고 수준의 거대언어모델(LLM)과 멀티모달(여러 개의 모드를 가진 것, 언어뿐 아니라 그림, 동영상 등을 처리할 수 있는 모델을 말한다) 모델을 확보하자는 국가 프로젝트다.
5개 정예 팀을 선발해 최신 그래픽처리장치(GPU)를 비롯해 연구개발을 지원해 준다. 단계마다 한 팀씩을 떨어트리고 마지막 남은 2팀에는 수천 장의 최신 GPU를 몰아준다. 결과물은 '오픈 웨이트(가중치 공개)'로 공개해 누구나 쓸 수 있게 한다.

독파모를 개발하려면 어떻게 하면 될까. 엔비디아 CEO 젠슨 황의 말을 들어보자. 지난 21일 스위스 다보스에서 열린 세계경제포럼에서 그는 AI를 '5단 레이어 케이크'에 비유했다. 에너지, 칩과 컴퓨팅 인프라, 클라우드 데이터센터, AI 모델, 그리고 궁극적으로 애플리케이션 레이어로 구성된 구조라는 것이다.
독파모는 이중 에너지를 제외한 넷을 목표로 한다. 단순히 모델만 만들자는 게 아니다. 젠슨 황의 말처럼 AI는 원래 이렇게 다섯 계층으로 이뤄져 있기 때문이다. 다음과 같다.
AI 풀스택 생태계
• 인프라 및 하드웨어층: AI 반도체, AI 데이터센터, 초고속네트워크분산컴퓨팅 최적화/저전력 고효율 설계/국산 칩 생태계
• 데이터 파운데이션층: 데이터 수집, 정제 및 레이블링, 합성데이터 생성데이터 큐레이션/저작권 및 윤리 가이드라인/멀티모달 정렬
• 모델 훈련 및 최적화층: 모델 아키텍트 설계, 사전학습, 미세조정모델 아키텍터 원천기술/학습효율화/각 억제
• 추론 및 서비스층: MLOps(AI 운영 자동화)/경량화/API 서비스실제 AX 경험(가전, 조선, 물류…)/실시간 서비스 최적화
독파모가 'from scratch(바닥부터 제대로)'를 원칙으로 하는 건 이 때문이다. 그래야 인프라부터 서비스 단계까지 풀스택 생태계를 아우를 수 있다.
인프라를 예로 들어보자. GPU를 이 팀에 4개, 저 팀에 4개를 할당했다고 하자. 그러면 분명히 어떤 때는 이 팀 GPU는 노는데, 저 팀 GPU가 모자라고, 어떤 땐 다 모자라는 일이 생길 것이다.
만약 실시간으로 GPU 자원을 재할당해 줄 수 있다면, 즉 고성능 GPU 하나를 다수의 사용자가 나눠 쓰거나, 반대로 다수의 GPU를 하나로 묶어 쓰는 일을 실시간으로 해줄 수 있으면 효율이 엄청나게 올라갈 것은 쉽게 알 수 있다. 이런 'GPU 분할 및 동적 할당' 기술이 함께 발전해야 AI 개발을 제대로 할 수 있다.
같은 일을 절반의 전기만 쓰고도 해줄 수 있는 AI 칩을 만들 수 있다면 역시 효율이 크게 올라갈 것이다. 같은 전기료로 2배의 칩을 돌릴 수 있기 때문이다. AI개발 시간의 80%는 데이터 정제에 들어간다고 한다. 데이터 처리 기술이 크게 올라간다면 역시 경쟁력이 높아질 것이다. 만든 다음에 즉시 서비스에 투입해 검증해 볼 수 있으면 역시 경쟁력이 높아질 것이다.
독파모가 LG, 업스테이지, SKT, 네이버, 엔씨와 같은 모델개발회사만 뽑지 않은 게 그 때문이다. 인프라와 하드웨어의 퓨리오사, 리벨리온, 래블업, 데이터의 플리토, 셀렉트스타, 에이아이웍스, 라이너, 네이버, 서비스와 산업 확산의 한글과컴퓨터, 올거나이저, 포스코, 롯데, 크래프톤, 포티투닷이 모두 '독파모'다.
여기에 대학교를 모든 팀에 필수로 포함시켰다. 대규모 GPU 클러스터를 활용해 1000억 개 이상의 매개변수를 가진 모델을 직접 학습시켜 본 경험은 도저히 책으로 배울 수 없기 때문이다.


'독파모'는 대한민국이 세계 최고의 AI 생태계를 갖기 위한 시도다. 이런 풀스택에 도전할 수 있는 나라는 전 세계에서 몇이 안 된다. 한국은 그 자격을 갖춘 드문 곳중 하나다. '독파모' 프로젝트가 시작한 지 4개월 만에 전 세계 Top 20에 한국 모델이 몇이나 들어갔다. '주목할 만한 모델'에는 5개 모델이 발표와 동시에 모두 포함됐다. 올해 말에 어떤 모델이 나올지 기대를 걸어볼 만하다. 우리는 충분히 할 수 있다.
◆ 박태웅 녹서포럼 의장
한빛미디어 이사회 의장을 비롯해 KTH, 엠파스 등 IT 업계에서 오래 일했으며 현재 녹서포럼 의장으로 활동하고 있다. IT산업발전에 기여한 공로로 2021년 동탑산업훈장을 수훈했다. 저서로는 <눈 떠보니 선진국>, <박태웅의 AI 강의> 등이 있다.
문의처 : 문화체육관광부 정책포털과
| 뉴스 |
|
|---|---|
| 멀티미디어 |
|
| 브리핑룸 |
|
| 정책자료 |
|
| 정부기관 SNS |
|
※ 브리핑룸 보도자료는 각 부·처·기관으로부터 연계로 자동유입되는 자료로 보도자료에 포함된 연락처로 문의
※ 전문자료와 전자책의 이용은 각 자료를 발간한 해당 부처로 문의
- 제136조(벌칙)
-
① 다음 각 호의 어느 하나에 해당하는 자는 5년 이하의 징역 또는 5천만원 이하의 벌금에 처하거나 이를 병과할 수 있다. <개정 2011. 12. 2.>
1. 저작재산권, 그 밖에 이 법에 따라 보호되는 재산적 권리(제93조에 따른 권리는 제외한다)를 복제, 공연, 공중송신, 전시, 배포, 대여, 2차적저작물 작성의 방법으로 침해한 자
2. 제129조의3제1항에 따른 법원의 명령을 정당한 이유 없이 위반한 자 -
②다음 각 호의 어느 하나에 해당하는 자는 3년 이하의 징역 또는 3천만원 이하의 벌금에 처하거나 이를 병과할 수 있다. <개정 2009. 4. 22., 2011. 6. 30., 2011. 12. 2.>
1. 저작인격권 또는 실연자의 인격권을 침해하여 저작자 또는 실연자의 명예를 훼손한 자
2. 제53조 및 제54조(제90조 및 제98조에 따라 준용되는 경우를 포함한다)에 따른 등록을 거짓으로 한 자
3. 제93조에 따라 보호되는 데이터베이스제작자의 권리를 복제ㆍ배포ㆍ방송 또는 전송의 방법으로 침해한 자
3의2. 제103조의3제4항을 위반한 자
3의3. 업으로 또는 영리를 목적으로 제104조의2제1항 또는 제2항을 위반한 자
3의4. 업으로 또는 영리를 목적으로 제104조의3제1항을 위반한 자. 다만, 과실로 저작권 또는 이 법에 따라 보호되는 권리 침해를 유발 또는 은닉한다는 사실을 알지 못한 자는 제외한다.
3의5. 제104조의4제1호 또는 제2호에 해당하는 행위를 한 자
3의6. 제104조의5를 위반한 자
3의7. 제104조의7을 위반한 자
4. 제124조제1항에 따른 침해행위로 보는 행위를 한 자
5. 삭제 <2011. 6. 30.>
6. 삭제 <2011. 6. 30.>
이전다음기사
정책브리핑 게시물 운영원칙에 따라 다음과 같은 게시물은 삭제 또는 계정이 차단 될 수 있습니다.
- 1. 타인의 메일주소, 전화번호, 주민등록번호 등의 개인정보 또는 해당 정보를 게재하는 경우
- 2. 확인되지 않은 내용으로 타인의 명예를 훼손시키는 경우
- 3. 공공질서 및 미풍양속에 위반되는 내용을 유포하거나 링크시키는 경우
- 4. 욕설 및 비속어의 사용 및 특정 인종, 성별, 지역 또는 특정한 정치적 견해를 비하하는 용어를 게시하는 경우
- 5. 불법복제, 바이러스, 해킹 등을 조장하는 내용인 경우
- 6. 영리를 목적으로 하는 광고 또는 특정 개인(단체)의 홍보성 글인 경우
- 7. 타인의 저작물(기사, 사진 등 링크)을 무단으로 게시하여 저작권 침해에 해당하는 글
- 8. 범죄와 관련있거나 범죄를 유도하는 행위 및 관련 내용을 게시한 경우
- 9. 공인이나 특정이슈와 관련된 당사자 및 당사자의 주변인, 지인 등을 가장 또는 사칭하여 글을 게시하는 경우
- 10. 해당 기사나 게시글의 내용과 관련없는 특정 의견, 주장, 정보 등을 게시하는 경우
- 11. 동일한 제목, 내용의 글 또는 일부분만 변경해서 글을 반복 게재하는 경우
- 12. 기타 관계법령에 위배된다고 판단되는 경우
- 13. 수사기관 등의 공식적인 요청이 있는 경우







