中企, AI전략…‘파운데이션’ 모델로 대전환?
LLM 기반 GPT, 바드 출현 계기, 기존 AI모델링 전면 재검토 초대형 파라미터 파운데이션 모델 도입, ‘맞춤형 미세조정’으로 솔루션 개발
[중소기업투데이 조민혁 기자] 챗GPT나 바드와 같은 초대형 생성AI가 출현한 후 기업들의 AI전략도 급속한 변화를 맞고 있다. 특히 중소기업들은 과연 이런 대형언어모델(LLM) 기반의 AI모델을 어떤 방식으로 활용해야 할까를 두고 고민이 깊다.
전문가들은 일단 기존 오픈소스와는 달리 파운데이션 모델 기반에 맞는 전략을 강조하고 있다. 흔히 많은 기업들은 오픈소스 알고리즘을 기반으로 AI모델을 구축하는 경우가 대부분이다. 그러나 LLM기반의 파운데이션 모델이 등장하면서, 이젠 이에 필적할만한 AI모델을 구축한다는 것은 거의 불가능하다.
결국 GPT3.0나, 챗GPT의 원리인 GPT 3.5 등 초대형 LLM을 토대로 한 거대한 파운데이션 모델을 사용할 수 밖에 없게 된 것이다.
이에 새로 AI를 도입하는 경우는 물론, 기존 AI모델을 구축했던 기업들도 이같은 파운데이션 모델링에 걸맞은 AI전략을 구사할 필요가 있다. 실제로 챗GPT로 인해 AI 성능에 관한 대중의 눈높이가 높아진 만큼, 기존 AI를 사용 중이거나 향후 도입하려는 기업들은 자사의 AI 성능이 어느 정도 수준인지 고민하는 분위기다.
그 과정에서 중요해진 것이 초대형 언어모델 기반의 파운데이션 모델로의 일대 전환이다. 그렇다면 파운데이션 모델을 어떻게 이해하고, 이를 도입, 활용할 것인가.
파운데이션 모델은 적게는 수억, 많게는 수천억, 수조 단위의 데이터셋과 파라미터가 투입되는 초대형 생성 모델이다. 이를 기반으로 개별 기업들은 다시 자신의 용도에 맞게 미세조정, 각자의 맞춤형 AI모델을 구축하는 것이다.
최근의 GPT-3 기반의 챗GPT나 GPT-4도 그 대표적인 경우다. 한국지능정보사회진흥원은 “전형적인 파운데이션 모델인 GPT-3의 경우 개발 단계에서부터 미세조정(fine tuning)과는 거리가 멀다”고 강조한다.
대신에 간단한 최소한의 예제만을 제시하며 판단하게 하는 ‘퓨샷 러닝’ 수준, 혹은 프롬프트에 약간의 설명을 추가하는 정도의 ‘프롬프트 러닝’에 그친다. “심하게는 아예 아무런 예제도 주어지지 않는 ‘제로 샷 러닝’ 기법까지 적용한 수준”이란 얘기다.
한국지능정보사회진흥원은 “그럼에도 불구하고, 해당 모델이 전혀 학습해본 적이 없는 과업을 수행하거나, 그런 과제에 대한 답변과 해법을 제시하기까지 한다. 그야말로 “대규모 데이터 학습 능력을 기반으로 한 보편적인 데이터 이해 능력”이라고 종래 인공지능과의 현격한 차이점을 부각시키고 있다.
파운데이션 모델은 애초 방대한 데이터를 학습시키기 위해 GPU와 같은 하드웨어 장치가 필요하고, 병렬적인 학습을 가능하게 하는 트랜스포머 아키텍처를 사용하는게 보통이다. 또 고성능 컴퓨팅 기반의 대용량 학습데이터 구축과 학습능력, 자기지도학습 등을 통해 이른바 “‘창발성’과 ‘균일화’능력을 시현한다”는 것이다.
수 억 내지 수 십억 개의 매개변수(파라미터)를 생성할 능력이나 자금, 인적 역량도 없는 기업으로선 이같은 파운데이션 모델에 의존할 수 밖에 없다. 중소기업은 더욱 말할 나위도 없다.
KB금융지주경영연구소는 “이러한 시장 흐름과 전망 속에 파운데이션 모델 활용법에 대한 전략적 방향성을 고민할 필요가 있다”면서 “영세 기업이나 조직은 각자의 구체적인 용도에 맞게 ‘미세조정’만 하면 바로 사용할 수 있는 다목적 파운데이션 모델의 효용이 주목받고 있다.”고 전망했다.
GPT-4가 개발되는 등 초대형 생성형AI가 대중화되면서, 그 실용적 수단으로 파운데이션 모델이 관심을 받고 있는 것이다.
현재 대표적인 파운데이션 모델이라고 할 챗GPT의 경우 무료(GPT-3.5)와 유료(GPT-4) 22 버전을 각각 출시하고 있다. 반면에 ‘바드’는 무료다. 다만 종류와 버전에 따라 비용이 다르게 책정돼 있음을 유의해야 한다.
다만 개인 개발자나 기업은 API 형태의 서비스가 필요하므로, 챗GPT는 GPT-3, GPT-3.5, GPT-4 버전을 유료로 제공하고 있다. 그러나 ‘바드’는 아직 API형태로 제공하지 않고 있다. 또 챗GPT 역시 여기서 데이터를 추가로 학습시킬 수 있는 모델은 현재 GPT-3 버전 뿐이다.
GPT-3.5 API 모델은 영어단어 750여 개에 해당하는 1000토큰(token)당 0.002달러(약 2.7원)를 부과하고, GPT-4는 이보다 15배 많은 0.03/0.06달러(요청: 40원/ 응답: 80원)를 청구한다.
이에 기업들은 다양한 ‘경우의 수’를 고민해야 한다. 예를 들어 만약 외부의 검증된 모델(GPT, 바드 등 초대형 생성AI)을 도입한다면 ▲어떤 모델이 기업 사정에 맞는지 ▲어떤 데이터를 추가로 학습시킬 것인지 등을 먼저 고려해야 한다. 또 성능 평가는 어떤 기준으로 하고, AI모델에서 문제가 발생할 경우 어떤 식으로 대응할 것인지 등에 대한 고민이 필요하다.
그런 가운데 최근 파운데이션 모델 이용에 따른 기업의 내부정보 유출 논란이 국내외에서 발생하고 있다. 이에 SK나 삼성 등 국내 대기업들도 챗GPT를 극히 제한적으로 활용하는 경우가 많다. 중소기업들로선 이런 AI환경에도 주의를 기울여야 한다는 지적도 따르고 있다.
오픈AI측도 이런 점을 의식, 최근엔 기업의 데이터를 학습하지 않는 ‘챗GPT Business’ 같은 수정판을 출시하고 있다. 또 특정 기업만 독점적으로 사용할 수 있게 하는 ‘Private 챗GPT 클라우드 서비스’ 등을 개발, 출시를 앞두고 있다.
KB경영연구소는 "이밖에도 지적재산권 문제와 편향성, 그리고 정확성(할루시네이션, hallucination) 문제 등에 대해서도 사전 준비가 되어있어야 하고, 미세조정에 대한 경험과 역량을 쌓아나가는 것도 대단히 중요한 요소”라고 지적했다. 또 “깃허브(GitHub)26 등의 프로그램 소스 공유 플랫폼 등을 면밀하게 모니터링하며 AI 트렌드를 지속적으로 파악해야 할 것”이라고 권했다.