[칼럼] ‘딥시크’에 감춰진 서사
박경만 객원 편집위원(전 한서대교수)
딥시크 충격이 어느 정도 가시면서 갖가지 뒷담화가 쏟아지고 있다. “80억원만 들었겠느냐, V3가 나오기까지 V1, V2를 더하면 그 수십 배는 될 것”이라고도 한다. “오픈AI 콘텐츠를 베끼고 증류했을 것”이라는 고발도 있었고, 추측인지 억측인지 모르나 “첨단 A100 칩 5만개는 갖고 있을 것”이라는 얘기도 나돈다. 따지고 들면 딥시크는 기획과 생성 모두가 ‘일탈’의 연속이어서 흠잡을데도 많다. 약탈적인 정보 수집, 보안에 대한 무신경, 타이핑 습관으로 개인의 신상을 수집하는 위험천만의 근성까지 갖췄다. 우리나라를 포함한 주요국들이 앞다퉈 접속을 멀리하려는 것도 그런 이유다.
그럼에도 딥시크의 존재감은 희석되지 않는다. 오히려 정상과학을 대체할 ‘비정상과학’의 아우라를 유감없이 보여주고 있다. 특히 개발에 얽힌 딥시크의 서사는 꽤나 사무쳐보인다. 스타트업 ‘딥시크’란 회사, 아니 중국 자체가 A100·H100 같은 최고급 칩도 드물고, 기술도 미국보다 한 수 아래다. 새삼 대단한 기술을 작심하고 발굴하는 건 역부족이었다. 그런 결핍을 그들은 ‘기본’으로 메꿔나갔다. 무심한 관찰 속에 봉인되었던 일상의 원료에서 비결을 찾았고, 경험을 재활용했다. 그 결과 전혀 다른 기술행위를 추상(抽象)해낼 수 있었다. MoE(Mixture of Experts)나 멀티토큰이 그런 것들이다. MoE와 유사하고, 메타도 시도했던 BTX(Brain Train Mix)도 첨가하지 않았을까 싶다.
MoE는 챗GPT나 제미니처럼 어마어마한 매개변수를 모두 구동할 필요가 없다. ‘전문가’에 비유되는, 특화된 모듈만 골라 필요한 곳에 투입하는 방식이다. 현장 용어로 다층퍼셉트론(MLP)이나, 합성곱 신경망(CNN), 트랜스포머 등이 그런 것들이다. 쉽게 말해 ‘전문가’들의 분업으로 돈 적게 들이고 성능은 한껏 높인 것이다. 단어를 하나씩 읽어들이는 대신, 통문장을 한 번에 처리하는 멀티토큰 방식도 가미했다. 거기에다 14억 인구의 행동 방식과 동선을 천문학적 로데이터(Raw Data)로 삼아, 지구촌 최대의 로직퍼즐을 조직했다. 방대한 컴퓨팅자원과 데이터센터로 ‘쩐의 전쟁’을 벌여온 실리콘밸리의 발상과는 정반대다. 그렇게 주입하고, 생성해낸 ‘인공의 지능’은 말 그대로 정치(精緻)함의 극치다. 수학과 계산언어학, 데이터과학의 원리를 한 땀 한 땀 손으로 이식했나 싶을 정도다.
오픈AI와 같은 기왕의 AI 기득권층은 늘 기술적 ‘초월’을 자부한다. 그래서 항상 새롭게 초월된 기술담론을 생성함을 자랑한다. 그러나 사실은 꼭 그렇지만은 않다. 거칠게 말하면, 단지 매개변수와 데이터의 부피를 늘려오며 버전을 높여온 경우가 많다. 오픈AI가 분을 참지못했듯이, 딥시크는 챗GPT 콘텐츠를 거리낌없이 커닝했다. 아예 프롬프트까지 통째로 베끼기도 했다. 그래도 사용자들은 크게 탓하지 않는다. 그 보단 MoE로 머신러닝의 또 다른 효용을 발굴하고, 멀티코인을 채용한 주체적 경험에 정작 시선이 쏠리고 있다. 마치 예술사에서 원근법의 환영(幻影)을 삭제하고, 명암법이 성취한 안정적 입체감을 파괴한 것 같다고나 할까. 딥시크 R1, V3는 그렇게 ‘피카소’의 반란을 떠올릴 정도다.
애초 딥시크는 미국 기업의 엄청난 컴퓨팅 파워와는 달리, 돈이 덜 드는 강화학습에 의존했다. 사전 지도학습이 없다보니 첫 시발점은 약간의 콜드 데이터만으로 족했다. 이런 초기의 콜드 데이터를 바탕으로 AI에게 생각하는 능력, 즉 ‘코기토’(Cogito)의 유전자를 주입했다. 한번 심어진 ‘코기토’로 스스로 세상을 감각하고 규정하며 저작(著作) 행위를 할 수 있고, 프롬프트가 반복될 때마다 더 똑똑해지도록 했다. “하나를 가르치면 열을 깨치는”, 상상과 창조의 알고리즘이 가능해졌다.
중국은 그런 독창적인 추상 능력을 국산화하는데 성공했다. 새로운 발상과 기술로 충만한 ‘제2의 자연’을 야기(惹起)해낸 것이다. 챗GPT 등과 달리 지도학습을 생략했다곤 하지만, 천재적 엔지니어들의 ‘지도’로 정밀한 서브모델을 구슬꿰듯 엮어냈다. 미국과 서방세계로선 낯설 수 밖에 없다. 그래서 경계심은 더욱 높아가고, 접속 차단과 ‘사용금지’ 딱지도 늘어만 간다. 아이러니하게도 그럴수록 국내 사용자도 늘어나, 벌써 챗GPT 다음으로 2위에 올랐다. 게다가 애써 구축한 모델을 오픈소스로 개방했다. 만천하에 대고 “그냥 갖다써도 좋다”고 선언한 것이다. 자신감을 넘어 교학적 오만까지 읽힌다고 할까. 그런 거침없는 행보의 진짜 속셈이 뭔가 싶고, 한편으론 두렵기까지 하다.