제미나이 3 효과… 구글 TPU, 비용·전력 효율로 재조명
엔비디아 독점구도 흔들려… 글로벌 기업들 ‘대안 칩’ 검토 확산
AWS·메타·MS 등 빅테크 중심 GPU 의존도 분산 전략 확산
국내 기업도 비용 절감 위해 칩·클라우드 다변화 가속
[중소기업투데이 황복희 기자]
구글의 차세대 AI 모델 ‘제미나이 3(Gemini 3)’가 글로벌 시장에서 호평을 받으며, 이를 기반으로 학습·추론을 처리하는 구글의 AI 전용 칩 ‘TPU(Tensor Processing Unit)’ 생태계가 다시 주목받고 있다. 최근 세계 AI 연산 시장이 엔비디아 GPU 중심에서 비용·전력 효율을 중시하는 흐름으로 이동하면서, TPU는 기업들이 선택할 수 있는 현실적 대안 플랫폼으로 부상하고 있다는 평가다.
제미나이 3는 텍스트·이미지·코드·멀티모달 기능 등 핵심 영역에서 성능이 전반적으로 향상되며, 기업 고객 사이에서 구글 클라우드 기반 AI 활용도가 점차 늘어나는 모습이다. 이는 곧 TPU 사용 확대와도 직결된다. 구글은 TPU v4에 이어 TPU v5e·v5p 등 최신 세대를 데이터센터에 적용하며 비용 대비 성능을 강화해왔고, 이러한 전략이 제미나이 모델의 흥행과 함께 효과를 발휘하고 있다는 분석이다.
업계에서는 제미나이 3의 높은 효율성 덕분에 TPU 기반 학습·추론의 가격 경쟁력이 더욱 부각되고 있다고 본다. 실제로 일부 글로벌 기업 고객은 GPU 중심의 단일 플랫폼에서 벗어나 AI 연산 비용 절감을 위한 ‘대체 연산 옵션’을 검토하는 사례가 나타나고 있다. 이는 GPU 공급 부족과 비용 부담이 누적된 최근 시장 환경을 고려할 때 자연스러운 흐름으로 해석된다.
AI 칩 시장은 그동안 엔비디아가 절대 강자로 자리 잡았지만, 최근 경쟁 구도는 빠르게 다변화하고 있다. 아마존은 자체 AI 칩 ‘트레이니움’과 ‘인퍼런스’를 활용해 클라우드 고객의 비용 절감에 적극 나서고 있고, 메타와 마이크로소프트도 대규모 AI 운영 비용을 낮추기 위한 자체 AI 칩 개발을 속도감 있게 진행하고 있다. 여기에 오픈AI까지 특정 작업에 최적화된 ASIC(전용 칩) 가능성을 타진하는 등, 각 기업이 자사의 서비스 특성에 맞는 독립적 AI 인프라 전략을 마련하는 단계에 치닫고 있다.
이 같은 상황에서 구글 TPU는 기존의 강점인 대규모 분산 처리 구조와 전력 효율, 그리고 클라우드와 긴밀히 통합된 환경을 바탕으로 시장 내 위상을 다시 넓혀가고 있다. 특히 TPU는 구글 데이터센터에 최적화된 설계를 기반으로, 대규모 모델 학습에서 높은 처리 효율을 유지하면서도 비용 절감 효과를 제공한다는 점에서 기업들에게 매력적인 선택지로 꼽힌다.
전문가들은 향후 AI 산업의 경쟁이 단순히 모델 성능을 둘러싼 경쟁을 넘어, ‘AI 모델–칩–클라우드’가 유기적으로 맞물린 삼각 구도로 진화할 것으로 전망한다. 제미나이 3의 성능 향상이 TPU의 활용도를 높이고, TPU의 확산은 다시 구글 클라우드 생태계 확장으로 연결되는 선순환 구조가 본격적으로 자리 잡을 가능성이 크다는 분석이다. 여기에는 AI 서비스의 규모가 커질수록 비용·속도·전력 등 운영 효율이 기업의 핵심 판단 기준으로 떠오르는 시장 환경도 한몫하고 있다.
업계 관계자는 “엔비디아가 여전히 기술적 우위를 갖고 있으나, AI 산업 전반에서 비용 절감 요구가 극대화되면서 대안 연산 플랫폼이 필연적으로 확대되고 있다”며 “TPU가 그런 흐름 속에서 다시 경쟁력을 확보하고 있다”고 평가했다.
AI 칩 시장이 빠르게 다극화하는 가운데, 구글 TPU는 엔비디아 중심 생태계에 균열을 만드는 대표적인 대안 플랫폼으로 자리매김하고 있으며, 향후 AI 인프라 선택 기준이 다양해질수록 TPU 활용 폭도 더 넓어질 것으로 전망된다.
