리벨리온 ‘금융권 특화’ NPU, 사피온코리아 국내 최초 상용화
퓨리오 ‘데이터센터’용, 딥엑스 ‘엣지’와 ‘서버’용, 모빌린트 ‘엣지 컴퓨팅’용
삼성·LG 등 선점 속 강소 테크기업들, 국제 벤치마크로 부터 ‘기술 인정’

NPU 기술 분야에서 강소 테크 기업들이 선전하고 있다. 사진은 반도체 칩. [한국전자통신연구원]
NPU 기술 분야에서 강소 테크 기업들이 선전하고 있다. 사진은 반도체 칩. [한국전자통신연구원]

[중소기업투데이 이상영 기자] 지금까지 인공지능 네트워크 연산에 사용되던 GPU나 CPU는 초대형 언어모델(LLM)을 기반으로 한 프로세서에서 연산 효율이 크게 떨어져 속도는 물론 에너지 효율도 반감되고 있다. 이에 최근엔 국내에서도 NPU(Neural Processing Unit, 신경망처리장치) 기술력이 향후 범용이 아닌 AI기술에 특화된 핵심기술로 꼽히고 있다.

특히 이 분야는 삼성전자나 LG전자, SK 등 대기업들이 주도하긴 하지만, 사피온, 리벨리온, 퓨리오사 등 중소기업들과 강소 스타트업들의 선전이 눈에 띄고 있다. 물론 이 중엔 대기업으로부터 분사한 기업도 있지만, 대부분 자체 R&D를 통해 CPU나 GPU를 대체할 독자적 NPU 기술을 확보한 경우도 적지 않다.

이들 중소기업들은 이미지 처리나 자연어 처리를 위한 AI 분야에서 저비용·고효율 극대화 차원에서 GPU를 대체하기 위해 치열하게 기술개발에 매진해왔다. 그 결과 일부 기업의 기술은 “엔비디아(Nvidia)보다 낫다”는 평가를 받을 정도로 섬세하고 강력한 것으로 알려졌다. 실제로 반도체 평가기구인 벤치마크에 의해 그 성능을 공인받기도 했다.

일부 강소 스타트업 “엔비디아보다 낫다” 평가도

그 중 SK텔레콤에서 분사한 사피온코리아는 NPU 펩리스 기업답게 국내 최초로 NPU 상용화를 달성했다. 2020년 고정소수점 연산 기반의 추론 전용 가속기로서, 8비트 정수 연산 환경에서 최대 100 TOPS(Tera Operations Per Second) 성능, 최대 65W 전력을 소비하는 국내 최초 서버용 AI상용 반도체인 X220을 출시했다. 2023년 11월에는 “세계 최고의 AI반도체”임을 강조하면서 추론 및 학습이 가능한 고성능 NPU X330을 개발하는데 성공했다.

리벨리온의 NPU칩. [리벨리온, 전자통신연구원]
리벨리온의 NPU칩. [리벨리온, 전자통신연구원]

서버용 NPU를 개발하는 펩리스 기업인 리벨리온도 지난 2021년 금융권의 하이 프리퀀시 트레이딩에 특화된 NPU인 아이온(ION)을 출시했다. 아이온은 응답시간의 최소화와 높은 처리량을 탑재, 매우 빈번하게 일어나는 금융권의 매매에 AI 기반 퀀트 기법을 적용한 금융권 전용 NPU다. 2023년에는 데이터센터용 NPU인 ‘아톰’(ATOM)을 출시했다.

아톰은 쌍방향 언어모델인 트랜스포머 계열 BERT를 지원하며 이미지 처리를 위한 CNN(계열의 모델도 지원한다. 이는 “공신력 높은 벤치마크인 MLPerf를 통해 퀄컴 및 엔비디아보다도 성능이 월등한 것으로 인정받았다”는 설명이다. 현재 KT 등과 협업, 상용화를 추진하고 있다.

퓨리오사는 데이터센터를 타깃으로 한 서버용 NPU HW 및 SW 기술을 집중 개발하고 있다. 2022년 하반기에 최대 64 TOPS의 데이터 처리 속도의 이미지 및 비디오 분석, 자율주행 도메인 등을 위한 ‘워보이’(Warboy)를 출시했다. 역시 벤치마크 MLPerf를 통해 우수한 성능을 인정받았다. 퓨리오사는 “소프트웨어 개발 키트(SDK)와 실제 활용을 위한 문서를 오픈소스로 배포, 시장을 점유하기 위해 노력하고 있다”고 전했다.

또 2세대 칩 개발에도 주력하고 있다. 챗GPT-3 등 언어 모델을 지원하는 고성능 저전력 반도체 ‘레니게이드’(Renagade)를 개발하고 있으며, LG AI 연구원과 협력, 생성AI 기술 탑재를 검증하고 있다.

<계속>

저작권자 © 중소기업투데이 무단전재 및 재배포 금지