샤오미가 자사 플래그십 AI 모델 '미모-V2.5(MiMo-V2.5)' 시리즈의 API 가격을 최대 99%까지 영구 인하한다고 27일(현지시간) 발표했습니다.
이번 개편에서는 컨텍스트 길이에 따라 달랐던 복잡한 과금 체계를 폐지하고 모든 구간에 단일 요금을 적용합니다.
토큰 요금제도 개편해 같은 금액으로 기존보다 5~8배 많은 토큰을 쓸 수 있게 됩니다.
고성능 추론 모델인 '미모-V2.5-프로'는 입력 캐시 적중 비용이 100만 토큰 기준 최대 2.80위안에서 0.025위안으로 낮아졌고, 일반형 '미모-V2.5'도 입출력 가격이 최대 98% 인하됩니다.
음성합성 모델 '미모-V2.5-TTS'는 한시적 무료 정책을 이어갑니다.
특히 인하된 가격이 딥시크-V4 프로(입력 100만 토큰당 3위안, 출력 6위안)와 사실상 동일한 수준으로 책정됐다는 점이 주목됩니다.
개발자 입장에서는 추가 비용 부담 없이 두 모델을 자유롭게 전환할 수 있게 된 셈입니다.
샤오미 측은 가격 인하의 배경으로 추론 최적화와 서비스 효율 개선을 꼽았으며, 미모-V2.5는 전체 1조 개 이상의 매개변수 중 일부만 활성화하는 전문가 혼합(MoE) 구조를 채택해 추론 비용을 낮췄습니다.
한편 중국 AI 시장에서는 저가 경쟁과 프리미엄 전략이 동시에 나타나는 양극화 현상도 뚜렷해지고 있습니다.
알리바바 클라우드, 바이트댄스, 샤오미, 딥시크 등 대형 플랫폼 기업들은 저가 전략으로 사용자 확보에 집중하는 반면, 지푸 AI와 문샷 AI 등은 오히려 가격을 올리며 고성능 기업 시장을 겨냥하고 있습니다.
지푸는 올해 1분기 API 가격을 누적 83% 인상했음에도 기업 문의가 400% 늘었다고 밝혔는데, 이는 복잡한 작업일수록 단순 토큰 단가보다 '작업 성공률'이 더 중요해졌기 때문으로 분석됩니다.
실제로 지난 1년간 기업용 대형 모델의 토큰 호출 비용은 평균 67% 하락했으며, 오픈소스 모델의 기업 시장 점유율도 빠르게 늘고 있습니다.
이에 따라 기업 고객들은 단순 반복 작업에는 저가 모델을, 고난도 추론 작업에는 프리미엄 모델을 활용하는 멀티 모델 라우팅 전략을 채택하는 추세로 이어질 것으로 보입니다.
만들어진 자료도 다 가져가겠지만서도요...;;