구글의 Gemini가 인터넷과 완전히 단절된 단일 서버에서 구동될 수 있게 됐습니다.
네오클라우드 사업자 Cirrascale Cloud Services는 구글 클라우드와의 파트너십을 확장해, Google Distributed Cloud를 통한 Gemini 온프레미스 배포 서비스를 발표했습니다.
이번 발표는 라스베이거스에서 열린 Google Cloud Next 2026에 맞춰 공개됐습니다.
그동안 금융·헬스케어·국방·정부 등 규제 산업의 기관들은 불가피한 선택 앞에 놓여 있었습니다.
강력한 AI 모델을 쓰려면 민감한 데이터를 퍼블릭 클라우드에 내줘야 했고, 그렇지 않으면 성능이 낮은 오픈소스 모델로 타협해야 했습니다.
이번 서비스는 Dell이 제조하고 구글이 인증한 하드웨어 어플라이언스에 Nvidia GPU 8개를 탑재한 형태로 제공됩니다.
기업이나 정부 기관은 이 서버를 Cirrascale의 데이터센터 또는 자체 시설에 배치해 인터넷과 구글 인프라로부터 완전히 단절된 환경에서 Gemini를 운용할 수 있습니다.
Driggers는 "완전한 Gemini이며 빠진 것이 없다"고 강조했습니다.
구글 자체의 프라이빗 인스턴스와 달리 이 서비스는 서버 한 대만으로도 시작할 수 있어, 거대한 규모의 투자를 요구했던 기존 방식보다 접근성이 크게 높아졌습니다.
보안 구조도 주목할 만합니다.
Gemini 모델은 영구 저장소가 아닌 휘발성 메모리에만 상주하기 때문에 전원이 꺼지는 순간 모델도 사라집니다.
사용자 세션 데이터 역시 세션 종료 시 자동으로 삭제되는 것이 기본값입니다.
누군가 어플라이언스를 물리적으로 변조하려 할 경우에는 기밀 컴퓨팅 위반 마커가 기록되며 기기가 즉시 작동 불능 상태가 됩니다.
하드웨어를 물리적으로 소유하더라도 모델의 가중치를 추출하거나 들여다볼 수 없는 구조입니다.
구글이 새 버전의 Gemini를 출시할 때는 전용 프라이빗 채널을 통한 일시적 연결로 업데이트할 수 있으며, 외부 연결이 절대 불가한 환경을 위해서는 새 모델이 탑재된 서버로 물리적 교체하는 옵션도 제공합니다.
수요는 금융권에서 가장 강하게 나타나고 있습니다.
규제 요건상 데이터 위치를 스스로 통제해야 하는 기관들이 대표적입니다.
신약 개발, 의료 데이터, 공공 연구기관, 그리고 GCP 데이터센터가 없는 국가에서 데이터 국외 반출이 불가능한 기업들도 주요 타깃입니다.
아울러 퍼블릭 API의 불안정한 응답 속도 문제도 해소됩니다.
관리 소프트웨어를 통해 사용자 우선순위 지정, 역할별 토큰 배분, 컨텍스트 윈도우 크기 조정, 다중 어플라이언스 간 부하 분산이 가능하며, 에이전트 AI 워크로드는 피크 외 시간대의 유휴 용량을 활용할 수 있습니다.
가격은 좌석 기반 라이선스, 토큰 단위 과금, 어플라이언스당 무제한 정액제 중 선택할 수 있으며, 어플라이언스는 고객 간에 공유되지 않습니다.
하드웨어를 직접 구매하면서 Gemini는 매니지드 서비스로 이용하는 방식도 가능합니다. CapEx, OPEX, 고용 개발의 혼합 투자를 요구하는 정부 자금 지원 기관에도 대응할 수 있습니다.
서비스는 현재 프리뷰 단계에 돌입했으며 일반 출시는 6~7월로 예정돼 있습니다.
업계 전망에 따르면 2027년까지 AI 모델 학습 및 추론의 40%가 퍼블릭 클라우드 외부에서 이뤄질 것으로 예상됩니다.