EN / ES / HU
architect

Experimentando con TPUs, GKE Managed DRANET y Multi-cluster Inference Gateway

Fuente: cloudblog.withgoogle.com 1 min de lectura

Compartir

Experimentando con TPUs, GKE Managed DRANET y Multi-cluster Inference Gateway

Estás leyendo un resumen. El contenido completo está en cloudblog.withgoogle.com.

Un experimento en Google Cloud despliega la carga de trabajo de inferencia Gemma 3 en dos clústeres regionales de GKE usando TPU v6e, Cloud Storage FUSE, DRANET gestionado y un Inference Gateway multi-clúster. Prueba el enrutamiento entre regiones hacia la región más cercana y el conmutamiento automático al segundo clúster cuando una región cae.

Leer el artículo completo en el sitio original

Enlace externo a cloudblog.withgoogle.com

Artículos relacionados