architect
Experimentando con TPUs, GKE Managed DRANET y Multi-cluster Inference Gateway
Fuente:
cloudblog.withgoogle.com 1 min de lectura
Compartir
Estás leyendo un resumen. El contenido completo está en cloudblog.withgoogle.com.
Un experimento en Google Cloud despliega la carga de trabajo de inferencia Gemma 3 en dos clústeres regionales de GKE usando TPU v6e, Cloud Storage FUSE, DRANET gestionado y un Inference Gateway multi-clúster. Prueba el enrutamiento entre regiones hacia la región más cercana y el conmutamiento automático al segundo clúster cuando una región cae.
Leer el artículo completo en el sitio original
Enlace externo a cloudblog.withgoogle.com
Artículos relacionados
architect
La propuesta del estándar WebMCP para la activación web agencial ya está disponible en Chrome (pruebas de Origin).
1 min read •
architect
Slack elimina SSH en las canalizaciones de EMR y migra más de 700 trabajos a una arquitectura basada en REST.
1 min read •
architect
El giro digital: cómo HSS transformó la contratación con IA proactiva
1 min read •