EN / ES / HU
startup

DiffusionGemma de Google genera 256 tokens en paralelo y se autocorrige a medida que avanza.

Fuente: venturebeat.com 1 min de lectura

Compartir

DiffusionGemma de Google genera 256 tokens en paralelo y se autocorrige a medida que avanza.

Estás leyendo un resumen. El contenido completo está en venturebeat.com.

Google lanzó DiffusionGemma, un modelo de lenguaje de código abierto basado en difusión, construido sobre Gemma 4 y compatible con vLLM, que genera 256 tokens en paralelo para una inferencia más rápida con baja concurrencia. Las pruebas de rendimiento muestran tasas de tokens en GPU entre 4 y 6 veces superiores, pero Google afirma que la calidad de salida es inferior a la de Gemma 4 estándar y que las mejoras disminuyen en el procesamiento por lotes de alto rendimiento.

Leer el artículo completo en el sitio original

Enlace externo a venturebeat.com

Artículos relacionados