startup
La compresión de contexto finalmente funciona en producción: una nueva investigación reduce la entrada de LLM 16 veces sin afectar la precisión.
Fuente:
venturebeat.com 1 min de lectura
Compartir
Estás leyendo un resumen. El contenido completo está en venturebeat.com.
Los investigadores propusieron modelos de lenguaje de contexto latente, compresores codificador-decodificador que reducen el contexto de entrada antes del prellenado del decodificador para ahorrar memoria y recursos computacionales. El artículo reporta una compresión de hasta 16x con una velocidad de salida 8,8 veces mayor que los métodos de referencia de caché KV en RULER, con una menor pérdida de precisión que otros métodos, y los modelos son de código abierto y están disponibles en HuggingFace.
Leer el artículo completo en el sitio original
Enlace externo a venturebeat.com
Artículos relacionados
startup
Científicos advierten que un suplemento alimenticio popular para las articulaciones podría acelerar el riesgo de deterioro cognitivo: aquí tiene lo que debe saber.
1 min read •
startup
La industria cinematográfica surcoreana, que atraviesa dificultades, recurre a la inteligencia artificial en busca de soluciones.
1 min read •
startup
Según fuentes, Charlie Javice, fundadora de Frank y condenada en septiembre de 2025 a 85 meses de prisión por defraudar a JPMorgan Chase, ha estado buscando un indulto presidencial de Trump (Wall Street Journal).
1 min read •