devops
Kilo añade un sistema de evaluación comparativa para identificar los modelos de IA más eficientes para la codificación.
Fuente:
devops.com 1 min de lectura
Compartir
Estás leyendo un resumen. El contenido completo está en devops.com.
Kilo ha puesto a disposición hoy un marco de evaluación comparativa para su agente de inteligencia artificial (IA) de código abierto que permite a los equipos de desarrollo de aplicaciones generar código utilizando múltiples modelos. El director ejecutivo de la compañía, Scott Breitenother, afirmó que KiloBench mide el impacto que los modelos de IA de vanguardia tienen en los flujos de trabajo de producción reales, en comparación con el uso de un conjunto de pruebas comparativas, como SWE-bench […]
Leer el artículo completo en el sitio original
Enlace externo a devops.com