devops

Inference Alpha: Maximizando los modelos de frontera en AMD

Publicado: 10 de junio de 2026 Fuente: digitalocean.com 1 min de lectura

Estás leyendo un resumen. El contenido completo está en digitalocean.com.

DigitalOcean informa de importantes mejoras en la velocidad de inferencia para los LLM de vanguardia en las GPU AMD MI350X/MI355x mediante optimizaciones de kernel y pila personalizadas asistidas por Wafer. Kimi 2.5 pasó de 22,5 a 255,2 tok/s, DeepSeek V3.2 mejoró el rendimiento individual y concurrente, y 774B GLM-5 alcanzó los 151,1 tok/s con un ITL de 17,8 ms en un nodo de 8 GPU.

Leer el artículo completo en el sitio original

Enlace externo a digitalocean.com

El núcleo 7.1 ha sido lanzado.

1 min read •

devops

El código MiMo de Xiaomi afirma que supera a Claude Code después de 200 pasos.

1 min read •

devops

Lo que tus registros no pueden decirte cuando un agente de inteligencia artificial actúa de forma autónoma.

1 min read •

Artículos relacionados

El núcleo 7.1 ha sido lanzado.

El código MiMo de Xiaomi afirma que supera a Claude Code después de 200 pasos.

Lo que tus registros no pueden decirte cuando un agente de inteligencia artificial actúa de forma autónoma.