devops

Az Inference Alpha: A Frontier modellek maximalizálása AMD-n

Közzétéve: 2026. június 10. Forrás: digitalocean.com 1 perc olvasás

Megosztás

Az Inference Alpha: A Frontier modellek maximalizálása AMD-n

Összefoglalót olvas. A teljes tartalom itt érhető el: digitalocean.com.

A DigitalOcean jelentős következtetési sebességnövekedésről számolt be az AMD MI350X/MI355x GPU-kon futó, határterületi LLM-ek esetében a Wafer-támogatású, egyéni kernel- és stack-optimalizálások használatával. A Kimi 2.5 sebessége 22,5-ről 255,2 tok/s-ra nőtt, a DeepSeek V3.2 javította az egyszeres és egyidejű átviteli sebességet, a 774B GLM-5 pedig 151,1 tok/s sebességet ért el 17,8 ms ITL-lel egyetlen 8 GPU-s csomóponton.

A teljes cikk az eredeti weboldalon

Külső link: digitalocean.com

Kapcsolódó cikkek

devops

A 7.1-es kernel kiadásra került.

1 min read •

devops

A Xiaomi MiMo Code állítása szerint a Claude Code-ot több mint 200 lépésben is felülmúlja.

1 min read •

devops

Milyen információkat nem tudnak megadni a naplófájlok, amikor egy mesterséges intelligencia önállóan működik.

1 min read •