startup
A kontextustömörítés végre működik éles környezetben: egy új kutatás 16-szorosára csökkenti az LLM bemenetét a pontosság romlása nélkül
Forrás:
venturebeat.com 1 perc olvasás
Megosztás
Összefoglalót olvas. A teljes tartalom itt érhető el: venturebeat.com.
A kutatók látens kontextus nyelvi modelleket (Latent Context Language Model) javasoltak, amelyek olyan kódoló-dekódoló tömörítők, amelyek a dekóder előtöltése előtt zsugorítják a bemeneti kontextust a memória és a számítási kapacitás csökkentése érdekében. A tanulmány akár 16-szoros tömörítésről és 8,8-szor gyorsabb kimenetről számol be a RULER KV-gyorsítótár alapverzióihoz képest, kisebb pontosságcsökkenéssel, mint más módszerek, és a modellek nyílt forráskódúak a HuggingFace-en.
A teljes cikk az eredeti weboldalon
Külső link: venturebeat.com
Kapcsolódó cikkek
startup
Tudósok figyelmeztetnek: egy népszerű ízületi kiegészítő felgyorsíthatja a kognitív hanyatlás kockázatát – itt van, mit kell tudni.
1 min read •
startup
Dél-Korea filmipiacának nehézségei, az AI segítségét keresik.
1 min read •
startup
Források: Charlie Javice, a Frank társaság alapítója, akit 2025 szeptemberében 85 hónapos börtönbüntetésre ítéltek a JPMorgan Chase-től való csalás miatt, Trump elnöktől kérvényezte a kegyelmet (Wall Street Journal).
1 min read •