EN / ES / HU
startup

A kutatók azt mondják, hogy egy alapmodellt a nulláról képeztek ki körülbelül 1500 dollárért.

Forrás: venturebeat.com 1 perc olvasás

Megosztás

A kutatók azt mondják, hogy egy alapmodellt a nulláról képeztek ki körülbelül 1500 dollárért.

Összefoglalót olvas. A teljes tartalom itt érhető el: venturebeat.com.

A Sapient HRM-Text rendszere a Transformerst egy hierarchikus, rekurrens modellel helyettesíti, amelyet csak utasítás-válasz párokon képeznek ki, csökkentve az előképzési költségeket és az adatigényt. Egy 40B tokenen képzett 1B paraméteres modell állítólag megegyezett vagy meghaladta a nagyobb nyílt modelleket a kulcsfontosságú gondolkodási benchmarkokban, ami körülbelül 1500 dollárba és 1,9 napba került 16 GPU-n.

A teljes cikk az eredeti weboldalon

Külső link: venturebeat.com

Kapcsolódó cikkek