architect
TPU-kkal, GKE Managed DRANET-tel és többklaszteres következtetési átjáróval való kísérletezés
Forrás:
cloudblog.withgoogle.com 1 perc olvasás
Megosztás
Összefoglalót olvas. A teljes tartalom itt érhető el: cloudblog.withgoogle.com.
Egy Google Cloud-kísérlet a Gemma 3 következtetési munkaterhelést két regionális GKE klaszterben telepíti TPU v6e, Cloud Storage FUSE, menedzselt DRANET és egy többklaszteres Inference Gateway segítségével. A régió közötti útvonalakat teszteli a legközelebbi régióhoz, majd automatikus újratöltést a második klaszterhez, amikor egy régió leáll.
A teljes cikk az eredeti weboldalon
Külső link: cloudblog.withgoogle.com
Kapcsolódó cikkek
architect
A WebMCP szabványjavaslata az ágentikus webes működtetéshez már elérhető Chrome-ban (eredeti próbaverziók)
1 min read •
architect
A Slack kiküszöböli az SSH-t az EMR-folyamatokban, és több mint 700 feladatot migrál REST-alapú architektúrára
1 min read •
architect
A digitális fordulat: Hogyan alakította át a HSS a toborzást az ügynöki mesterséges intelligencia segítségével
1 min read •