← Zpět na komunitu
Vývoj AI

Zyphra ZAYA1-8B: Nový reasoning model trénovaný na AMD GPU

Společnost Zyphra představuje ZAYA1-8B, malý, ale výkonný reasoning model, jehož trénink proběhl výhradně na grafických kartách AMD Instinct MI300.

Zyphra ZAYA1-8B: Nový reasoning model trénovaný na AMD GPU

Společnost Zyphra oznámila vydání svého nového modelu ZAYA1-8B, který se vyznačuje malou velikostí a zároveň vysokou efektivitou v oblasti "reasoningu" neboli schopnosti odvozovat závěry. Klíčovým aspektem tohoto projektu je však zvolená hardwarová platforma pro jeho trénink. Celý proces probíhal výhradně na akcelerátorech AMD Instinct MI300. Tento krok představuje významnou alternativu k dominantním řešením od Nvidie, která v současnosti ovládají trh s výpočetním hardwarem pro rozsáhlé AI modely.

ZAYA1-8B sice disponuje 8 miliardami parametrů, nicméně z hlediska aktivních parametrů, které se primárně podílejí na zpracování informací, se pohybuje kolem 760 milionů. Navzdory této relativní skromnosti v porovnání s některými rozsáhlejšími modely dosahuje konkurenceschopných výsledků. Podle informací zveřejněných VentureBeat model podává výsledky srovnatelné s modely jako GPT-5-High a DeepSeek-V3.2, což naznačuje, že efektivita a optimalizace tréninkového procesu mohou hrát stejně významnou roli jako samotná velikost modelu.

AMD na scéně AI tréninku

Vývoj modelu ZAYA1-8B je pro společnost AMD strategicky důležitý. Po delším období, kdy se v oblasti špičkového AI hardwaru pro trénink velkých jazykových modelů prosazovala především Nvidia, představuje úspěšné nasazení AMD Instinct MI300 pro kompletní trénink důležitý milník. Ukazuje to, že hardware od AMD je schopen zvládnout náročné výpočetní úlohy spojené s tréninkem pokročilých AI modelů, což otevírá nové možnosti pro firmy hledající diverzifikaci dodavatelského řetězce.

Model ZAYA1-8B je veřejně dostupný na platformě Hugging Face pod licencí Apache 2.0, což umožňuje jeho volné využití a další rozvoj. Společnost Zyphra navíc nabízí bezplatnou inferenci pro jednotlivce prostřednictvím své platformy Zyphra Cloud, čímž podporuje širší adopci a experimentování s tímto modelem.

Co to znamená pro vaši firmu

Zdroj VentureBeat →