← Zpět na komunitu
Vývoj AI

BioHub představuje proteinový světový model ESM

Tým BioHubu pod vedením Alexe Rivese odhalil modely ESMC-6B a ESMFold2, které představují novou generaci proteinových světových modelů. Tyto modely, trénované na miliardách proteinů a struktur, otevírají cestu k pokročilému návrhu protilátek a programovatelné biologii.

BioHub představuje proteinový světový model ESM

Vědecký svět je svědkem dalšího významného posunu v oblasti umělé inteligence, tententokrát s dopadem na biologii a medicínu. Tým výzkumníků z BioHubu, vedený Alexem Rivesem, představil novou generaci proteinových světových modelů, konkrétně ESMC-6B a ESMFold2. Tyto modely, které se učily na miliardách proteinů a jejich struktur, jsou navrženy tak, aby posunuly hranice v oblasti návrhu protilátek a programovatelné biologie. Podle autorů, stejně jako u jazykových modelů, se i zde začíná prosazovat princip "hořké lekce" - tedy že prostá síla velkých dat a masivních výpočtů překonává složitě navržené algoritmy a doménové znalosti.

Vývoj těchto modelů odráží trend, který je patrný v mnoha oblastech umělé inteligence. Zpočátku se výzkumníci snažili do algoritmů vkládat co nejvíce lidské expertízy a specifických pravidel. Postupem času se však ukázalo, že modely s obrovským počtem parametrů, trénované na rozsáhlých datových souborech a s dostatečným výpočetním výkonem, dokáží samy objevit komplexní vzorce a dosáhnout výkonu, který dříve nebyl myslitelný. Tento přístup, který Latent Space nazývá "hořkou lekcí", nyní nachází uplatnění i v molekulární biologii.

Proteinová "hořká lekce" a její důsledky

Koncept "hořké lekce" (The Bitter Lesson), původně formulovaný Richardem Suttonem v kontextu strojového učení, poukazuje na opakovaný jev v historii AI: obecné metody založené na učení a škálování se v dlouhodobém horizontu ukázaly být efektivnější než metody, které zahrnují velké množství lidského poznání. V případě proteinových modelů to znamená, že místo snahy o detailní pochopení a kódování každého aspektu proteinové interakce, se modely učí z obrovského množství existujících proteinových sekvencí a struktur. Díky tomu dokáží predikovat chování proteinů s vysokou přesností a otevírají nové možnosti pro jejich cílený návrh.

Význam modelů jako ESM spočívá v jejich schopnosti pochopit složitý "jazyk" proteinů. Proteiny jsou základními stavebními kameny života a jejich funkce je určena jejich třírozměrnou strukturou. Predikce této struktury z aminokyselinové sekvence je dlouhodobě jednou z největších výzev v biologii. Modely ESM se učí nejen predikovat strukturu, ale také generovat nové, funkční proteiny. To má potenciál dramaticky urychlit výzkum a vývoj v oblastech, jako je farmaceutický průmysl, biotechnologie a materiálové inženýrství. Možnost navrhovat protilátky s přesně definovanými vlastnostmi nebo vytvářet enzymy pro specifické chemické reakce by mohla transformovat mnoho odvětví.

Co to znamená pro vaši firmu

Zdroj Latent Space →