Umelá inteligencia

Umelá inteligencia OpenAI o1 má excelovať vo vedeckých úlohách. Tvorcovia však skrývajú, ako „uvažuje“

Je efektívnejší ako predchádzajúce modely a doťahuje sa na študentov doktorandského štúdia pri riešení problémov.
Nateraz k nemu majú prístup predplatitelia a vývojári cez API, no v blízkej doby by ho mohli dostať všetci.
Vydané 18. septembra 2024 / Autor / Obsahuje tieto témy: , , , , , ,

Zase sme o krok bližšie k samostatne zmýšľajúcim strojom. Spoločnosť OpenAI, ktorá sa predstavila svojim veľkým jazykovým modelom (LLM) ChatGPT, predstavila generatívny model s kódovým označením Strawberry a oficiálnym názvom OpenAI o1.

Spoločnosť o tom informovala v oznámení na svojej webovej stránke. Podľa ich slov dokáže „uvažovať pri riešení zložitých úloh a riešiť ťažšie problémy ako predchádzajúce modely v oblasti vedy, kódovania a matematiky“. Využitie teda nájde najmä vo vede.

V tejto oblasti sme doposiaľ boli zvyknutí, že všetko trvá pridlho. Najprv niekto musí prísť s novou a zaujímavou myšlienkou, potom musí vymyslieť ako by ju otestoval a po odskúšaní získa dáta, ktoré však musí viackrát skontrolovať a nakoniec vyhodnotiť.

Ak si domnievate, že nový model rapídne urýchli tento proces, ste na omyle. „Tieto modely sme vytrénovali, aby strávili viac času premýšľaním o problémoch predtým, ako začnú reagovať,“ ozrejmila OpenAI s tým, že chceli napodobniť ľudský proces zmýšľania.

Doťahuje sa na doktorandov

Spoločnosť hovorí, že počas tréningu sa model OpenAI o1 naučil zdokonaľovať svoj proces myslenia, skúšať rôzne stratégie a rozpoznávať svoje chyby. Vďaka učenlivosti z vlastných chýb ľudstvo dosiahlo nemalé úspechy vo vedeckej a technickej sfére.

Množstvo chýb, niektoré aj tragické sa stali pri vesmírnom výskume. Svoje o tom vie spoločnosť SpaceX, ktorej vlani v apríli nevyšiel prvý pokus rakety Starship. Zo svojich chýb sa však poučili a v novembri už dosiahli lepšie výsledky, o čom sme vás informovali.

INZERCIA

Nový model umelej inteligencie má aj kvôli tejto vlastnosti dosahovať podobné výsledky ako študenti doktorandského štúdia pri riešení náročných referenčných úloh z fyziky, chémie a biologie. Jeho tvorcovia zároveň zistili, že vyniká v matematike a kódovaní.

„V kvalifikačnej skúške na Medzinárodnú matematickú olympiádu (IMO) GPT-4o správne vyriešil len 13 % úloh, zatiaľ čo model uvažovania dosiahol 83 %,“ vysvetlila OpenAI. Dodala, že vie programovať lepšie ako 89 percent účastníkov súťaže Codeforces.

Potvrdzuje aj to aj séria testov od redaktora portálu zdnet.com Davida Gerwitza. Ten model otestoval na vytvorení WordPress pluginu, prepísaní String funkcie, nájdení chyby v kóde a napísaní skriptu. Všetky zvládol úspešne, čím prekonal iné modely.

Skrýva svoje myšlienkové pochody

Tvorcovia tvrdia, že nový model dokáže uvažovať nielen o zadaných úlohách, ale aj vlastných bezpečnostných pravidlách. Vysvetlili to v oznámení: „Tým, že dokáže uvažovať o našich bezpečnostných pravidlách v kontexte, dokáže ich efektívnejšie uplatňovať.“

Používateľom sa neraz podarilo pri starších modeloch obísť tieto pravidlá, čím dosiali kontroverzné výsledky. V minulosti to dosahovali za pomoci alter ega modelu Dan, ktorý stratil zábrany a generoval neoverené a neetické odpovede, uvádza The Guardian.

Zmýšľajúci model však získal záujem nejedného používateľa. Tí sa snažia zistiť, ako model rozmýšľa na pozadí, keďže používateľovi prezentuje len uhladené medzikroky. V súčasnosti mali dosiahnuť len malé úspechy, no nič sa nateraz nepotvrdilo.

Toto správanie sa však nepáči tvorcom modelu, keďže niektorí používatelia obdržali výstražný e-mail, o čom informoval The Wired. „Ďalšie porušenie týchto pravidiel môže mať za následok stratu prístupu do GPT-4o s uvažovaním,“ píše sa vo výstražnom maili.

Ako sa k nemu dostať?

Model OpenAI o1 v skutočnosti vytvára rodinu, do ktorej patria aj modely o1-preview a o1-mini. Oba sú v súčasnosti dostupné pre predplatiteľov ChatGPT Plus a Team. Prístup k nemu majú aj vývojári, ktorí spĺňajú podmienky pre úroveň používania API 5.

Zatiaľ však ide o predbežnú verziu, kvôli čomu má isté obmedzenia. Predplatitelia si môžu s modelom o1-preview vymeniť 30 správ za týždeň, pri o1-mini tento limit určili na 50 správ týždenne. Spoločnosť však tvrdí, že aktívne pracuje na zvýšení limitov.

Modely zatiaľ taktiež neobsahujú niektoré funkcie, na ktoré ste si možno zvykli. „Okrem aktualizácií modelov očakávame pridanie prehliadania internetu, nahrávania súborov a obrázkov a ďalších funkcií, aby boli pre všetkých užitočnejšie,“ ozrejmili.

Spoločnosť OpenAI plánuje aj tento model sprístupniť širokej verejnosti. Nateraz však neprezradili, kedy tak učinia. Portál Živé.sk sa však domnieva, že vzhľadom na rýchlosť vývoja jazykových modelov konkurencie to zrejme bude čoskoro.

Pokračujte na ďalší príspevok »