OpenAI pristato GPT OSS su 120B ir 20B modeliais atviro kodo AI

OpenAI ką tik išleido kažką, vadinamą GPT OSS, ir atvirai kalbant, tai daug ką keičia. Daug metų praleidę prie užrakintų, uždarų AI įrankių, dabar jie sako: „Ei, čia yra kažkas, ką galite naudoti visi“.

Aš to tikrai nesitikėjau, ypač kai GPT-5 yra už kampo. Bet štai mes. Jie mums davė du modelius,GPT OSS-120birGPT OSS-20b, jie yra visiškai atviri ir naudojami nemokamai.

OpenAI atsisako GPT OSS modelių, ir tai yra didelis dalykas

Reklama

Kas tai per GPT OSS?

Iš esmės,GPT JAVyra OpenAI būdas sugrįžti į atvirojo kodo pasaulį. Modeliai išleidžiami pagalApache 2.0 licencija, o tai reiškia jokios dramos, jokių keistų taisyklių.

Kiekvienas gali jį naudoti, koreguoti ar kurti. Nesvarbu, ar esate vienas kūrėjas, ar didelė įmonė. Šie modeliai yra tiesiogkalbos modeliai, beje. Nėra vaizdo ar garso. Tiesiog grynas tekstas.

Kodėl tai svarbu

Tikroji šio didelio žingsnio priežastis yra ta, kad OpenAI aiškiai bando susigrąžinti kūrėjų bendruomenę. Pastaruoju metu pasirodo daug atvirų modelių, o jei OpenAI liks uždarytas visam laikui, kai kuriose srityse jie rizikuoja atsilikti.

Reklama

Taigi suGPT JAV, jie rodo, kad jiems vis dar rūpi skaidrumas ir bendrinimas. Be to, tai padeda susidoroti su vyriausybių ir politikos formuotojų, kurie nuolat prašo atviresnio ir aiškesnio dirbtinio intelekto plėtros, spaudimo.

Kaip jis veikia

Taigi, našumo požiūriu, visai neblogai. Didesnis modelis,GPT OSS-120b, veikia tik aukščiausios klasės Nvidia GPU.

Mažesnis,20b, gali tiesiogine prasme paleisti ant a16 GB RAM nešiojamasis kompiuteris. Tai iš tikrųjų beprotiška, kai apie tai pagalvoji. Tai tikras prieinamumas.

Jie naudoja kažką vadinamoEkspertų mišinys (EM)architektūra. Per daug nesigilinsiu, bet trumpai tariant, modelis ne kiekvieną kartą naudoja visus savo parametrus. Jis parenka reikalingas dalis ir veikia greičiau bei lengviau.

Reklama

Stiprybės ir problemos

AntCodeforces etalonas(kuris naudojamas kodavimo įgūdžiams),GPT OSS-120bpelnė įvartį2622ir 20b versija surinko balus2516. Gana solidu, tiesą sakant. Pralenkia kelis kitus modelius, tokius kaip „DeepSeek R1“.

Bet taip, tai nėra tobula. Thehaliucinacijų dažnisyra savotiškai blogai. Didelis modelis pateikia klaidingą informaciją, pvz49% laikofaktiniuose testuose.

Mažesniam sekasi prasčiau53%. Tai daug, bet tikimasi, nes šie modeliai yra mažesni ir neturi gilių pasaulio žinių, kaip GPT-4.

Kad būtų paprasta,GPT JAVyra OpenAI sugrįžimas į atvirą erdvę. Tai nėra tobula, bet galinga, greita ir labiau prieinama, nei tikitės.

Taip pat žiūrėkite:„Microsoft“ pristato „OpenAI“ „gpt-oss-120b ir 20b“ modelius „Azure“ ir „Windows AI Foundry“

Jei esate tas, kuris kuria ar bando dirbtinio intelekto dalykus, tai tinkamas metas įsitraukti. Galų gale svarbu ne įveikti GPT-4, o suteikti žmonėms atspirties tašką kurti išmanesnius įrankius.

Related Posts