AI Gemini od Googlu je tu, ale je lepší než ChatGPT?

Rychlé odkazy

Klíčové věci

  • Model AI Gemini od Googlu má tři varianty, Ultra, Pro a Nano, zaměřené na různé úkoly a úrovně složitosti.
  • Gemini Ultra vykazuje slibné výsledky v klíčových benchmarcích AI, ale od prosince 2023 není k dispozici pro veřejné použití. Google říká, že by měl být dostupný v lednu 2024.
  • Gemini Pro je k dispozici a i když funguje docela dobře, v současné době nedokáže sesadit z trůnu GPT-4.

Google neustále slibuje, že jeho model Gemini AI bude lepší než OpenAI GPT-4, model, který pohání ChatGPT Plus. Nyní, když byl spuštěn Google Gemini, můžeme jej konečně otestovat a zjistit, jak si Gemini stojí v porovnání s GPT-4.

Když Google v březnu 2023 spustil Bard, bylo mnoho důvodů k nadšení. Konečně by byl narušen monopol ChatGPT OpenAI a dostali bychom důstojnou konkurenci.

Bard však nikdy nebyl tím AI titánem, ve kterého lidé doufali, a GPT-4 zůstává dominantní generativní platformou AI chatovacích botů. Nyní je tu Gemini od Googlu – ale je dlouho očekávaný model umělé inteligence lepší než ChatGPT?

Co je model AI Gemini od Googlu?

Gemini je nejschopnější generativní model AI od Googlu, který dokáže porozumět různým datovým formátům, včetně textu, zvuku, obrázků a videa, a pracovat s nimi. Je to pokus společnosti Google vytvořit jednotný model umělé inteligence, který bude čerpat ze svých nejschopnějších technologií umělé inteligence. Gemini bude k dispozici ve třech variantách:

  1. Gemini Ultra:Největší a nejschopnější varianta navržená pro zvládnutí vysoce složitých úkolů.
  2. Gemini Pro:Nejlepší model pro škálování a poskytování vysokého výkonu v celé řadě úkolů, ale méně schopný než Ultra.
  3. Blíženci nano:Nejúčinnější model navržený pro nasazení úloh na zařízení. Vývojáři mohou například použít Gemini Nano k vytváření mobilních aplikací nebo integrovaných systémů, což přináší výkonnou umělou inteligenci do mobilního prostoru.

Na svém oficiálním bloguKlíčové slovo, Google říká, že Gemini Ultra překonává nejmodernější v několika benchmarcích. Google tvrdí, že Gemini Ultra poráží přední GPT-4 v několika klíčových benchmarcích.

S bezprecedentním skóre 90,0 % v přísném benchmarku MMLU je Gemini Ultra prvním modelem, který v tomto mnohostranném testu zahrnujícím 57 subjektů překonal výkon na lidské úrovni.

Google

Gemini Ultra dokáže také porozumět, vysvětlit a generovat vysoce kvalitní kód v některých z nejpopulárnějších světových programovacích jazyků, včetně Go, JavaScript, Python, Java a C++. Na papíře jsou to všechno skvělé výsledky. Ale to jsou všechno benchmarky a benchmarky ne vždy vyprávějí celý příběh. Jak dobře si Blíženci vedou v úkolech v reálném světě?

Jak používat Google Gemini AI

Ze tří variant modelu Gemini AI můžete Gemini Pro začít používat právě teď. Gemini Pro je aktuálně k dispozici na chatbotu Bard od Googlu. Chcete-li používat Gemini Pro s Bardem, přejděte nabard.google.coma přihlaste se pomocí svého účtu Google.

Google říká, že Gemini Ultra bude spuštěn v lednu 2024, takže jsme se zatím museli spokojit s testováním Gemini Pro proti ChatGPT.

Jak se Gemini srovnává s GPT-3.5 a GPT-4

Když je uveden na trh jakýkoli nový model umělé inteligence, je testován s modely GPT AI OpenAI, které jsou obecně přijímány jako nejmodernější model, proti kterému by ostatní modely měly čelit. Pomocí Bard a ChatGPT jsme tedy otestovali schopnosti Gemini v matematice, kreativním psaní, generování kódu a přesném zpracování obrazových vstupů.

Počínaje nejjednodušší matematickou otázkou, na kterou jsme mohli myslet, jsme oba chatboty požádali, aby vyřešili:-1 x -1 x -1.

Bard šel první. Otázku jsme zopakovali dvakrát a všichni se vrátili se špatnými odpověďmi. Odpověď jsme sice dostali na třetí pokus, ale to se nepočítá.

Vyzkoušeli jsme ChatGPT běžící na GPT-3.5. První soud to vyřešil správně.

Abychom otestovali schopnosti Gemini interpretovat obrázky, zadali jsme mu za úkol interpretovat některé populární memy. To odmítlo s tím, že nedokáže interpretovat obrázky s lidmi v něm. ChatGPT, provozující GPT-4V, byl ochoten a schopen tak učinit bezchybně.

Pokusili jsme se o další pokus, jak jej přimět interpretovat obrázek a zároveň testovat jeho schopnost řešit problémy a kódovat. Dali jsme Bardovi, který běží na Gemini Pro, snímek obrazovky a požádali jsme ho, aby interpretoval a napsal kód HTML a CSS, aby se snímek obrazovky replikoval.

Zde je zdrojový snímek obrazovky.

Níže je uveden pokus Gemini Pro interpretovat a replikovat snímek obrazovky pomocí HTML a CSS.

A tady je pokus GPT-4 o replikaci snímku obrazovky. Výsledek není překvapivý, vezmeme-li v úvahu, že GPT-4 byl historicky silný v kódování. Již dříve jsme demonstrovali použití GPT-4 k vytvoření webové aplikace od nuly.

Požádali jsme Gemini Pro, aby vytvořil báseň o Tesle (značce elektromobilů). Ukázala nepatrná zlepšení oproti předchozím testům, které jsme provedli v minulosti. Zde je výsledek:

V tuto chvíli jsme si mysleli, že srovnání výsledků s GPT-3.5 spíše než s přeplňovaným GPT-4 by bylo vhodnější. Požádali jsme tedy ChatGPT s GPT-3.5, aby vytvořil podobnou báseň.

Může to být osobní volba, ale přístup Gemini Pro se zdá být lepší. Ale necháme vás být soudcem.

Než Google spustil Bard, mysleli jsme si, že to bude soutěž ChatGPT, na kterou jsme čekali – nebylo. Nyní je tu Gemini a zatím se Gemini Pro nezdá být modelem, který by ChatGPT dal knockout.

Google říká, že Gemini Ultra bude mnohem lepší. Opravdu doufáme, že ano a že splní nebo překročí požadavky uvedené v oznámení Gemini Ultra. Ale dokud neuvidíme a nevyzkoušíme nejlepší verzi generativního nástroje AI od Googlu, nebudeme vědět, zda dokáže sesadit ostatní konkurenty modelů AI. V současné době zůstává GPT-4 nesporným šampionem modelů AI.

Related Posts