OpenAI GPT-4: Multimodálne, nové funkcie, obrazový vstup, ako používať a ďalšie

OpenAI pri tom urobilo obrovské vlny spustil GPT-4 minulú noc. Jazykový model AI novej generácie je viditeľným vylepšením od svojho predchodcu a dokáže oveľa viac. Ak o niečom alebo dvoch viete ChatGPT a jeho alternatívy, už viete, čo to znamená pre chatbotov a umelú inteligenciu všeobecne. Avšak pre tých, ktorí nepoznajú jazykové modely alebo konkrétne GPT-4, držíme vám chrbát. Prehľadali sme blogy OpenAI a internet a vybrali sme špecializovaného sprievodcu pre GPT-4. Takže ak o tom nemáte ani potuchy, dajte si šálku kávy a sadnite si, keď vám povieme všetko o tomto modeli AI.

GPT-4: Všetko, čo potrebujete vedieť (2023)

Téma GPT-4 je veľmi široká, pokiaľ ide o informácie. Aby ste si to všetko utriedili, vytvorili sme tabuľku nižšie. Použite ho, ak chcete rýchlo prejsť na konkrétny aspekt modelu.

Obsah

Čo je GPT-4?
GPT-4 je multimodálny
V čom je GPT-4 lepší ako GPT 3.5/GPT-3?
- Lepšie pochopenie nuansovaných výziev
- Exponenciálne väčší limit slov
- Podporuje viac jazykov
- Rôzne Osobnosti
- Možné aplikácie GPT-4?

Má GPT-4 nejaké obmedzenia?
OpenAI Evals – Zlepšite GPT-4 spoločne
Ako získať prístup k GPT-4 práve teraz
Často kladené otázky (FAQ)
- Prichádza GPT-4 na ChatGPT?
- Bude používanie GPT-4 bezplatné?
- Môžem sa plne spoľahnúť na GPT-4?
- Aká je veľkosť množiny údajov GPT-4?
- Ako bol GPT-4 vyškolený?

Čo je GPT-4?

Zjednodušene povedané, GPT-4 je najnovšou iteráciou OpenAI vo veľkých systémoch jazykových modelov (LLM) spoločnosti. Systémy jazykových modelov sú vo všeobecnosti systémy, ktoré sa snažia predpovedať ďalšie slovo vo vete a inteligentne k nemu pridávajú svoje vstupy. Robia to štúdiom veľkého súboru údajov, ktorý im dáva schopnosť identifikovať vzorce a konať podľa nich.

GPT-4 je najnovší model v tejto sérii a očakáva sa, že pôjde o veľké zlepšenie oproti modelom predchádzajúcej generácie, ako sú GPT 3 a 3.5. Existuje niekoľko konkrétnych vecí, v ktorých je GPT-4 lepší, o ktorých budeme podrobnejšie diskutovať nižšie. Jednoduchým bodom, ktorému by ste však mali rozumieť, je, že tento nový model umožní chatbotom ako ChatGPT a MS Bing, aby boli oveľa schopnejší vo svojich odpovediach. Môžete teda očakávať, že budú poskytovať lepšie odpovede, kreatívnejšie navrhovať a fungovať inak so staršími a novšími Výzvy ChatGPT.

GPT-4 je multimodálny

Ak ste používali predchádzajúce modely značiek GPT, možno ste si boli vedomí ich obmedzenej schopnosti interpretovať len zadaný text. Jednou z najnovších a najväčších implementácií v novom modeli je však to, že je multimodálny. To znamená, že GPT-4 je schopný akceptovať výzvy textu aj obrázkov.

To znamená, že AI nielen prijíma obraz, ale aj v skutočnosti interpretovať a pochopiť to. Toto porozumenie sa bude vzťahovať na výzvy rozptýlené textovými aj vizuálnymi vstupmi. Okrem toho sa multimodálna schopnosť GPT-4 rozšíri na všetky veľkosti a typy obrázkov a textu, vrátane dokumentov s textom a fotografiami, diagramov (načrtnutých alebo ručne kreslených) alebo snímok obrazovky. Výstup GPT-4 zostane rovnako výkonný ako pri iba textových vstupoch.

V vývojársky priamy prenos organizovaná OpenAI, spoločnosť predviedla multimodálny charakter GPT-4. GPT-4 bol poskytnutý screenshot okna Discord v streame a bol požiadaný, aby ho opísal starostlivý detail.

Model trval niečo vyše minúty a poskytol mimoriadne popisnú a presnú odpoveď. Odozva zachytila takmer každý jeden prvok vstupnej obrazovky. Od názvu servera v ľavom hornom rohu až po rôzne hlasové kanály a dokonca aj pomenovanie všetkých členov Discordu online v pravom paneli, GPT-4 zachytil všetko.

GPT-4 prešiel niekoľkými ďalšími testami, v ktorých ľudia predložili niekoľko náhodných umeleckých diel vrátane fotografií veveričky držiacej fotoaparát. Model bol potom požiadaný, aby identifikoval „čo bolo vtipné na tomto obrázku.“ Opäť to vyvolalo odpoveď, že fotografia bola vtipná, pretože veveričky zvyčajne jedia orechy a nesprávajú sa ako ľudia. Ako je vidieť, opäť to poskytlo veľmi konkrétnu odpoveď, akú by urobil človek.

Ako však bolo uvedené vyššie, model špecifickosť presahuje rámec snímok obrazovky a na textové a obrazové vstupy všetkých typov. OpenAI predviedla to isté, keď Greg zachytil fotografiu ručne nakreslenej makety vtipnej webovej stránky. Potom to isté nahral na server Discord pripojený k API GPT-4. Model bol potom požiadaný, aby „napíšte krátky kód HTML/JS, aby ste stránku zmenili na webovú stránku a nahradili vtipy skutočnými.’

Úžasne, GPT-4 skompiloval pracovný kód pre to isté. Po testovaní vytvoril plne funkčnú webovú stránku, na ktorej stlačenie tlačidiel odhalilo vtipy. Skutočnosť, že model ChatGPT dokáže dešifrovať ľudský rukopis a vytvoriť kód z kombinácie textových a obrazových vstupov, je ohromujúca. Multimodálna schopnosť GPT-4 je obrovským krokom v smere AI plne chápe výzvy a poskytuje výsledky s dokonalou presnosťou.

Aj keď sa nevyskytli žiadne významné problémy, OpenAI tvrdil, že rýchlosť je niečo, s čím by GPT-4 mohol pracovať a môže to chvíľu trvať. Okrem toho sú vizuálne vstupy pre GPT-4 stále vo fáze výskumu a sú stále nie sú verejne dostupné.

V čom je GPT-4 lepší ako GPT 3.5/GPT-3?

Okrem svojho úchvatného multimodálneho prístupu má GPT-4 aj ďalšie oblasti zlepšenia, v ktorých nový model nielenže prekonáva svojich starších bratov. Niektoré z týchto oblastí sú:

1. Lepšie pochopenie nuansovaných výziev

OpenAI tvrdí, že na prvý pohľad môže byť ťažké skutočne vidieť rozdiel medzi GPT-4 a GPT-3.5. Avšak schopnosti prvého vyjdú najavo, keď sa pustíte do hrubej veci. Aby sa demonštroval rozdiel, nový model bol postavený proti GPT-3.5 v rôznych skúškach na ľudskej úrovni. OpenAI použila najnovšie verejne dostupné testy a neposkytla modelom žiadne špecifické školenie.

Samotné údaje poskytujú lepší obraz, než by sme vám mohli povedať. Vo všetkých výsledkoch GPT-4 vyšiel na vrchol a skóroval nad svojou predchádzajúcou verziou. Zatiaľ čo pri niektorých skúškach (napríklad SAT EBRW) bola hranica sotva posunutá, pri iných skúškach (Uniform bar exam, AP Chemistry a ďalšie) nastal obrovský skok vo výkonnosti. OpenAI uviedol: „GPT-4 je v porovnaní s GPT-3.5 tiež spoľahlivejší, kreatívnejší a vo všeobecnosti dokáže spracovať podrobnejšie inštrukcie.“ To znamená, že robot efektívne porozumie zložitejším výzvam.

2. Exponenciálne väčší limit slov

Zatiaľ čo všetci milovali GPT 3 a GPT 3.5, ľudia si želali, aby dokázal rozpoznať ešte dlhšie vstupy. Uvedenie GPT-4 tento problém vyriešilo. Nový jazykový model GPT-4 AI prichádza s ohromujúcim limit vstupu 25 000 slov, ktorý je výrazne veľký. Pre kontext, GPT 3.5 bola obmedzená na 8 000 slov.

To znamená, že používatelia budú môcť robotovi poskytnúť oveľa dlhšie vstupné výzvy na čítanie a následné vykreslenie výstupov. Takže keď sa GPT-4 konečne spustí, môžete očakávať oveľa podrobnejšiu odozvu a bez problémov trvať dlhšie vstupy. Pre vývojárov to znamená, že budete môcť chatbotovi pocítiť nové rozhrania API a dokumentáciu a jednoduchšie získať pomoc pri písaní kódu alebo odstraňovaní chýb v existujúcom kóde.

3. Podporuje viac jazykov

ChatGPT používajú prevažne anglicky hovoriaci ľudia na celom svete. GPT-4 však berie do úvahy aj iné jazyky. Najnovší model preukázal podporu pre viac ako 26 rôznych jazykov. Patria sem napríklad ukrajinské, kórejské, germánske jazyky a mnohé ďalšie.

OpenAI testovala to isté prekladom benchmarkov MMLU do rôznych jazykov. Z 26 jazykov GPT-4 prekonáva výkon v anglickom jazyku GPT-3.5 v 24 z nich. Predtým, ako GPT-4 bude plne podporovať všetky jazyky, je však potrebné vykonať ďalšie školenie údajov.

4. Rôzne Osobnosti

Riaditeľnosť je koncept, v ktorom môžete povedzte AI, aby konala určitým spôsobom s pevným tónom reči. Dobrým príkladom toho je požiadať ChatGPT, aby sa správal ako kovboj alebo policajt (prideliť mu rolu, ako sme vytváranie nášho chatbota pomocou API ChatGPT). GPT-4 má túto ovládateľnosť, ale OpenAI teraz sťažuje AI zlomiť charakter. Vývojári teraz môžu opraviť štýl svojej AI od začiatku popísaním týchto pokynov v „systémovej“ správe. Keďže tieto správy sa dajú ľahko utiecť z väzenia, OpenAI tiež pracuje na tom, aby boli bezpečnejšie.

Z ukážok OpenAI prezentovaných vo svojom blogovom príspevku bolo celkom zábavné vidieť používateľa, ktorý sa snaží prinútiť GPT-4, aby prestal byť učiteľom Socratic a jednoducho im povedal odpoveď na ich otázku. Avšak, keďže bol naprogramovaný ako tútor, GPT-4 odmietol zlomiť charakter, čo je to isté, čo mnohí vývojári môžu očakávať, keď budú v budúcnosti trénovať svojich robotov.

Možné aplikácie GPT-4?

Zatiaľ čo multimodálna aplikácia GPT-4 zatiaľ nie je pre používateľov možná, OpenAI sa už spojil s Be My Eyes, aplikácia určená pre zrakovo postihnutých. Zahrnutie GPT-4 do aplikácie vám umožňuje odfotiť si, na čo sa pozeráte, a AI to urobí popísať presne to, čo je na obrazovke, vrátane šiat, rastlín, strojov v telocvični, čítania máp a podobne viac.

GPT-4 tiež nadviazal partnerstvo s ďalšími aplikáciami, napr Duolingo, Khan Academy za inteligentné učenie a dokonca aj islandská vláda za zachovanie jazyka. Zatiaľ čo GPT-4 Rozhranie API je momentálne dostupné na základe zoznamu čakateľov, môžeme očakávať, že vývojári prídu s úžasnými zážitkami, keď bude konečne vydaný. Ešte predtým, ako sa tak stane, vyššie uvedené aplikácie sú už aktívne, aby ich mohli ľudia používať.

Má GPT-4 nejaké obmedzenia?

Aj keď sa GPT-4 ohlasuje ako ďalší krok v oblasti umelej inteligencie, stále má svoje rýchle tempo.

Pre začiatok, GPT-4 nemá žiadne znalosti o svetových udalostiach, ktoré sa udiali po septembri 2021. Modelka sa tiež nepoučí zo svojich skúseností. To môže viesť k výrobe modelu GPT-4 chyby v uvažovaní a je dokonca náchylný na akceptovanie zjavných nepravdivých vyhlásení od používateľa.

GPT-4 môže tiež zlyhať pri problémoch rovnako ako ľudia. Rovnako ako GPT 3.5 to dokáže aj nový model halucinovať a s istotou sa mýliť vo svojich predpovediach. To môže viesť k tomu, že GPT-4 nebude dvakrát kontrolovať svoju prácu, keď niekedy urobí chybu.

Napriek tomu však OpenAI sľubuje, že GPT-4 bol lepšie vyškolený ako predchádzajúce modely, aby sa tomu zabránilo. Vo vlastných interných hodnoteniach kontradiktórnosti faktovosti model skóre o 35 % vyššie v porovnaní s GPT 3,5 pri znižovaní halucinácií. Aj keď sa vnímanie a predpovede modelu zlepšili, jeho výsledky by sa mali stále brať v spojení s ľudskými radami.

OpenAI Evals – Zlepšite GPT-4 spoločne

OpenAI používa svoj vlastný softvérový rámec na vytváranie a spúšťanie benchmarkov pre modely ako GPT-4. Ide však o open source, takže spoločnosť zdieľala niekoľko najpoužívanejších šablón. OpenAI začala, že evals bude neoddeliteľnou súčasťou crowdsourcingových benchmarkov, ktoré možno použiť na zabezpečenie lepšieho školenia GPT-4 a ešte lepšieho výkonu.

Spoločnosť ako taká pozvala každého (áno, každého používateľa GPT-4), aby otestoval svoje modely v porovnaní s benchmarkmi a predložil svoje príklady. Viac informácií o tom istom nájdete na Výskumná stránka OpenAI GPT-4.

Ako získať prístup k GPT-4 práve teraz

Bohužiaľ, GPT-4 ešte nie je dostupný pre každého. OpenAI aktuálne vydala nový model len pre predplatiteľov ChatGPT Pluss uzáverom na používanie. Predplatitelia Plus tiež získajú obmedzený prístup k dvom rôznym verziám GPT-4. Zatiaľ čo niektorí používatelia môžu použiť Motor GPT-4s 32K, čo im dáva dlhší limit slov, ostatné sú obmedzené na GPT-4 8K s obmedzenou kapacitou. OpenAI uviedla, že sa to bude dynamicky upravovať na základe dopytu. Predplatitelia ChatGPT Plus, ktorí chcú prístup práve teraz, by si mali prečítať nášho sprievodcu ako získať prístup k GPT-4 tu.

Ak sa nemôžete obťažovať získať ChatGPT Plus, potom vás to poteší Microsoft Bing už používa GPT-4. Aj keď sa nebudete môcť hrať s jazykovým modelom ako na OpenAI, stále je celkom dobré experimentovať a skúšať rôzne typy vecí. Odhlásiť sa ako používať MS Bing v akomkoľvek webovom prehliadači začať.

Často kladené otázky (FAQ)

1. Prichádza GPT-4 na ChatGPT?

GPT-4 už skutočne prichádza na ChatGPT. Ako je uvedené vyššie, nový model je už aktívny pre predplatiteľov ChatGPT Plus. Ak ste prihlásení, všetko, čo musíte urobiť, je vybrať správny model a začať chatovať. Môžete tiež sledovať náš odkaz vyššie, ako získať ChatGPT Plus, ak ste tak ešte neurobili.

2. Bude používanie GPT-4 bezplatné?

Odteraz je bohužiaľ GPT-4 nie je zadarmo na použitie. Vyžaduje si to predplatné ChatGPT Plus, ktoré stojí 20 dolárov mesačne. OpenAI však uviedla, že dúfa, že v určitom okamihu každému ponúkne bezplatné otázky GPT-4. Spoločnosť by tiež mohla zaviesť novú úroveň predplatného, ktorá by poskytla lepší prístup k novým jazykovým modelom AI, ako je GPT-4.

3. Môžem sa plne spoľahnúť na GPT-4?

Nie, nemôžete sa spoliehať na GPT-4 ako na úplné opatrenie. Nový model stále trpí určitými obmedzeniami, vrátane starého súboru údajov a občasných halucinácií. Modelka môže tiež s istotou dávať nesprávne odpovede, ktoré aj keď nie sú zlé, môžu byť stále škodlivé. Aj keď sa GPT-4 skutočne zlepšil v porovnaní s GPT 3.5, stále má svoj podiel problémov. Ak teda nakoniec použijete najnovší model, použite popri ňom aj správny ľudský úsudok.

4. Aká je veľkosť množiny údajov GPT-4?

Aj keď sa šírilo veľa klebiet o GPT-4, ktorý má 100 biliónov parametrov v porovnaní so 175 miliardami GPT-3, je to s najväčšou pravdepodobnosťou nepravdivé. V rozhovore pre StriclyVC, Generálny riaditeľ OpenAI Sam Altman nepriamo uviedol, že to tak nebude a „GPT-4 fáma mlyn je smiešna vec.”

Možno z tohto dôvodu, OpenAI zmiernila očakávania pokiaľ ide o veľkosť súboru údajov GPT-4 a neposkytol presné číslo. Čas ukáže, či bude skutočne odhalený. Napriek tomu sa domnievame, že by mal fungovať celkom dobre vzhľadom na jeho počiatočnú demonštráciu.

5. Ako bol GPT-4 vyškolený?

Rovnako ako predchádzajúce jazykové modely, aj základný model GPT-4 bol trénovaný na predpovedanie ďalšieho slova v dokumente. Použité údaje sú ako také kombináciou verejne dostupných údajov a vlastných licencovaných údajov OpenAI.

Tieto údaje obsahujú zmes správnych a nesprávnych informácií, slabého a silného zdôvodnenia, protichodných tvrdení a rôznych iných myšlienok. To dáva GPT-4 širokú úroveň údajov, z ktorých je možné analyzovať a rozpoznať, čo sa od neho požaduje.

Pripravte sa na nový multimodálny model AI GPT-4 od OpenAI

Dúfame, že z tohto vysvetľovača odchádzate s viac informáciami o GPT-4 ako predtým, než ste k nemu prišli. GPT-4 je model, ktorý je plný príležitostí a prináša veľa vzrušenia pre každého. Po úplnom implementovaní do ChatGPT pre každého bude zaujímavé vidieť, ako všetci naplno využívajú nový model na vytváranie zážitkov. Nemusíte však čakať, kým zažijete ChatGPT. Pozrite si všetky skvelé veci, ktoré môžete robiť v ChatGPT a potom integrovať ChatGPT so Siri a dokonca získajte ChatGPT na hodinkách Apple Watch! Čo si teda myslíte o tomto vzrušujúcom novom modeli? Napíšte svoje myšlienky do komentárov nižšie!

Odporúčané články