Vytvoril som si vlastný generátor obrázkov AI a teraz mám obavy

Pamätajte, keď bola Prisma dokonalou „AI“ aplikácia na úpravu obrázkov tam vonku? Áno, odvtedy sme určite prešli dlhú cestu. S nárastom promptne založených AI generátory obrázkov ako sú DALL-E a Midjourney, vytváranie umenia a deepfakes je takmer dostupné každému.

Ale existujú obmedzenia, nie? Po počiatočnej novinke, keď sme požiadali Midjourney, aby si predstavil rôzne výzvy a videl, čo to vyhodí, je to všetko dosť nudné. Alebo aspoň mne to platilo.

Narcistická energia?

Pozri, som introvert, čo znamená, že nerád chodím von. Ale vieš čo mám rád? Mať svoje fotky na miestach, kam by som asi nikdy nešiel; sakra, miesta, kam tiež nemôžem ísť.

Prirodzene, chcel som požiadať nástroje AI o vytvorenie obrázkov ja v rôznych situáciách a na rôznych miestach. Nechcel som však nahrávať svoje obrázky na náhodné webové stránky v nádeji, že výsledky budú dobré; a vtedy som čítal o Dreambooth.

Hry sa môžu začať…

Ukázalo sa, že skutočne inteligentní ľudia priniesli veci ako Stable Diffusion masám. A čo viac, iní s nimi spolupracovali a umožnili doslova každému, kto má trochu trpezlivosti, vytvoriť si vlastné modely Stable Diffusion a spustiť ich úplne online.

google colab notebook pre dreambooth so stabilnou difúziou

Takže aj keď mám M1 MacBook Air, ktorý v žiadnom prípade nie je určený na použitie ako tréningový stroj pre a model generovania obrázkov s hĺbkovým učením, môžem spustiť zápisník Google Colab a to všetko robiť na serveroch Google – zadarmo!

Všetko, čo som skutočne potreboval, bolo pár mojich obrázkov a to je všetko.

Školenie môjho generátora obrázkov AI

Trénovať vlastný generátor obrázkov nie je vôbec ťažké. Ak potrebujete pomoc, na internete je k dispozícii množstvo sprievodcov a všetko je v podstate veľmi jednoduché. Stačí otvoriť zápisník Colab, odovzdať obrázky a začať trénovať model. To všetko sa deje pomerne rýchlo.

Dobre, buďme spravodliví, trénovanie textového kódovača prebieha pomerne rýchlo, do 5 minút. Trénovanie UNet s predvolenými parametrami však trvá pomerne dlho – takmer 15 – 20 minút. Avšak vzhľadom na skutočnosť, že v skutočnosti trénujeme model AI, aby rozpoznal a dokázal nakresliť moju tvár, 20 minút neznie ako príliš veľa času.

Počas tréningu existuje veľa spôsobov, ako si prispôsobiť, koľko chcete trénovať svoj model a z čítania skúseností mnohých ľudí online som pochopil, že neexistuje žiadna skutočná stratégia „jedna veľkosť pre všetkých“. tu. Pre základné prípady použitia sa však zdalo, že predvolené hodnoty pre väčšinu ľudí fungujú dobre a ja som sa pri nich tiež držal. Čiastočne preto, že som skutočne nedokázal pochopiť, čo väčšina vecí znamená, a čiastočne preto, že som jednoducho nemohol byť obťažoval vyskúšať trénovanie viacerých modelov s rôznymi tréningovými parametrami, aby ste videli, čo je najlepšie výstupov.

Koniec koncov, jednoducho som hľadal zábavný generátor obrázkov AI, ktorý by o mne mohol urobiť poloslušné obrázky.

Prekračuje očakávania

Nie som odborníkom na AI pri žiadnej fantázii. Chápem však, že trénovanie modelu stabilnej difúzie na notebooku Google Colab s 8 vlastnými súbormi jpeg orezanými na 512 × 512 pixelov skutočne nepovedie k niečomu výnimočnému.

Ako veľmi som sa mýlil.

Pri mojom prvom pokuse použiť model, ktorý som trénoval, som začal jednoduchou výzvou, ktorá hovorila „akshay“. Nasleduje obrázok, ktorý bol vygenerovaný.

Vytvoril som si vlastný generátor obrázkov AI a teraz sa bojím

Nie je to skvelé, však? Ale tiež to nie je také zlé, však?

Potom som sa však začal hrať s niektorými parametrami dostupnými v používateľskom rozhraní. Existuje viacero metód vzorkovania, kroky vzorkovania, mierka CFG, skripty a oveľa viac. Čas trochu sa vyblázniť experimentovaním s rôznymi výzvami a nastaveniami pre model.

Je zrejmé, že výsledky týchto obrázkov nie sú dokonalé a každý, kto ma videl, môže pravdepodobne povedať, že to nie sú „moje“ obrázky. Sú však dosť blízko; a ani som necvičil model so žiadnou zvláštnou starostlivosťou.

Ak by som sa mal riadiť nespočetnými sprievodcami na Reddite a inde na internete, ktoré hovoria o spôsoboch, ako môžete zlepšiť tréning a ak získate lepšie výsledky z Dreambooth a Stable Diffusion, tieto obrázky sa mohli ukázať ešte realistickejšie (a dá sa povedať, desivejšie).

Tento generátor obrázkov AI je strašidelne dobrý

Vidíte, som za vylepšenia technológie AI. Ako technický novinár som posledných pár rokov sledoval neustále sa meniacu a zlepšujúcu sa oblasť umelej inteligencie zameranej na spotrebiteľov a z väčšej časti som hlboko zaujatý a optimistický.

Vidieť však niečo ako Dreambooth v akcii ma núti premýšľať nad tým, aké neetické spôsoby Nástroje založené na AI a ML sú ľahko dostupné v podstate každému, kto má prístup k počítaču a internet.

Niet pochýb o tom, že na svete je veľa zlých hercov. Aj keď nevinné prípady použitia takejto ľahko dostupnej technológie určite existujú, ak existuje jedna vec, ktorú som sa naučil za roky informovanie o technológiách je to, že uvedenie produktu do rúk miliónom ľudí nepochybne povedie k mnohým nežiaducim výsledky. V lepšom prípade niečo nečakané a v horšom niečo vyslovene nechutné.

Schopnosť vytvárať hlboké falošné obrázky ktokoľvek pokiaľ môžete získať 5 až 10 obrázkov ich tváre, je to pri nesprávnom použití neuveriteľne nebezpečné. Myslite na dezinformácie, skresľovanie a dokonca aj na porno z pomsty – deepfakes sa dajú použiť všetkými týmito problematickými spôsobmi.

Ochranné opatrenia? Aké ochranné opatrenia?

Nie je to len Dreambooth. Dreambooth a Stable Diffusion sú samé osebe a dobre sa používajú, sú neuveriteľné nástroje, ktoré nám umožňujú zažiť, čo dokáže AI. Ale neexistujú žiadne skutočné záruky tejto technológie z toho, čo som doteraz zažil. Iste, nedovolí vám generovať na obrázkoch priamu nahotu; aspoň štandardne. Existuje však množstvo rozšírení, ktoré vám umožnia obísť aj tento filter a vytvoriť takmer čokoľvek, čo si dokážete predstaviť, na základe identity kohokoľvek.

Dokonca aj bez takýchto rozšírení môžete ľahko získať nástroje, ako je tento, na vytváranie širokej škály potenciálne znepokojujúcich a pochybných snímok ľudí.

Navyše s slušne výkonným počítačom môžete trénovať svoje vlastné modely AI bez akýchkoľvek záruk a na základe čohokoľvek. trénovacie údaje, ktoré chcú použiť – čo znamená, že trénovaný model vytvorí obrázky, ktoré môžu byť zatracujúce a škodlivé predstavivosť.

Deepfakes nie sú žiadnou novinkou. V skutočnosti existuje na internete obrovské množstvo hlboko falošných videí a médií. Avšak až do nedávnej minulosti bolo vytváranie deepfakes obmedzené na relatívne malé (aj keď stále veľké) počet ľudí, ktorí existovali v priesečníku „ľudí so schopným hardvérom“ a „technického know-how“.

Teraz s prístupom k bezplatným (obmedzeným) výpočtovým jednotkám GPU v službe Google Colab a dostupnosťou nástrojov ako rýchly sen, ktorý vám umožní trénovať a používať modely AI na serveroch Google, tento počet ľudí sa zvýši exponenciálne. Pravdepodobne už má – to je pre mňa desivé a malo by to byť aj pre vás.

Čo môžeme urobiť?

To je otázka, ktorú by sme si v tejto chvíli mali položiť. Nástroje ako DALL-E, Midjourney a áno, Dreambooth a Stable Diffusion sú určite pôsobivé, keď sa používajú s obyčajnou ľudskou slušnosťou. Umelá inteligencia sa zlepšuje míľovými krokmi – pravdepodobne to zistíte pri pohľade na explóziu správ súvisiacich s AI za posledných pár mesiacov.

Toto je teda kľúčový bod, v ktorom musíme nájsť spôsoby, ako zabezpečiť, aby sa AI používala eticky. Ako to môžeme urobiť, je otázka, na ktorú neviem odpoveď, ale viem, že rýchly generátor obrázkov AI, a keď som videl jeho schopnosti, bojím sa, aký je dobrý, bez toho, aby som to vyskúšal príliš ťažké.

Odporúčané články

Google testuje AI na písanie spravodajských článkov

vocol AI - zjednodušená spolupráca pri stretnutí

Ako napísať svoj životopis pomocou ChatGPT

Odporúčaný obrázok, ktorý ukazuje, ako vytvoriť obrázky v ChatGPT

RK11111111111hovorí:

18. marca 2023 o 4:51

Zápisníky Colab nie sú zlé. Použil som stablediffusion pipeline na vytvorenie videa k skladbe, ktorú som napísal.

Zistil som, že práca s ním je dosť náročná a mám pocit, že som skutočne len nachádzal obrázky, ktoré už boli v databáze. Ako keby podnet k obrázku bol celebrita začať, wow, to naozaj kreslil, že celebrity.

Keby som sa pokúsil špecifikovať niečo viac zámerné, ale abstraktné. Červená víriaca obloha nad horami sa mu darila podstatne menej dobre a pri vhodnej povele brala veľa odhadov. Robilo to celkom dobre s obyčajnými abstraktnými vecami, ale trochu nudné.

Zábavné hrať sa však! Každý jednotlivý obrázok nemusí byť úplne originálny, ale vytvoriť z neho video, ktoré je teraz kreatívne.

Skúsil som aj Topaz, čo je v podstate AI fotospracovanie, ktoré si počínalo celkom dobre, približne rovnako, ako by som mohol robiť s ostrením a čo nie, ale trvalo to oveľa menej času. Dúfam, že sa to zautomatizuje, rád sa pozerám na svoje fotografie, ale spracovanie fotografií zaberie toľko času a skutočne mi to ničí zážitok.

Odpovedzte
Bhupendra Dhamihovorí:

17. marca 2023 o 22:35
pekné projekty!!! pridajte ich prosím viac

Odpovedzte
Slnečnohovorí:

17. marca 2023 o 17:54
Teraz generátor obrázkov išiel na inú úroveň

Odpovedzte