Zanimljiv

Generativne kontradiktorne mreže: tehnologija koja stoji iza DeepFakea i FaceAppa

Generativne kontradiktorne mreže: tehnologija koja stoji iza DeepFakea i FaceAppa

U posljednjih nekoliko godina sve se više raspravlja o generativnim kontradiktornim mrežama ili GAN-ovima. Ako se vratite unatrag 10 godina, nećete naći traga takvoj temi. Pa, što je Generativne kontradiktorne mreže istaklo u prvom planu i zašto bi vas to trebalo zanimati? Razgovarajmo.

Kad god se raspravlja o generativnim kontradiktornim mrežama ili GAN-ovima, to je uvijek u kontekstu AI, strojnog učenja ili dubokog učenja. Iako je ova tema prilično velika, ovaj članak želi vam pomoći da je pojednostavljeno razumijete.

Krenimo od samog pojma - Generative Adversarial Networks.

POVEZANO: OVAJ NOVI AI SUSTAV MOŽE VIDJETI ŠTO MISLITE

GAN-ovi su u osnovi pristup generativnom modeliranju koji koristi metode dubokog učenja. Riječ "Generative" u ovom pojmu ukazuje na svojstvo GAN-a da stvaraju nešto svoje.

Kako program može imati kreativnost da napravi nešto svoje? Dajemo mu snagu strojnog učenja gdje može učiti iz prošlih podataka.

Dakle, ako biste hranili GAN-ove s tonom slika, on može stvoriti vlastitu jedinstvenu sliku. Isto vrijedi i za bilo koji skup podataka.

S obzirom na ovu definiciju, nailazimo na problem gdje ne postoji filtar za provjeru autentičnosti izlaza generatora. Generator može stvoriti bilo što što je povezano s njegovim referentnim skupom podataka, a da ne zna gdje bi nam to bilo prihvatljivo ili ne.

Da bi riješili taj problem, GAN-ovi dolaze s diskriminativnom mrežom koja generirane podatke provjerava istinitim podacima. Ovo je kontradiktorni dio Generativne kontradiktorne mreže. U osnovi uspoređujemo generativnu mrežu i diskriminacijsku mrežu, stvarajući međusobne protivnike.

Diskriminacijska mreža ili diskriminator koristi se kako bi se generirane vrijednosti generatora kontrolirale. A zadatak generatora je zavarati diskriminator u razmišljanju da su generirane vrijednosti zapravo stvarne, a ne računalno generirane.

Ovo je osnovni koncept GAN-ova.

GAN-ove u radu detaljnije objašnjavaju Ian Goodfellow i drugi istraživači sa Sveučilišta u Montrealu, prigodno nazvani Generative Adversarial Networks.

U radu su jasno spomenuli da je cijela svrha generativne mreže gurnuti diskriminacijsku mrežu u pogrešku. A diskriminacijska će mreža pogriješiti samo kad ne može razlikovati strojno generirane podatke i podatke o obuci.

Najbolji način za obuku GAN-a je upotreba baze podataka MNIST (Modificirana baza podataka Nacionalnog instituta za standarde i tehnologiju).

Baza podataka sastoji se od kompleta za obuku od 60 000 primjera i testa od 10 000 primjera. MNIST Training koristi rukom napisane numeričke vrijednosti.

Oni su sjajan početak za sve koji traže resurse za obuku mreža. To je skup podataka koji su za obuku modela koristili Ian i njegov tim.

Iz ovih podataka, najbolja analogija koju možemo iskoristiti za GAN je da je riječ o igri za dva igrača u kojoj se svaki igrač najviše trudi pobijediti jedni druge.

Možda se još uvijek sjećate vala vijesti koji je krajem prosinca 2018. stigao o slikama realističnog izgleda generiranim pomoću AI. Pa, to je bio GAN!

Ako pregledate te slike, lako je shvatiti zašto je ovo bila tako velika priča. Slike se nisu razlikovale od slika stvarnog života ljudskog lica.

Ljudi koji su stajali iza projekta bila je NVidia, popularni programer hardvera i softvera za računalnu grafiku. Istraživači koji stoje iza projekta pripremili su rad o njegovom razvoju i njihovim rezultatima pod nazivom Arhitektura generatora zasnovana na stilu za generativne kontradiktorne mreže.

Istraživači iz NVidije proveli su 8 tjedana trenirajući mreže, a to je koristilo osam njihovih Tesla raspona grafičkih kartica.

To sigurno postavlja neka pitanja o tome kako više možemo vjerovati slikovnim podacima. Također, ako uspijemo stvoriti ljudska lica od referentnih slika, neće proći puno vremena prije nego što ćemo moći stvoriti savršena lica, zbog čega modeli neće raditi!

Mnogi izazivaju zabrinutost zbog upotrebe slikovnih podataka u pravosudnom sustavu ako softver može tako učinkovito mijenjati slike. O ovome je sigurno nešto o čemu treba razmisliti!

Da se vratimo na temu koliko je daleko razvoj GAN-a, ništa ne prikazuje jasniju sliku tehnologije od eksperimenta tvrtke NVidia. U stanju smo stvoriti lica realističnog izgleda koja nisu samo uvjerljiva, već ih je računalo vrlo prilagodljivo.

I dalje su u tijeku istraživanja kako bi GAN-ovi postali moćniji za stvaranje realnih podataka i sa manje gladnih zahtjeva.

GAN-ovi se mogu koristiti u raznim aplikacijama, uglavnom vezanim uz slike, ali to će se sigurno promijeniti. Trenutno se GAN-ovi koriste u:

Generiranje novog sadržaja (slika): GAN-ovi se mogu koristiti za stvaranje životnih slika iz niza izvornih slika. Korištenje takvog sustava služi isključivo za razumijevanje mogućnosti GAN-ova.

Neki tvrde da se ova tehnologija može koristiti za određivanje izgleda bebe prema fotografijama njezinih roditelja.

Starenje ili odležavanje: Uz robustan skup uzoraka slika, GAN-ovi mogu uspješno starati ili umanjiti starost ljudskih lica. Nedavna popularnost aplikacije nazvane FaceApp pokazuje kako je takva tehnologija vrlo popularna među masama.

Ako se pitate o tehnologiji koja stoji iza FaceAppa, njegovih GAN-ova.

Crno-bijele fotografije u boji: Kada je GAN dovoljno dobro obučen, može obojati fotografije i to izvanredno dobro. Ova tehnologija doista može oživjeti stare fotografije i pružiti nam uvid u to doba u boji.

Poboljšanje rezolucije: Ako ste pokušali poboljšati razlučivost niskog rezultata na slici, rezultat je uvijek mutni nered s ispuhanim pikselima. Međutim, GAN zamjenjuje svaku dodatnu sliku i stvara visokokvalitetne slike za poboljšanje čak i kad je njihova razlučivost niska.

Svijet je vidio mnogo primjera GAN-a na djelu, a kontinuirano istraživanje u ovom smjeru ukazuje na još mnogo neočekivanih primjena GAN-ova u budućnosti.

POVEZANO: DA LI NASTAVLJA DJELOVATI NA NEPREDVIĐIVI NAČIN, TREBA LI PANIČATI?

Tehnologija je revolucionarna i možemo očekivati ​​da se GAN-ovi na našim uređajima prikazuju na više načina. Međutim, prije nego što ova tehnologija sazrije, postoje ozbiljne rasprave o etičkoj uporabi takvih moćnih metoda dubokog učenja.