Mis on GAN-id? Kuidas ja miks peaksite neid kasutama!



See artikkel hõlmab üksikasjalikku selgitust teemal „Mis on GAN-id” koos piirangute ja väljakutsetega, mis hõlmavad koolitusprotsessi ja Kasutusjuhtumi rakendamist.

Generatiivsed võistlusvõrgustikud ehk GAN-id on generatiivne modelleerimisviis, mis kasutab Sügav õppimine treenida mudelit nutikalt andmete genereerimiseks, kasutades alamudeli lähenemist. Selles artiklis püüame üksikasjalikult mõista, mis on GAN-id. Selles artiklis käsitletakse järgmisi teemasid:

Mis on generatiivsed mudelid?

Generatiivsed mudelid pole muud kui need, mis kasutavad lähenemisviisi. Generatiivses mudelis on andmetes valimid, st sisendmuutujad X, kuid sellel puudub väljundmuutuja Y. Generatiivse mudeli koolitamiseks kasutame ainult sisendmuutujaid ja see tunneb tundmatu väljundi loomiseks sisendmuutujate mustreid ja põhineb ainult koolituse andmetel.





Sisse , oleme rohkem sisendmuutujate põhjal ennustavate mudelite loomise suunas, seda tüüpi modelleerimist tuntakse kui diskrimineerivat modelleerimist. Klassifitseerimisprobleemi korral peab mudel tegema vahet, millisesse klassi näide kuulub. Teisest küljest kasutatakse sisendjaotuses uute näidete loomiseks või genereerimiseks järelevalveta mudeleid.

Generatiivsete mudelite määratlemiseks võhiklikult võib öelda, et generatiivsed mudelid suudavad valimist luua uusi näiteid, mis pole mitte ainult sarnased teiste näidetega, vaid on samuti eristamatud.



Generatiivse mudeli kõige tavalisem näide on a mida kasutatakse sagedamini diskrimineeriva mudelina. Muude generatiivsete mudelite näidete hulka kuuluvad Gaussi segusemudel ja üsna kaasaegne näide, mis on üldised võistlussuhted. Püüdkem mõista, mis on GAN-id?

Mis on generatiivne võistlev võrgustik?

Generatiivsed võistlusvõrgustikud ehk GAN-id on süvaõppepõhine generatiivne mudel, mida kasutatakse järelevalveta õppimise jaoks. Põhimõtteliselt on see süsteem, kus võistlevad kaks Närvivõrgud võistlevad omavahel andmete variatsioonide loomisel või genereerimisel.

Esimest korda kirjeldas seda Ian Goodfellow 2014. aastal avaldatud dokumendis ja Alec Radford pakkus 2016. aastal välja standardiseeritud ja palju stabiilse mudeli teooria, mis on tuntud kui DCGAN (Deep Convolutional General Adversarial Networks). Enamik tänapäeval eksisteerivatest GAN-idest kasutavad DCGAN-i arhitektuuri.



GAN-ide arhitektuur koosneb kahest alamudelist, mida nimetatakse Generaatori mudel ja Diskrimineerija mudel. Püüdkem mõista, kuidas GAN tegelikult toimib.

Kuidas see töötab?

Mõistame, kuidas GAN-id töötavad, selle lahti.

  • Generatiivne - See tähendab, et mudel järgib lähenemisviisi ja on generatiivne mudel.
  • Võistlev - Mudelit koolitatakse võistlevas keskkonnas
  • Võrk - Mudeli koolitamiseks kasutab närvivõrke tehisintellekti algoritmidena.

GAN-ides on olemas generaatorivõrk, mis võtab valimi ja genereerib andmete valimi ning pärast seda otsustab diskrimineerijate võrk, kas andmed genereeritakse või võetakse binaarse abil tegelikust valimist probleem sigmoidfunktsiooni abil, mis annab väljundi vahemikku 0 kuni 1.

vooskeem - mis on gnas - edureka

Generatiivne mudel analüüsib andmete levikut nii, et pärast koolitusetappi maksimeerib diskrimineerija eksimise tõenäosus. Ja teiselt poolt põhineb diskrimineerija mudelil, mis hindab tõenäosust, et valim pärineb tegelikest andmetest, mitte generaatorist.

Kogu protsessi saab vormistada allpool toodud matemaatilise valemiga.

Ülaltoodud valemis:

G = generaator

D = diskrimineerija

Pdata (x) = tegelike andmete jaotus

kuidas numbrit ümber pöörata

Pdata (z) = generaatori levitaja

x = valim tegelikest andmetest

milline on kevadine raamistik

z = generaatori proov

D (x) = diskrimineerijate võrk

G (z) = generaatorivõrk

Nüüd tuleb GAN-i koolitusosa, mida saab edasi jagada kaheks osaks, mida tehakse järjestikku.

Kuidas treenida GAN-i?

1. osa:

Treenige diskrimineerijat ja külmutage generaator, mis tähendab, et generaatori jaoks määratud treening pööratakse väärtuseks Väär ja võrk teeb ainult edasi-tagasi läbimist ja tagasi levimist ei rakendata.

Põhimõtteliselt koolitatakse diskrimineerijat tegelike andmetega ja kontrollitakse, kas ta suudab neid õigesti ennustada, ja sama võltsandmetega, et tuvastada need võltsidena.

2. osa:

Treenige generaatorit ja külmutage diskrimineerija. Selles faasis saame tulemused esimesest faasist ja saame neid kasutada eelmisest olekust paremaks muutmiseks, et diskrimineerijat paremini petta.

Koolituse sammud

  1. Määratlege probleem - määratleda probleem ja koguda andmeid.
  2. Valige GAN-i arhitektuur - Valige oma probleemist sõltuvalt, kuidas teie GAN välja peaks nägema.
  3. Rongi eristamine tegelike andmete kohta - Treenige diskrimineerijat reaalsete andmetega, et ennustada nende arvu reaalsena mitu korda.
  4. Generaatori jaoks võltssisendite genereerimine - genereerige generaatorist võltsproovid
  5. Rongi eristamine võltsandmete kohta - koolitage diskrimineerijat ennustama genereeritud andmeid võltsidena.
  6. Rongigeneraator koos diskrimineerija väljundiga - Pärast diskrimineerija ennustuste saamist koolitage generaatorit diskrimineerijat petma

Generatiivse võistleva võrgustiku väljakutsed

GAN-ide kontseptsioon on üsna põnev, kuid on palju tagasilööke, mis võivad tema teekonnal palju takistada. Mõned peamised väljakutsed, millega GAN silmitsi seisab, on:

  1. Stabiilsus on vajalik diskrimineerija ja generaatori vahel, muidu kogu võrk lihtsalt kukuks. Juhul, kui diskrimineerija on liiga võimas, ei õnnestu generaatorit üldse treenida. Ja kui võrk on liiga leebe, luuakse mis tahes pilt, mis muudab võrgu kasutuks.
  2. GANid ebaõnnestuvad valesti esemete positsioneerimine selle järgi, mitu korda peaks objekt selles kohas esinema.
  3. 3D-perspektiiv häirib GAN-e, kuna see pole võimeline aru saama perspektiivist , annab see kolmemõõtmelise objekti jaoks sageli lameda pildi.
  4. GAN-idel on probleem globaalsed objektid . See ei suuda terviklikku struktuuri eristada ega mõista.
  5. Uuemat tüüpi GAN-id on arenenumad ja eeldatavasti ületavad need puudused täielikult.

Generatiivsed võistleva võrgu rakendused

Järgnevalt on toodud mõned GAN-ide rakendused.

Video järgmise kaadri ennustamine

Tulevaste sündmuste prognoosimine videokaadris on võimalik GAN-ide abil. DVD-GAN või Dual Video Discriminator GAN suudab genereerida 256 × 256 märkimisväärse täpsusega kuni 48 kaadrit pikkust videot. Seda saab kasutada erinevatel eesmärkidel, sealhulgas järelevalve, mille käigus saame määrata tegevused raamistikus, mis moonutatakse muude tegurite, näiteks vihma, tolmu, suitsu jne tõttu.

Tekst pildi loomiseks

Objektipõhine tähelepanelik GAN (obj-GAN), teostab teksti-pildi sünteesi kahes etapis. Semantilise paigutuse genereerimine on esimene etapp ja seejärel on pildi genereerimine sünteesides pilt konvolutsioonivaba pildigeneraatori abil.

Seda saab intensiivselt kasutada piltide loomiseks, mõistes pealdisi, paigutusi ja täpsustades üksikasju sõnade sünteesimisega. StoryGANide kohta on veel üks uuring, mis suudab kogu lõikepildid sünteesida pelgalt lõikudest.

Pildi eraldusvõime suurendamine

Üliseraldusvõimega generatiivne võistlev võrk ehk SRGAN on GAN, mis suudab üliresolutsiooniga pilte genereerida väiksema eraldusvõimega piltidest, millel on peenemad detailid ja parem kvaliteet.

Rakendused võivad olla tohutul hulgal, kujutage ette kõrgekvaliteedilisemat pilti koos väiksema eraldusvõimega pildist loodud peenemate detailidega. Madala eraldusvõimega piltide detailide tuvastamiseks antavat abi võib kasutada laiematel eesmärkidel, sealhulgas järelevalve, dokumenteerimine, turvalisus, mustrite tuvastamine jne.

mis on Java-s anonüümne klass

Pilt pildi tõlkimine

Pix2Pix GAN on mudel, mis on mõeldud üldotstarbelise pildi-pildi tõlkimiseks.

Interaktiivne piltide genereerimine

GAN-e saab kasutada ka interaktiivsete piltide loomiseks, arvutiteaduse ja tehisintellekti labor (CSAIL) on välja töötanud GAN-i, mis suudab luua 3D-mudeleid, millel on kuju ja tekstuuri redigeerimise abil realistlik valgustus ja peegeldused.

Hiljuti on teadlased välja pakkunud mudeli, mis suudab sünteesida inimese liikumisest animeeritud taastatud näo, säilitades samal ajal näo välimuse.

See viib meid selle artikli lõppu, kus oleme õppinud ‘Mis on GAN-id’. Loodan, et teil on selge kõik see, mida teiega selles õpetuses on jagatud.

Kui leiate selle artikli jaotisest „Mis on GAN-id”, vaadake seda usaldusväärne veebiõppeettevõte, mille võrgustik sisaldab üle 250 000 rahuloleva õppija, levis üle kogu maailma.

Oleme siin, et aidata teid igal sammul oma teekonnal ja koostada õppekava, mis on mõeldud üliõpilastele ja spetsialistidele, kes soovivad olla . Kursus on loodud selleks, et anda teile algus Pythoni programmeerimises ja õpetada teid nii Pythoni põhi- kui ka edasijõudnute mõistete jaoks koos erinevate võimalustega meeldib

Kui teil tekib küsimusi, küsige julgelt kõiki oma küsimusi jaotises „Mis on GAN-id” kommentaaride osas ja meie meeskond vastab sellele hea meelega.