Mis on närvivõrk? Sissejuhatus kunstlikesse närvivõrkudesse



See närvivõrkude ajaveeb tutvustab teile närvivõrkude põhimõisteid ja seda, kuidas need saavad lahendada keerukaid andmepõhiseid probleeme.

Masinõppe edenemisega on võtnud suure tee. Sügavat õppimist peetakse kõige arenenumaks tehnoloogiaks, mis on loodud massiivseid andmekogumeid kasutavate keeruliste probleemide lahendamiseks. See närvivõrkude ajaveeb tutvustab teile närvivõrkude põhimõisteid ja seda, kuidas need saavad lahendada keerukaid andmepõhiseid probleeme.

Tehisintellekti ja sügava õppimise põhjalike teadmiste saamiseks saate registreeruda otseülekandeks autor Edureka 24/7 toe ja eluaegse juurdepääsuga.





Siin on loetelu teemadest, mida selles käsitletakse Blogi:

  1. Mis on närvivõrk?
  2. Mis on sügav õppimine?
  3. AI, ML ja DL erinevus
  4. Vajadus sügava õppimise järele
  5. Sügava õppimise kasutamise juhtum
  6. Kuidas närvivõrgud töötavad?
  7. Närvivõrk, mida on selgitatud näitega

Närvivõrgu lihtne määratlus

Inimese aju järgi modelleeritud a Neuraalvõrgustik ehitati selleks, et jäljendada inimese aju funktsionaalsust . Inimaju on närvivõrgustik, mis koosneb mitmest neuronist, samamoodi koosneb tehisnärvivõrk (ANN) mitmest perceptronist (selgitatakse hiljem).



mis on java java

Närvivõrk - mis on närvivõrk - Edureka

Närvivõrk koosneb kolmest olulisest kihist:

  • Sisendkiht: Nagu nimigi ütleb, aktsepteerib see kiht kõiki programmeerija sisendeid.
  • Peidetud kiht: Sisend- ja väljundkihi vahel on kihtide kogum, mida nimetatakse peidetud kihtideks. Selles kihis tehakse arvutused, mille tulemuseks on väljund.
  • Väljundkiht: Sisendid läbivad varjatud kihi kaudu teisenduste rea, mille tulemuseks on lõpuks selle kaudu edastatav väljund kiht.

Enne kui jõuame sügavusele, kuidas närvivõrk toimib, mõistkem, mis on sügav õppimine.



Mis on sügav õppimine?

Sügavõpe on masinõppe arenenud valdkond, mis kasutab närvivõrkude mõisteid mitmemõõtmeliste andmete analüüsi hõlmavate väga arvutuslike kasutusjuhtumite lahendamiseks. See automatiseerib tunnuste väljavõtmise protsessi, tagades inimese minimaalse sekkumise.

Mis täpselt on sügav õppimine?

Sügav õppimine on arenenud masinõppe alaväli, mis kasutab aju struktuurist ja funktsioonist inspireeritud algoritme, mida nimetatakse tehisnärvivõrkudeks.

AI, ML ja DL erinevus (tehisintellekt vs masinõpe vs sügavõpe)

Inimesed kipuvad seda sageli arvama , ja Sügav õppimine on samad, kuna neil on ühiseid rakendusi. Näiteks on Siri tehisintellekti, masinõppe ja sügava õppimise rakendus.

Kuidas need tehnoloogiad omavahel seotud on?

  • Tehisintellekt on teadus inimeste käitumist jäljendavatest masinatest.
  • Masinõpe on tehisintellekti (AI) alamhulk, mis keskendub sellele, et masinad saaksid neile andmeid andes otsuseid langetada.
  • Sügav õppimine on masinõppe alamhulk, mis kasutab keerukate probleemide lahendamiseks närvivõrkude mõistet.

Tehisintellekti kokkuvõtteks võib öelda, et masinõpe ja sügavõpe on omavahel seotud valdkonnad. Masinõpe ja süvaõpe aitavad tehisintellekti, pakkudes algoritmide ja närvivõrkude komplekti lahendamiseks andmepõhised probleemid.

Nüüd, kui olete põhitõdedega tuttav, mõistkem, mis tõi kaasa vajaduse süvendatud õppimise järele.

Vajadus sügava õppimise järele: traditsiooniliste masinõppe algoritmide ja tehnikate piirangud

Masinõpe oli tehnilises maailmas suur läbimurre, see viis monotoonsete ja aeganõudvate ülesannete automatiseerimiseni, aitas lahendada keerukaid probleeme ja teha targemaid otsuseid. Masinõppes oli siiski mõni puudus, mis viis sügava õppimise tekkimiseni.

Siin on mõned masinõppe piirangud:

  1. Suuremõõtmelisi andmeid ei saa töödelda: Masinõppega saab töödelda ainult väikeseid muutujaid sisaldavate andmete mõõtmeid. Kui soovite analüüsida 100s muutujaid sisaldavaid andmeid, ei saa masinõpet kasutada.
  2. Funktsioonide kavandamine on käsitsi: Vaatleme juhtumit, kus teil on 100 ennustavat muutujat ja peate kitsendama ainult olulisi. Selleks peate käsitsi uurima iga muutuja suhet ja välja selgitama, millised neist on väljundi ennustamisel olulised. See ülesanne on arendaja jaoks äärmiselt tüütu ja aeganõudev.
  3. Pole ideaalne objektide tuvastamise ja piltide töötlemise jaoks: Kuna objektide tuvastamine nõuab suuremõõtmelisi andmeid, ei saa masinõpet kasutada pildiandmekogumite töötlemiseks, see on ideaalne ainult piiratud hulga funktsioonidega andmekogumite jaoks.

Enne kui jõuame sügavusse Neural Networks, võtame arvesse reaalse kasutamise juhtumit, kus rakendatakse sügavat õppimist.

Sügava õppimise kasutamise juhtum / rakendused

Kas teadsite, et PayPal töötleb enam kui 170 miljoni kliendi nelja miljardi tehingu kaudu tehtud makseid üle 235 miljardi dollari? See kasutab seda tohutut andmemahtu muude põhjuste tuvastamiseks võimalike pettuste tuvastamiseks.

Deep Learning algoritmide abil kaevandas PayPal lisaks oma andmebaasidesse salvestatud tõenäoliste pettuste mustrite ülevaatamisele ka oma kliendi ostuajaloo andmed, et ennustada, kas konkreetne tehing on petlik või mitte.

Ettevõte on umbes 10 aastat toetunud süvendatud õppe ja masinõppe tehnoloogiale. Esialgu kasutas pettuste jälgimise meeskond lihtsaid, lineaarseid mudeleid. Kuid aastate jooksul läks ettevõte üle arenenumale masinõppe tehnoloogiale, nimega Deep Learning.

PayPali pettuseriski juht ja andmeteadlane Ke Wang tsiteeris:

'Mis meile meeldib moodsamast, arenenumast masinõppest, on selle võime tarbida palju rohkem andmeid, käsitseda kihte ja abstraktsioonikihte ning osata' näha 'asju, mida lihtsam tehnoloogia ei näeks, isegi inimesed võivad ei näe. '

pass by value ja pass by reference java

Lihtne lineaarne mudel on võimeline tarbima umbes 20 muutujat. Kuid Deep Learning tehnoloogia abil saab käivitada tuhandeid andmepunkte. Seetõttu rakendades Sügava õppimise tehnoloogia abil saab PayPal lõpuks petturite tuvastamiseks miljoneid tehinguid analüüsida aktiivsus.

Nüüd läheme närvivõrgu sügavustesse ja mõistame nende toimimist.

Kuidas närvivõrk töötab?

Närvivõrkude mõistmiseks peame selle lagundama ja mõistma närvivõrgu kõige põhilisemat üksust, see tähendab Perceptronit.

Mis on Perceptron?

Perceptron on ühekihiline närvivõrk, mida kasutatakse lineaarsete andmete klassifitseerimiseks. Sellel on 4 olulist komponenti:

  1. Sisendid
  2. Kaalud ja eelarvamused
  3. Summeerimisfunktsioon
  4. Aktiveerimise või teisendamise funktsioon

Perceptroni põhiloogika on järgmine:

Sisendkihilt saadud sisendid (x) korrutatakse neile määratud massidega w. Seejärel lisatakse korrutatud väärtused, et moodustada kaalutud summa. Sisendite ja nende vastavate kaalude kaalutud summa rakendatakse seejärel asjakohasele aktiveerimisfunktsioonile. Aktiveerimisfunktsioon kaardistab sisendi vastavasse väljundisse.

Kaalud ja eelarvamused sügavas õppes

Miks peame igale sisendile määrama kaalu?

Kui sisendmuutuja on võrku sisestatud, määratakse selle sisendi kaaluks juhuslikult valitud väärtus. Iga sisendandmete punkti kaal näitab, kui oluline on see sisend tulemuse ennustamisel.

Bias parameeter võimaldab seevastu aktiveerimisfunktsiooni kõverat reguleerida nii, et saavutatakse täpne väljund.

Summeerimisfunktsioon

Kui sisenditele on määratud kaal, võetakse vastava sisendi ja kaalu korrutis. Kõigi nende toodete lisamine annab meile kaalutud summa. Seda teeb summeerimisfunktsioon.

Aktiveerimisfunktsioon

Aktiveerimisfunktsioonide peamine eesmärk on kaalutud summa kaardistamine väljundisse. Aktiveerimisfunktsioonid nagu tanh, ReLU, sigmoid ja nii edasi on transformatsioonifunktsioonide näited.

massiivi sorteerimine c ++

Perceptronsi funktsioonide kohta lisateabe saamiseks võite selle läbi teha Ajaveeb.

Enne meie koondage see ajaveeb, võtame lihtsa näite, et mõista, kuidas närvivõrk töötab.

Näitega selgitatud närvivõrgud

Mõelge stsenaariumile, kus peate ehitama kunstliku närvivõrgu (ANN), mis liigitab pildid kahte klassi:

  • Klass A: sisaldab haigestumata lehtede pilte
  • B klass: sisaldab haigeid lehti

Niisiis, kuidas luua närvivõrk, mis klassifitseerib lehed haigete ja mittehaiguste põllukultuuride hulka?

Protsess algab alati sisendi töötlemisest ja teisendamisest nii, et seda oleks hõlpsasti võimalik töödelda. Meie puhul jaotatakse iga lehepilt piksliteks, sõltuvalt pildi mõõtmetest.

Näiteks kui pilt koosneb 30–30 pikslist, on pikslite koguarv 900. Neid piksleid esitatakse maatriksitena, mis seejärel suunatakse närvivõrgu sisendkihti.

Nii nagu meie ajus on neuroneid, mis aitavad mõtteid üles ehitada ja ühendada, on ka ANNil tajusid, mis aktsepteerivad sisendeid ja töötlevad neid, edastades need sisendkihilt varjatud ja lõpuks väljundkihile.

Kui sisend viiakse sisendkihist peidetud kihini, määratakse igale sisendile juhuslik algkaal. Seejärel korrutatakse sisendid vastavate kaaludega ja nende summa saadetakse sisendina järgmisesse peidetud kihti.

Siin omistatakse igale perceptronile arvväärtus, mida nimetatakse erapoolikuks, mis on seotud iga sisendi kaaluga. Lisaks viiakse iga perceptron läbi aktiveerimise või teisendusfunktsiooni, mis määrab, kas konkreetne perceptron aktiveerub või mitte.

Andmete edastamiseks järgmisele kihile kasutatakse aktiveeritud perceptroni. Sel viisil levitatakse andmeid (edasiliikumine) läbi närvivõrgu, kuni perceptronid jõuavad väljundkihini.

Väljundkihil tuletatakse tõenäosus, mis otsustab, kas andmed kuuluvad A- või B-klassi.

Tundub lihtne, kas pole? Närvivõrkude kontseptsioon põhineb puhtalt inimese aju toimimisel. Te vajate põhjalikke teadmisi mitmesugustest matemaatilistest mõistetest ja algoritmidest. Alustamiseks on järgmine ajaveebide loend:

  1. Mis on sügav õppimine? Sügava õppimisega alustamine
  2. Sügav õppimine Pythoni abil: sügava õppimise juhend algajatele

Kui leiate, et see ajaveeb on asjakohane, vaadake järgmist Edureka, usaldusväärne veebiõppeettevõte, mille võrgustik hõlmab üle 250 000 rahuloleva õppija, levinud üle kogu maailma. Kursus Edureka Deep Learning with TensorFlow sertifitseerimiskoolitus aitab õppijatel saada ekspertideks põhi- ja konvolutsiooniliste närvivõrkude koolitamisel ning optimeerimisel, kasutades reaalajas toimuvaid projekte ja ülesandeid koos selliste kontseptsioonidega nagu funktsioon SoftMax, automaatkodeerija närvivõrgud, piiratud Boltzmanni masin (RBM).