R-õpetus - algajate juhend R-programmeerimise õppimiseks



See R Tutoriali ajaveeb tutvustab teile R-tööriista ja aitab teil näidete abil üksikasjalikult mõista R-i programmeerimise erinevaid aluseid.

R on populaarseim andmeanalüütika tööriist, kuna see on avatud lähtekoodiga, paindlik, pakub mitut paketti ja sellel on tohutu kogukond. See on loodud nii tarkvaraprogrammeerijatele, statistikutele kui ka andmekaevuritele ja seetõttu on see populaarsust tekitanud .Selles R Tutoriali blogis annan teile täieliku ülevaate R-st koos näidetega.

Allpool on toodud selle R-õpetuse ajaveebi teemad, mida arutan järgmises järjestuses:





  1. Miks me vajame Analyticsi ?
  2. Mis on ärianalüüs ?
  3. Miks R ja kes kasutab R-d ?
  4. R paigaldamine
  5. Andmeoperaatorid
  6. Andmetüübid
  7. Voolu juhtimine

R Juhendaja: miks me vajame analüüsi?

Enne kui vastan küsimusele, lubage mul lühidalt tutvustada mõningaid probleeme ja nende lahendusi R-is mitmes domeenis.



pangandus - R Õpetus - Edureka

Pangandus :

Pankades genereeritakse igapäevaselt suur hulk klientide andmeid. WMiljonite klientidega regulaarselt tegeledes on nende hüpoteeklaene raske jälgida.



Lahendus :

R loob kohandatud mudeli, mis hoiab igale kliendile antud laene, mis aitab meil otsustada, millise summa klient aja jooksul maksab.

Kindlustus :

Kindlustus sõltub suuresti prognoosimisest. Seda on raskeotsustada, millise poliitikaga nõustuda või tagasi lükata.

Lahendus:

Kasutades sisendina pidevat krediidiaruannet, saame R-s luua mudeli, mis mitte ainult ei hinda riskiisu, vaid teeb ka ennustava prognoosi.

Tervishoid:

Igal aastal võetakse haiglasse miljoneid inimesi ja aastas kulutatakse miljardeid inimesi vaid vastuvõtuprotsessi käigus.

Lahendus :

Arvestades patsiendi anamneesi ja haiguslugu, saab koostada ennustava mudeli, et teha kindlaks, kes on haiglaravi ohus ja millises ulatuses tuleks meditsiiniseadmeid skaleerida.

Nüüd teame, kuidas andmeanalüüs aitab organisatsioonidel oma andmeid rakendada ja kasutada uute võimaluste tuvastamiseks. Kui räägime analüüsi vajadusest organisatsioonis, peate kokku puutuma nende nelja aspektiga:

Järgmisena liigume edasi R-õpetuse ajaveebis, kus saame kõigepealt aru, mis on ärianalüüs.

R Juhendaja: mis on ärianalüüs?

Ärianalüütika on protsess, kus uuritakse suuri andmehulki ning saavutatakse varjatud mustrid, seosed ja muud teadmised. Põhimõtteliselt aitab see teil mõista kõiki teie kogutud andmeid, olgu need siis organisatsioonilised andmed, turu või tooteuuringute andmed või muud liiki andmed. Teil on lihtne teha paremaid otsuseid, paremaid tooteid, paremaid turundusstrateegiaid jne. Parema mõistmise huvides vaadake allolevat pilti:

Kui vaatate ülaltoodud joonist, on teie andmed esimesel pildil hajutatud. Kui soovite andmebaasi midagi konkreetset, näiteks konkreetset kirjet, muutub see tülikaks. Selle lihtsustamiseks vajate analüüsi. Analüüsiga muutub andmete vahel korrelatsiooni leidmine lihtsaks. Kui olete kindlaks teinud, mida teha, on teil üsna lihtne teha otsuseid, näiteks seda, millist rada soovite minna või mis on seotud ettevõtlusanalüütikaga, milline tee viib teie organisatsiooni paranemiseni.

Kuid te ei saa eeldada, et ülaltoodud ahelas olevad inimesed mõistavad alati algandmeid, mille te neile pärast analüüsi esitate. Nii et selle lõhe ületamiseks on meil mõte andmete visualiseerimine .

Andmete visualiseerimine : Andmete visualiseerimine on visuaalne juurdepääs tohututele andmetele, mille olete pärast analüüsi loonud. Inimese mõte töötleb visuaalseid pilte ja visuaalne graafika on parem kui algandmetega võrrelda. Meil on alati lihtne aru saada sektordiagrammist või tulpdiagrammist, võrreldes toorarvudega. Nüüd võite mõelda, kuidas saaksite seda andmete visualiseerimist juba analüüsitud andmete põhjal?
Andmete visualiseerimise turul on saadaval mitmesuguseid tööriistu:

Te kõik mõtlete, kas on juba nii palju tööriistu, mis aitavad teil andmete visualiseerimist ja teatud hulga analüüsi saavutada, miks minna R-ga?

Nii et minu järgmine teema R õpetusblogis käsitleb ‘miks R’ ja ‘kes kasutab R’.

R Juhendaja: Miks R ja kes R-d kasutab?

Miks R?

R on programmeerimis- ja statistikakeel.

R-d kasutatakse andmete analüüsimiseks ja visualiseerimiseks.

R on lihtne ja lihtne õppida, lugeda ja kirjutada.

R on näide FLOSS-ist (Free Libre ja Open Source Software), kus saab vabalt levitada selle tarkvara koopiaid, lugeda selle lähtekoodi, seda muuta jne.

Kes kasutab R-d?

  • Tarbijate finantskaitse büroo kasutab andmete analüüsimiseks R-i
  • John Deere'i statistikud kasutavad R-i aegridade modelleerimiseks ja georuumianalüüsiks usaldusväärsel ja taasesitataval viisil.
  • Bank of America kasutab aruandluseks R-d.
  • R on osa Foursquare'i kuulsa soovitusmootori taga olevast tehnoloogiast.
  • ANZ, Austraalia suuruselt neljas pank, kasutades krediidiriski analüüsiks R-d.
  • Google kasutab majandustegevuse prognoosimiseks R-d.
  • Firefoxi veebibrauseri eest vastutav fond Mozilla kasutab veebitegevuse visualiseerimiseks R-i.

Allpool on mõned domeenid, kus R-d kasutatakse:

Nüüd liigume R-õpetuse ajaveebis edasi ja installime R-i.

R Juhendaja: R installimine

Las ma juhatan teid läbi R-i installimise teie süsteemi. Järgige lihtsalt järgmisi samme:

Samm 1 : Minge lingile https://cran.r-project.org/

2. samm : Laadige alla ja installige R 3.3.3 oma süsteemi.

Parema arusaamise saamiseks vaadake allolevat ekraanipilti.

Järgides ülaltoodud samme, olete lõpetanud R-i installiosa. Nüüd saate otse R-s kodeerimist alustada, alla laadides RStudio IDE. Selle allalaadimiseks toimige järgmiselt.

Samm 1 : Minge lingile - https://www.rstudio.com/

2. samm : Laadige alla ja installige Rstudio oma süsteemi.

kuidas Pythonis objekti initsialiseerida

Pärast kõige installimist olete kõik seadistanud koodi!

R õpetus algajatele | R programmeerimise õpetus | Edureka

Järgmisena liigume R Tutoriali blogis edasi ja mõistame, mis on R-i andmeoperaatorid

R Juhendaja: andmesideoperaatorid R-s

Seal on peamiselt 5 erinevat tüüpi operaatorit, mis on loetletud allpool:

  1. Aritmeetikaoperaatorid : Tehke aritmeetilisi toiminguid nagu liitmine, lahutamine, korrutamine, jagamine jne.
  2. Ülesandeoperaatorid :Väärtuste määramiseks kasutatakse määranguoperaatoreid. Näiteks:
  • Ülesandeoperaator =
    Süntaks:
    muutuja nimi = väärtus
> x = 5 >x 
Väljund: [1] 5
  • Ülesandeoperaator<-
    Süntaks:
    muutuja nimi<- value

    > x<- 15 > x
    Väljund: [1] 15
  • Ülesandeoperaator<<-
    Süntaks:
    muutuja nimi<<- value
> x<<- 2 > x
Väljund: [1] 2
  • Ülesandeoperaator ->
    Süntaks:
    väärtus -> muutuja nimi

    > 25 -> x > x 
    Väljund: [1] 25

3. Suhteoperaator : See määratleb seose kahe üksuse vahel. Näiteks: ,<=,!= etc.

> xx! = 2
Väljund:[1] TÕENE

4. Loogilised operaatorid : Need operaatorid võrdlevad kahte olemit ja neid kasutatakse tavaliselt loogiliste (loogiliste) väärtustega nagu &, | ja!

> x2 ja 3
Väljund:[1] TÕENE

5. Erioperaatorid : Neid operaatoreid kasutatakse konkreetseks otstarbeks, mitte loogiliseks arvutamiseks. Näiteks:

  • See loob vektori järjestikuse arvude rea.

    > xx
    Väljund: [1] 2 3 4 5 6 7 8
  • % in% Seda operaatorit kasutatakse tuvastamaks, kas element kuulub vektorisse.
    Näide

    > xyy%% x-s
    Väljund: [1] TÕENE

R Juhendaja: andmetüübid

Andmetüüpe kasutatakse teabe salvestamiseks. R-s ei pea me muutujat mingiks andmetüübiks deklareerima. Muutujad määratakse R-objektidega ja R-objekti andmetüübist saab muutuja andmetüüp.R-s on peamiselt kuus andmetüüpi:

Läheme üksikasjalikumalt igaühe kohta:

Vektor : Vektor on sama põhitüübi andmeelementide jada. Näide:

vtr = (1, 3, 5, 7 9)

või

vtr<- (1, 3, 5 ,7 9)

Seal on 5 aatomivektorit, mida nimetatakse ka viieks vektorite klassiks.

Nimekiri : Loendid on R-objektid, mis sisaldavad erinevat tüüpi elemente nagu & miinus arvud, stringid, vektorid ja veel ühe loendi.

> n = c (2, 3, 5) > s = c ('aa', 'bb', 'cc', 'dd', 'ee') > x = loend (n, s, TÕENE) > x

Väljund -

[[1]] [1] 2 3 5 [[2]] [1] 'aa' bb '' cc '' dd '' ee '[[3]] [1] TÕSI

Massiivid : Massiivid on R andmeobjektid, mis suudavad andmeid salvestada rohkem kui kahes dimensioonis. See võtab vektoriteks sisendi ja kasutab massiivi loomiseks dim-parameetri väärtusi.

vektor1<- c(5,9,3) vektor2<- c(10,11,12,13,14,15) tulemus<- array(c(vector1,vector2),dim = c(3,3,2))

Väljund -

,, 1 [, 1] [, 2] [, 3] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15 ,, 2 [, 1] [, 2] [, 3 ] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15

Massiivid : Maatriksid on R objektid, milles elemendid on paigutatud kahemõõtmelise ristkülikukujulise paigutusega. Maatriks luuakse funktsiooni maatriks () abil. Näide: maatriks (andmed, nrow, ncol, byrow, dimnames) kus

andmed on sisendvektor, mis muutub maatriksi andmeelementideks.

now on loodavate ridade arv.

ncol on loodavate veergude arv.

byrow on loogiline vihje. Kui TÕENE, siis sisendvektori elemendid on järjestatud rea järgi.

hämar nimi on ridadele ja veergudele määratud nimed.

> Mat<- matrix(c(1:16), nrow = 4, ncol = 4 ) > Mat
Väljund :
[, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Tegurid : Tegurid on andmeobjektid, mida kasutatakse andmete kategoriseerimiseks ja nende salvestamiseks tasemetena. Nad saavad salvestada nii stringe kui ka täisarvusid. Need on kasulikud statistilise modelleerimise andmete analüüsimisel.

> andmed<- c('East','West','East','North','North','East','West','West“,'East“) > teguri_andmed<- factor(data) > teguri_andmed

Väljund :

[1] Ida-ida ida põhja kirde-lääne-lääne ida Tasemed: ida loode idaosa

Andmeraamid : Andmeraam on tabel või kahemõõtmeline massiivitaoline struktuur, milles iga veerg sisaldab ühe muutuja väärtusi ja iga rida sisaldab igast veerust ühte väärtuste komplekti.

> std_id = c (1: 5) > std_name = c ('Rick', 'Dan', 'Michelle', 'Ryan', 'Gary') > märgid = c (623,3 515,2 611,0 729,0 843,25) > standardandmed<- data.frame(std_id, std_name, marks) > standardandmed

Väljund :

std_id std_name märgid 1 1 Rick 623.30 2 2 ja 515,20 3 3 Michelle 611.00 4 4 Ryan 729,00 5 5 Gary 843,25

Selle abil jõuame R-s erinevate andmetüüpide lõpuni. Edasi liikugem edasi R-õpetuse ajaveebis ja mõistkem veel ühte võtmekontseptsiooni - voo juhtimise avaldusi.

R Juhendaja: voo juhtimise avaldused

Voo juhtimise avaldustel on väga oluline roll, kuna need võimaldavad teil kontrollida funktsiooni sees oleva skripti täitmise voogu. Kõige sagedamini kasutatavad voo juhtimise avaldused on toodud alloleval pildil:

Nüüd arutleme neist igaühe näidetega.

R Õpetus: Valija avaldused

  • Kui kontrolli avaldus : Selles kontrolllauses hinnatakse ühte tingimust. See on üsna lihtne, kuna sellel on lihtsalt üks märksõna „kui”, millele järgneb tingimus ja seejärel teatud hulk lauseid, mis peavad täitma juhul, kui see on tõsi. Parema arusaamise saamiseks vaadake allolevat vooskeemi:

Selles vooskeemis vastab kood järgmiselt:

  1. Kõigepealt siseneb see silmusesse, kus ta seisukorda kontrollib.
  2. Kui tingimus on tõene, täidetakse tingimuslik kood või kirjutatud avaldused.
  3. Kui tingimus on vale, ignoreeritakse lauseid.

Allpool on näide kui juhtlause R-s. Proovige seda näidet käivitada R Studios.

x = 2 korda {x = x ^ 2 print (x) if (x> 100) {break}

Väljund:

[1] 4 [1] 16 [1] 256
  • Kui muu kontrollavaldus :Eksams kontrollakti tüüphindab tingimuste rühma ja valib väited. Parema arusaamise saamiseks vaadake allolevat vooskeemi:

Selles vooskeemis vastab kood järgmiselt:

  1. Kõigepealt siseneb see silmusesse, kus ta seisukorda kontrollib.
  2. Kui tingimus on tõene, täidetakse esimesed väited „kui”.
  3. Kui tingimus on vale, läheb see tingimusele „muu kui” ja kui see on tõene, käivitatakse kood „muu kui”.
  4. Lõpuks, kui kood „muu kui” on samuti vale, siis läheb see koodiks „muu” ja see käivitatakse. See tähendab, et kui ükski neist tingimustest ei vasta tõele, täidetakse lause „muu”.

Allpool on näide kui veel juhtlause R-s. Proovige seda näidet käivitada R Studios.

x5) {print ('x on suurem kui 5')} elseif (x == 5) {print ('x on võrdne 5')} else {print ('x pole suurem kui 5')}

Väljund:

[1] 'x on võrdne 5'
  • Lülita avaldusi : Neid kontrolllauseid kasutatakse põhimõtteliselt teatud avaldise võrdlemiseks teadaoleva väärtusega. Parema arusaamise saamiseks vaadake allolevat vooskeemi:

Selles Switchi juhtumite vooskeemis reageerib kood järgmiste sammudega:

  1. Kõigepealt sisestatakse see lüliti juhtumisse, millel on avaldis.
  2. Järgmisena läheb see 1. juhtumi tingimusesse, kontrollib tingimusele edastatud väärtust. Kui see on tõsi, käivitatakse lauseplokk. Pärast seda katkestatakse see lüliti juhtum.
  3. Kui see on vale, lülitub see järgmisele juhtumile. Kui 2. juhtumi tingimus on tõene, täidab see lause ja katkestab selle juhtumi, vastasel juhul hüpatakse uuesti järgmise juhtumi juurde.
  4. Oletame, et te pole ühtegi juhtumit määranud või kasutaja on sisestanud vale sisendi, seejärel läheb see vaikimisi, kus see printib teie vaikeväljavõtte.

Allpool on näide lülitilausest R-s. Proovige seda näidet käivitada R Studios.

vtr<- c(150,200,250,300,350,400) option <-'mean' switch(option, 'mean' = print(mean(vtr)), 'mode' = print(mode((vtr))), 'median' = print(median((vtr))) ) 

Väljund:

[1] 275

R Õpetus: aaselaused

Silmused aitavad teil teatud toiminguid korrata, nii et te ei pea neid korduvalt sooritama. Kujutage ette, et peate toimingu sooritama kümme korda, kui hakkate igaks korraks koodi kirjutama, suureneb programmi pikkus ja teil oleks sellest hiljem raske aru saada. Kuid samal ajal kui kasutan tsüklit, säästab see aega ja lihtsustab koodi loetavust, kui kirjutan sama lause tsükli sisse. Samuti optimeeritakse seda koodi tõhususe osas.

Ülaltoodud pildil kordama ’ ja samas 'Avaldused aitavad teil täita teatud reegleid, kuni tingimus on tõene, kuid' eest on tsükli lause, mida kasutatakse siis, kui teate, mitu korda soovite lauseplokki korrata. Kui teate, et soovite seda korrata kümme korda, siis kasutate lauset „for”, kuid kui te pole kindel, mitu korda soovite koodi korrata, lähete valiku „repeat” või 'samas' silmus.

Arutleme neist igaühe näidetega.

  • Korda : Kordusring aitab sama koodikomplekti uuesti ja uuesti käivitada, kuni peatamistingimus on täidetud. Parema arusaamise saamiseks vaadake allolevat vooskeemi:

Ülaltoodud vooskeemil reageerib kood järgmiste sammudega:

  1. Kõigepealt sisestab ja käivitab koodikomplekti.
  2. Järgmisena kontrollib see tingimust, kui see on tõsi, läheb see tagasi ja käivitab sama koodikomplekti uuesti, kuni see on mõeldud valeks.
  3. Kui leitakse, et see on vale, väljub see silmusest otse.
  • Kuigi : Ajalause aitab ka sama koodikomplekti uuesti ja uuesti käivitada, kuni peatamistingimus on täidetud. Parema arusaamise saamiseks vaadake allolevat vooskeemi:

Ülaltoodud vooskeemil reageerib kood järgmiste sammudega:

  1. Kõigepealt kontrollib see seisukorda.
  2. Kui leitakse, et see vastab tõele, täidab see koodikomplekti.
  3. Järgmisena kontrollib see uuesti tingimust, kui see vastab tõele, käivitab sama koodi uuesti. Niipea kui tingimus leitakse olevat vale, väljub see koheselt silmusest.

Allpool on näide R. lause lausest. Proovige seda näidet käivitada R Studio'is.

x = 2 samas (x<1000) { x=x^2 print(x) } 

Väljund:

4 16 256 65 536

Nii et peate kindlasti mõtlema, kuidas need kaks väidet erinevad? Las ma puhastan teie kahtluse!
Siin on peamine erinevus korduse ja samas lause vahel selles, et see muutub teie seisundi suhtes. Kuigi loop määratleb põhimõtteliselt, millal te sisestate tsükli, et käivitada avaldused ja kordama loop määrab, kui lahkute pärast lausete täitmist silmusest. Seega on need kaks lauset tuntud kui sisenemise juhtimise ja väljumise juhtimise silmus. Nii on erinevad ja korduvad väited erinevad.

  • Loopi jaoks: Silmuseid kasutatakse siis, kui peate mitu korda koodiploki käivitama. Parema arusaamise saamiseks vaadake allolevat vooskeemi:

Ülaltoodud vooskeemil reageerib kood järgmiste sammudega:

  1. Kõigepealt on initsialiseerimine, kus määrate mitu korda soovite tsüklit korrata.
  2. Järgmisena kontrollib see seisukorda. Kui tingimus on tõene, käivitab see koodikomplekti määratud arvu kordi.
  3. Niipea kui tingimus leitakse olevat vale, väljub see koheselt silmusest.

Allpool on näide lausest R-s. Proovige seda näidet R Studio'is käivitada.

vtr<- c(7,19,25,65, 45) for( i in vtr) { print(i) } 

Väljund:

7 19 25 65 45

Järgmisena liigume R Tutoriali ajaveebis oma viimase avalduste komplekti juurde, st hüppelausetega.

R Õpetus: hüpata avaldused

Katkestuse avaldus : Break-laused aitavad programmi lõpetada ja jätkavad juhtimist järgmise tsükli järgse lause juurde. Neid väiteid kasutatakse ka vahetuse puhul. Parema arusaamise saamiseks vaadake allolevat vooskeemi:

Ülaltoodud vooskeemil reageerib kood järgmiste sammudega:

  1. Kõigepealt siseneb see silmusesse, kus ta seisukorda kontrollib.
  2. Kui silmuse tingimus on vale, väljub see silmusest otse.
  3. Kui tingimus on tõene, kontrollib see siis katkestuse seisukorda.
  4. Kui katkestustingimus on tõene, eksisteerib see tsüklist.
  5. Kui katkestustingimus on vale, täidab see tsüklisse jäänud laused ja kordab samu samme.

Allpool on näide hüppelausest R. Proovige seda näidet käivitada R Studio'is.

x<- 1:5 for (val in x) { if (val == 3){ break } print(val) } 

Väljund:

[1] 1 [1] 2

Järgmine avaldus : Järgmist lauset kasutatakse siis, kui soovite silmu praeguse iteratsiooni vahele jätta seda lõpetamata. Järgmine lause on üsna sarnane mõnes teises programmeerimiskeeles olevale jätkamisele. Parema arusaamise saamiseks vaadake allolevat vooskeemi:

Ülaltoodud vooskeemil reageerib kood järgmiste sammudega:

kuidas kasutada goto Pythonis
  1. Kõigepealt siseneb see silmusesse, kus ta seisukorda kontrollib.

  2. Kui silmuse tingimus on vale, väljub see silmusest otse.

  3. Kui tsükli tingimus on tõene, täidab see ploki 1 laused.

  4. Pärast seda kontrollib ta järgmist lauset. Kui see on olemas, siis pärast seda tehtud väiteid tsükli sama iteratsioonina ei täideta.

  5. Kui ‘järgmine’ lauset pole, siis täidetakse kõik selle järel olevad laused.

Allpool on näide järgmisest väitest R-s. Proovige seda näidet R Studio'is käivitada.

jaoks (i sisse 1:15) {if ((i %% 2) == 0) {järgmine} print (i)}

Väljund:

1 3 5 7 9 11 13 15

See on R-õpetuse ajaveebi lõpp. Ma loodan, et teil on selge iga kontseptsioon, mida ma eespool käsitlesin. Püsige lainel, minu järgmine ajaveeb on R-koolitusel, kus selgitan ex-iga üksikasjalikumalt veel mõnda R-i mõistetrohkesti.

Nüüd, kui olete R-i põhitõdedest aru saanud, vaadake järgmist Edureka, usaldusväärne veebiõppeettevõte, mille võrgustik hõlmab üle 250 000 rahuloleva õppija, levinud üle kogu maailma. Edureka R-koolitusega andmeanalüüs aitab teil saada teadmisi R-i programmeerimise, andmetega manipuleerimise, uuriva andmete analüüsi, andmete visualiseerimise, andmekaevanduse, regressiooni, meeleolude analüüsi ja R Studio kasutamise kohta reaalses elus juhtumiuuringutena jaemüügis, sotsiaalmeedias.

Kas teil on meile küsimus? Palun mainige seda selle R-õpetuse ajaveebi kommentaaride osas ja võtame teiega ühendust niipea kui võimalik.