Ettenähtav analüüsiprotsess ärianalüüsis koos R-ga



Blogi annab lühikese ettekujutuse ennustava analüüsi protsessist ettevõtteanalüüsis koos R-ga

Tüüpiline modelleerimisprotsess:

Tüüpilises modelleerimisprotsessis on oluline alustada hüpoteesi koostamist. Laekub RFP (Request for Contest) ja seejärel joonistatakse hüpotees.





  1. Määrake õige andmeallikas - Siin võib klient anda andmeallika, kui mitte, peame otsima andmeallikat. Arvestades stsenaariumi, kus püüame hinnata, kes valimised võidaks, viiakse andmete avalik analüüs läbi allikatega, mis hõlmavad sotsiaalmeediat, uudistekanaleid või avalikku arvamust. Samuti peame mõistma probleemi analüüsimiseks vajalike andmete hulka. Sel juhul otsime tavaliselt suuri proove, kuna tegemist on valimisjuhtumiga. Teisest küljest, kui analüüs tehakse tervishoiuteenuste kohta, on suure elanikkonna jaoks keeruline minna, sest on olemas võimalus, et hüpoteesi kinnitamiseks pole piisavalt inimesi. Samuti on andmete kvaliteet väga oluline.
  2. Andmete ekstraktimine - Näiteks kui võtame populatsiooni valimi, võime uuringu algatamiseks uurida selliseid atribuute nagu kõrge sissetulek, madal sissetulek, vanus, töötav elanikkond (väljaspool asukohta / kohapeal), residendid, NRI, haiglate katvus jne. . Siin ei pruugi me hüpoteesi jaoks nii palju atribuute vaja minna. Mõistame, et sellised omadused nagu kõrge ja madal sissetulek ei pruugi olla valimistel võitja määramisel olulised tegurid. Vanus võib aga midagi muuta, sest see annab otsese arvu, kui palju inimesi hääletama läheb. Mitu korda võime välistada vähem kasutatud atribuudid või lisada kasulikke atribuute. Mõlemal juhul võib see valesti minna. See on põhjus, miks analüütika on väljakutse.
  3. Masseerige andmed tööriistaga sobivaks - Seda seetõttu, et kõik tööriistad ei saa kõiki andmeid aktsepteerida. Teatud tööriistad aktsepteerivad ainult CSV-andmeid või Exceli andmeid. Tööriistade puudus on väljakutse.
  4. Käivitage analüüs - Selle toimingu saab läbi viia paljude analüütikatehnikate abil.
  5. Järeldusi tegema - Analüüs annab täpsed numbrid. Kuid nende arvude põhjal saab järeldused teha kasutaja. Näiteks kui seal on kirjas 10% või 20%, peame mõistma, mida see tähendab? Kas see tuletab korrelatsiooni atribuudi A ja atribuudi B vahel?
  6. Tulemuste rakendamine - Ettevõtluses tulemuste nägemiseks on oluline teha järeldused. Näiteks võib järeldada, et 'Inimesed ostavad vihmavarju vihmaperioodil' mille tulemuseks võib olla suurem äritegevus. Siinkohal peame rakendama järelduse, kus teeme vihmavarju poodides kättesaadavaks, kuid siis võib sellel olla juhtimisprobleeme. Hetkel, kui statistika annab tulemuse, võib rakendamine valesti minna.
  7. Jälgige edusamme - Viimane samm, seire mängib olulist rolli. Järelevalve võib valesti minna, sest mitte paljud organisatsioonid ei soovi edusamme jälgida ja seda peetakse tühiseks sammuks. Kuid jälgimine on oluline, sest me saame aru, kas meie uuringud ja järeldused on õiges suunas.

Vaadake ka seda artiklit' Seos ei tähenda põhjuslikku seost 'mis annab ülevaate, kuidas analüütikud võivad valesti minna. Oluline punkt, mida selles tabelis tähele panna, on see, et analüüsi käivitamine on ainus samm, kus masin on aruandekohustuslik ja peale selle on inimese ülesanne, kes otsustab lõpuks, kuidas uuringud tehakse.

Kas teil on meile küsimus? Mainige neid kommentaaride jaotises ja me võtame teiega ühendust.



Seonduvad postitused:

c ++ nimeruumi näide