Google Data Science intervjuu küsimused: kõik, mida peate selle purustamiseks teadma



See artikkel annab teile hulga Google Data Science Interview Questiosni, intervjuuprotsessi ja eeldused Google'i tööle kandideerimiseks.

Palgamine sellisesse ülemaailmselt tuntud ettevõttesse nagu Google on unistuste töö paljudele inimestele. Neil on mõned andekamad tehisintellekti teadlased, ja maailmas. Google'i jaoks pole palju allikaid Intervjuu Küsimused veebis ja seal pole lihtne tööd saada. Seega käsitlen selles artiklis järgmisi teemasid:

Ametijuhend ja nõuded

Keskmise palgaga 169 067 dollarit , sealhulgas boonus. Google Data Scientisti palk on vahemikus 120 000 - 280 000 dollarit . Selle kõrge palga korral peate teadma õigeid nõudeid tööle, mida kandideerite. Kuigi nõuded on asukohiti erinevad, on allpool toodud mõned levinumad nõuded:

Miinimumnõue:





määrake java klassirada Linuxis

google

  • Kvantitatiivse distsipliini magistrikraad (statistika, operatsiooniuuringud, arvutiteadus)
  • 2-aastane töökogemus andmeanalüüsiga seotud valdkonnas
  • Kogemus statistikatarkvaraga (nt R , , MATLAB, Pandas) ja
  • Kogemus andmebaasikeeltega (nt SQL )

Kohustused:



on magistrikraad kraadiõppes
  • Töö suurte, keeruliste andmekogumitega. Lahendage keerulisi rutiiniväliseid analüüsiprobleeme, rakendades vajadusel täiustatud analüüsimeetodeid
  • Teostage analüüs, mis hõlmab andmete kogumist ja nõuete täpsustamist, töötlemist, analüüsi, käimasolevaid tulemusi ja esitlusi
  • Ehitamine ja prototüüpide analüüsiliinide kordus, et anda ulatuslikku ülevaadet
  • Arendage igakülgseid teadmisi Google'i andmestruktuuride ja -mõõdikute kohta, toetades muudatusi, kui see on vajalik tootearenduseks
  • Suhelge funktsionaalselt, tehes ärisoovitusi (nt kulude-tulude prognoosimine, katseanalüüs)
  • Uurige ja arendage analüüsi-, prognoosimis- ja optimeerimismeetodeid, et parandada Google'i kasutajatele suunatud toodete kvaliteeti

Google Data Science'i intervjuuprotsess

Esinimekirja kustutamine on iseenesest raske ülesanne, mis sõltub täielikult teist CV, kaaskiri ja Kogemused . Google Andmeteadus Intervjuuküsimused on segu peaajuritest ja tehnilistest päringutest. Tavaliselt on esimene protsess telefonivestlus.

Telefonivestlus:

See koosneb küsimustest, mis põhineb peamiselt (konkreetne ja teoreetiline) ning tugineb suuresti . Küsimused varieeruvad ka olenevalt projektidest, mille kallal olete töötanud.
  • 1. juhtum: Intervjuudes oli küsitud funktsioonide väljavõtte tehnikat, PCA-d (kasutatud projektides), korrelatsioonianalüüsi, mõningaid kasutatud klassifitseerimistehnikaid (SVM, GBM, närvivõrk). Miks mitte logistiline regressioon, miks GBM? - Põhimõtteliselt küsimused, mis pöörlevad klassi lahutatavuse ümber.
  • 2. juhtum: Miks kasutada funktsioonide valikut? Kui kaks ennustajat on tugevalt korrelatsioonis, siis kuidas mõjutab logistilise regressiooni koefitsiente? Millised on koefitsientide usaldusvahemikud?
  • 3. juhtum: Ketas pöörleb spindlil ja te ei tea, mis suunas ketas pöörleb. Teile antakse komplekt tihvte. Kuidas kasutate tihvte, et kirjeldada plaadi pöörlemise viisi?
Pärast telefoniintervjuusid on see näost näkku ja kodeerimisvoorud. Niisiis, arutame mõningaid levinumaid Google Data Science'i intervjuuküsimusi. Kuigi neid küsimusi ei pruugita esitada täpselt nii, nagu allpool on toodud, olen püüdnud paljusid neist käsitleda.

Google Data Science intervjuu küsimused

Need küsimused pole mõistatuslikud probleemid, kuna Google on nende küsimuste esitamise lõpetanud, neil on sarnased küsimused, mida nad nimetavad Probleemide lahendamise küsimused . Esitatakse palju masinõppe küsimusi, alates üldistest kuni praktiliste küsimusteni. Google hõlmab põhimõtteliselt pigem teemade kui sügavuse laiust. Q1. Olete kasiinos ja teil on mängida kaks täringut. Võidad 10 dollarit iga kord, kui mängid 5-ga. Kui mängid kuni võiduni ja siis lõpetad, siis milline on eeldatav väljamakse? Q2. Hakkate Londonisse lennukile minema, tahate teada, kas peate vihmavarju kaasa võtma või mitte. Helistate kolmele suvalisele sõbrale ja igaühele neist, kui vihma sajab. Tõenäosus, et teie sõber räägib tõtt, on 2/3 ja tõenäosus, et nad valetades teile jant mängivad, on 1/3. Kui nad kõik 3 ütlevad, et vihma sajab, siis kui suur on tõenäosus, et Londonis tegelikult sajab. Q3. Kuidas lisaks uut Facebook liikmed andmebaasi liikmed ja kodeerida nende suhted teistega andmebaasis? Q4. Kuidas testite, kas kasutajal on suurem tõenäosus pärast 6 kuud aktiivseks jääda, arvestades, et kasutajal on praegu rohkem sõpru? Q5. Teile antakse 40 kaarti nelja erineva värviga - 10 rohelist kaarti, 10 punast kaarti, 10 sinist kaarti ja 10 kollast kaarti. Iga värvi kaardid on nummerdatud ühest kümneni. Kaks kaarti valitakse juhuslikult. Uurige välja tõenäosus, et valitud kaardid pole sama numbri ja sama värvi. Q6. Erinevate säutsudega tekstifaili lugemiseks looge programm valitud keeles. Väljund peaks olema 2 tekstifaili - üks, mis sisaldab kõigi säutsude seas kõigi unikaalsete sõnade loendit koos korduvate sõnade loendiga ja teine ​​fail peaks sisaldama kõigi säutsude keskmist unikaalsete sõnade arvu. Q7. Mida teete, kui andmekogust puuduvate väärtuste eemaldamine põhjustab kallutatust? Q8. Ketas pöörleb spindlil ja te ei tea, mis suunas ketas pöörleb. Teile antakse komplekt tihvte. Kuidas kasutate tihvte, et kirjeldada, kuidas plaat pöörleb? Q9. Kuidas kujundate töökohtade jaoks soovitusmootori? Q10. Millist toodet soovite Google'is ehitada? Q11. Autodele implanteeritakse kiiruseregulaator, et kindlustusseltsid saaksid jälgida meie sõiduseisundit. Millistele äriküsimustele saab selle uue skeemi põhjal vastata? Q12. Kuidas saab otsustada, kas üks algoritm on parem kui teine? Q13. Karbis on 12 punast ja 12 musta kaarti. Teises kastis on 24 punast ja 24 musta kaarti. Soovite ühest kahest kastist juhuslikult välja tõmmata kaks kaarti, millisel kastil on suurem tõenäosus saada sama värvi kaarte ja miks? Q14. Mis vahe on kotis oleval mudelil ja võimendatud mudelil? Q15. Loote kasutajate sisu üleslaadimise aruande iga kuu ja jälgige jaanuari kuu üleslaadimiste arvu järsku suurenemist. Üleslaadimiste arv on suurenenud, eriti piltide üleslaadimiste arv. Mis on teie arvates selle põhjuseks ja kuidas katsetate seda äkilist piiki? Q16. Teile kuulub rõivaettevõte ja soovite parandada oma kohta turul. Kuidas te seda teete maapinnalt? Q17. Kuidas otsustate, millised kahe üleliigse hinnakujunduse algoritmi versioonid töötavad paremini iga lennuettevõtte jaoks? Q18. Mis on lasso vabaduse aste? Q19. Mis vahe on Pythonis iteraatori, generaatori ja loendi mõistmisel? Q20. Arvestades veebilehtede ja muudatuste kogumit veebisaidil, kuidas testite uut veebisaidi funktsiooni, et teha kindlaks, kas muudatus töötab positiivselt? Q21. Arvestades MxN-i dimensioonimaatriksit koos iga tähestikku sisaldava lahtriga, leidke, kas string sisaldab seda või mitte. Q22. Kuidas koostate vahemälusüsteemi, kasutades täiustatud andmestruktuuri nagu hashmap? Q23. Kui saaksite andmekogumi mis tahes huvipakkuval teemal, hoolimata kogumismeetoditest või ressurssidest, siis kuidas see andmekogum välja näeks ja mida te sellega teete? Q24. Mis on anomaaliate tuvastamise meetodid? Q25. Kuidas vahemälu töötab ja kuidas te seda andmeteaduses kasutate? Nii et poisid, sellega oleme selle artikli lõpetanud. Google Data Science Intervjuu küsimused on enamasti stsenaariumi põhjal ja nõuate, et teil on Probleemide lahendamise võimed ja pealegi peate teadma, kuidas andmeteadust nendes olukordades rakendada. Loodan, et see annab teile perspektiivi, et olla valmis mis tahes andmeteaduse intervjuuks tulevikus. Olgu selleks Google, Microsoft, Apple või Uber. Kõik tehnilised hiiglased esitavad andmeteaduse osas sarnaseid küsimusi, kuna see on tohutu ja samal ajal uus valdkond. paneb sind tundma andmeteaduste spetsialistide kasutatavaid tööriistu ja süsteeme. See hõlmab koolitust statistika, andmeteaduse, Pythoni, Apache Spark & ​​Scala, Tensorflow ja Tableau kohta. Õppekava on määratud üle 5000 inimese ametijuhendite ulatuslike uuringutega kogu maailmas. Kui teil on küsimusi, mainige seda julgelt allpool olevas kommentaaride jaotises.