Andmeteaduse intervjuuküsimused
BrainStationi Data Scientisti karjäärijuhend aitab teil teha esimesi samme tulusa andmeteaduse karjääri suunas. Lugege edasi, et saada ülevaade levinumate intervjuuküsimuste kohta andmeteaduse töökohtade jaoks ja kuidas neile kõige paremini vastata.
Hakka andmeteadlaseks
Rääkige õppenõustajaga, et saada lisateavet selle kohta, kuidas meie alglaagrid ja kursused aitavad teil saada andmeteadlaseks.
Klõpsates nuppu Esita, nõustute meiega Tingimused .
Esita
Ei saanud esitada! Kas värskendada lehte ja proovida uuesti?
Lisateavet meie Data Science Bootcampi kohtaAitäh!
Võtame varsti ühendust.
Vaadake Data Science Bootcampi lehte
Andmeteaduse intervjuu protsessid võivad ettevõttest ja tööstusest olenevalt erineda. Tavaliselt hõlmavad need esialgset telefoniuuringut värbamisjuhiga, millele järgneb üks või mitu kohapealset intervjuud.
Peate vastama tehnilistele ja käitumuslikele andmeteaduse intervjuu küsimustele ja tõenäoliselt lõpetate oskustega seotud projekti. Enne iga intervjuud peaksite oma CV ja portfoolio üle vaatama ning valmistuma potentsiaalseteks intervjuuküsimusteks.
Andmeteaduse intervjuu küsimused panevad proovile teie statistika, programmeerimise, matemaatika ja andmemodelleerimise teadmised ja oskused. Tööandjad hindavad teie tehnilisi ja pehmeid oskusi ning seda, kui hästi te nende ettevõttesse sobiksite.
Valmistades ette mõned levinumad andmeteaduse intervjuu küsimused ja vastused, saate intervjuule julgelt siseneda. Andmeteaduse intervjuu ajal võite kokku puutuda mõne erinevat tüüpi andmeteadlase küsimustega.
Andmeteaduse intervjuuküsimuste loend: andmetega seotud küsimused
Tööandjad otsivad kandidaate, kellel on tugevad teadmised andmeteaduse tehnikatest ja kontseptsioonidest. Andmetega seotud intervjuu küsimused sõltuvad ametikohast ja nõutavatest oskustest.
Siin on mõned näited andmetega seotud intervjuu küsimuste ja vastuste näidistest:
Mis vahe on juhendatud ja juhendamata õppimisel?
Suurim erinevus juhendatud ja juhendamata õppe vahel on märgistatud ja märgistamata andmekogumite kasutamine. Juhendatud õpe kasutab märgistatud väljund- ja sisendandmeid, järelevalveta õppealgoritmid aga mitte. Teine erinevus seisneb selles, et juhendatud õppel on tagasiside mehhanism, samas kui juhendamata õppimisel mitte. Lõpuks hõlmavad tavaliselt kasutatavad juhendatud õppealgoritmid logistilist regressiooni, tugivektori masinat ja otsustuspuid, samas kui järelevalveta õppealgoritmid on k-keskmiste rühmitamine, hierarhiline klasterdamine ja apriori algoritm.
Mis vahe on sügavõppel ja masinõppel?
Sellele küsimusele võib olla raske selgelt vastata, sest siin on ilmselgelt kattuvusi. Alustuseks selgitage, et süvaõpe on sisuliselt masinõppe alamvaldkond ja mõlemad kuuluvad tehisintellekti alla. Kui masinõpe kasutab andmete analüüsimiseks algoritme ja lõpuks õpib tegema otsuseid selle põhjal, mida see andmetest välja toob, siis süvaõppe kihistab need algoritmid, et luua tehisnärvivõrke, mis on võimelised õppima ja tegema teadlikke otsuseid.
- Kas saate anda otsustuspuu algoritmi üksikasjaliku selgituse?
- Mis on proovivõtt? Mitut proovivõtumeetodit olete tuttav?
- Kuidas teha vahet I ja II tüüpi vea vahel?
- Palun defineerige lineaarne regressioon.
- Mida tähendavad terminid p-väärtus, koefitsient ja r-ruutväärtus? Miks on iga komponent oluline?
- Määrake valiku kallutatus.
- Määrake statistiline interaktsioon.
- Kas saate tuua näite andmekogumi kohta, millel on mitte-Gaussi jaotus?
- Palun selgitage binoomtõenäosuse valemit.
- Kas saate selgitada erinevust k-NN ja k-keskmiste klastrite vahel?
- Milline on teie lähenemine logistilise regressioonimudeli loomisele?
- Mis on 80/20 reegel? Kui oluline on valideerimise modelleerimine?
- Määratlege täpsus ja meeldetuletus. Kuidas need on seotud ROC kõveraga?
- Palun selgitage, kuidas teha vahet L1 ja L2 reguleerimismeetoditel?
- Millised on andmevahetuse ja andmete puhastamise sammud enne masinõppe algoritmide rakendamist?
- Kas saate selgitada histogrammi ja kasti diagrammi erinevust?
- Kuidas määratlete ristvalideerimise?
- Kas saate selgitada, mis on valepositiivne ja valenegatiivne? Mida oleks teie arvates parem omada: liiga palju valepositiivseid või liiga palju valepositiivseid?
- Mis on masinõppemudeli kujundamisel olulisem: mudeli täpsus või mudeli jõudlus?
- Mis on teie arvates parem: 50 väikest otsustuspuud või suur?
- Kas teile tundub mõni andmeteaduse projekt meie ettevõttes, mis teile huvi pakuks?
- Kas võiksite tuua mõned näited andmeteaduse parimatest tavadest?
Andmeteaduse intervjuude küsimuste loend: tehniliste oskuste küsimused
Andmeteaduse intervjuu tehniliste oskuste küsimusi kasutatakse teie andmeteaduslike teadmiste, oskuste ja võimete hindamiseks. Need küsimused on seotud andmeteadlase ametikoha konkreetsete tööülesannetega.
Tehnilise andmeteaduse intervjuu küsimustel võib olla üks õige vastus või mitu võimalikku lahendust. Soovite probleemide lahendamisel näidata oma mõttekäiku ja selgitada selgelt, kuidas vastuseni jõudsite.
Tehniliste andmete teaduse oskuste intervjuu küsimuste näited on järgmised:
Millised on andmeteadlase parimad tööriistad ja tehnilised oskused?
Andmeteadus on väga tehniline valdkond ja te soovite värbamisjuhile näidata, et tunnete kõiki uusimaid tööstusstandardi tööriistu, tarkvara ja programmeerimiskeeli. Andmeteaduses kasutatavatest erinevatest statistilistest programmeerimiskeeltest kasutavad andmeteadlased enim R ja Python. Mõlemat saab kasutada statistiliste funktsioonide jaoks, nagu mittelineaarse või lineaarse mudeli loomine, regressioonanalüüs, statistilised testid, andmekaeve ja palju muud. Teine oluline andmeteaduse tööriist on RStudio Server, samas kui Jupyteri sülearvutit kasutatakse sageli statistilise modelleerimise, andmete visualiseerimise, masinõppe funktsioonide jms jaoks. Loomulikult on andmeteadlaste poolt laialdaselt kasutatud mitmeid spetsiaalseid andmete visualiseerimise tööriistu, sealhulgas Tableau, PowerBI. , Bokeh, Plotly ja Infogram. Andmeteadlased vajavad ka palju kogemusi SQL-i ja Exceli kasutamisel.
Teie vastuses tuleks mainida ka konkreetseid tööriistu või tehnilisi pädevusi, mida küsitletav töö nõuab. Vaadake üle ametijuhend ja kui teil on mingeid tööriistu või programme, mida te pole kasutanud, tasub nendega enne vestlust tutvuda.
Kuidas suhtute kõrvalekalletesse väärtustesse?
Teatud tüüpi kõrvalekaldeid saab eemaldada. Prügi väärtused või väärtused, millest te teate, et need ei pruugi tõesed olla, võib loobuda. Samuti saab eemaldada kõrvalekalded, mille äärmuslikud väärtused on palju väljaspool komplekti koondatud ülejäänud andmepunkte. Kui te ei saa kõrvalekalletest loobuda, võiksite uuesti kaaluda, kas valisite õige mudeli, võite kasutada algoritme (nt juhuslikud metsad), mida kõrvalekallete väärtused nii tugevalt ei mõjuta, või proovida oma andmeid normaliseerida.
- Palun rääkige meile oma loodud algsest algoritmist.
- Mis on teie lemmikstatistikatarkvara ja miks?
- Kas olete töötanud andmeteaduse projekti kallal, mis nõudis olulist programmeerimiskomponenti? Mida sa kogemusest kaasa võtsid?
- Kirjeldage, kuidas tõhusalt esitada andmeid viie mõõtmega.
- Peate genereerima ennustava mudeli, kasutades mitut regressiooni. Milline on teie protsess selle mudeli kinnitamiseks?
- Kuidas tagada, et algoritmis tehtavad muudatused paranevad?
- Esitage oma meetod tasakaalustamata andmekogumi käsitlemiseks, mida kasutatakse ennustamiseks (st palju rohkem negatiivseid klasse kui positiivseid klasse).
- Milline on teie lähenemisviis mudeli valideerimiseks, mille olete loonud kvantitatiivse tulemuse muutuja ennustava mudeli genereerimiseks, kasutades mitut regressiooni?
- Teil on kaks erinevat võrreldava arvutusliku jõudluse ja täpsuse mudelit. Selgitage, kuidas otsustate, millise tootmiseks valida ja miks.
- Teile antakse andmekogum, mis koosneb muutujatest, millel on oluline osa väärtustest puudu. Milline on teie lähenemine?
Andmeteaduse intervjuuküsimuste loend: isiklikud küsimused
Lisaks teie andmeteaduslike teadmiste ja oskuste testimisele esitavad tööandjad tõenäoliselt ka üldisi küsimusi, et teid paremini tundma õppida. Need küsimused aitavad neil mõista teie tööstiili, isiksust ja seda, kuidas võiksite sobituda nende ettevõtte kultuuriga.
Isikuandmeteadlase intervjuu küsimused võivad hõlmata järgmist:
Milline on hea andmeteadlane?
Teie vastus sellele küsimusele räägib värbamisjuhile palju sellest, kuidas näete oma rolli ja väärtust, mida te organisatsioonile annate. Oma vastuses võiks rääkida sellest, kuidas andmeteadus nõuab haruldast kompetentside ja oskuste kombinatsiooni. Hea andmeteadlane peab ühendama tehnilisi oskusi, mida on vaja andmete sõelumiseks ja mudelite loomiseks ärilise mõttega, mis on vajalik nende probleemide mõistmiseks, millega nad tegelevad, ja tuvastama oma andmetes kasutatavaid teadmisi. Oma vastuses võiksite arutada ka andmeteadlast, kelle poole vaatate, olgu selleks kolleeg, keda te isiklikult tunnete, või läbinägelik tööstuse tegelane.
- Palun räägi mulle endast.
- Millised on teie parimad omadused tööalaselt? Millised on teie nõrkused?
- Kas on üks andmeteadlane, keda sa kõige enam imetled?
- Mis inspireeris teie huvi andmeteaduse vastu?
- Milliseid ainulaadseid oskusi või omadusi, mis meeskonda aitaksid?
- Mis pani teid otsustama eelmiselt töökohalt lahkuda?
- Mis taset te sellelt töölt ootate?
- Kas eelistate töötada üksi või osana andmeteadlaste meeskonnast?
- Kus näete oma karjääri viie aasta pärast?
- Milline on teie lähenemisviis tööstressiga toimetulemiseks?
- Kuidas leiad motivatsiooni?
- Milline on teie edukuse mõõtmise meetod?
- Kuidas kirjeldaksite oma ideaalset töökeskkonda?
- Millised on teie kired või hobid väljaspool andmeteadust?
Andmeteaduse intervjuuküsimuste loend: juhtimine ja suhtlemine
Juhtimine ja suhtlemine on andmeteadlaste jaoks kaks väärtuslikku oskust. Tööandjad hindavad töökandidaate, kes suudavad näidata initsiatiivi, jagada oma teadmisi meeskonnaliikmetega ning edastada andmeteaduse eesmärke ja strateegiaid.
Siin on mõned näited juhtimise ja kommunikatsiooni andmeteaduse intervjuu küsimustest:
Mis teile multidistsiplinaarses meeskonnas töötades meeldib?
Andmeteadlane teeb koostööd paljude inimestega tehnilistes ja mittetehnilistes rollides. Pole haruldane, et andmeteadlane töötab arendajate, disainerite, tootespetsialistide, andmeanalüütikute, müügi- ja turundusmeeskondade ning tippjuhtidega, klientidest rääkimata. Seega peate oma vastuses sellele küsimusele näitama, et olete meeskonnamängija, kes naudib võimalust kohtuda ja teha koostööd inimestega kogu organisatsioonis. Valige näide olukorrast, kus teatasite ettevõtte kõrgeima taseme inimestele, et mitte ainult näidata, et teil on mugav kellegagi suhelda, vaid ka näidata, kui väärtuslikud on teie andmepõhised arusaamad minevikus olnud.
- Kas suudate mõelda mõnele professionaalsele olukorrale, kus teil oli võimalus näidata juhtimist?
- Milline on teie lähenemine konfliktide lahendamisele?
- Milline on teie lähenemine tööalaste suhete loomisele kolleegidega?
- Milline on näide teie edukast esitlusest? Miks see nii kaasahaarav oli?
- Kui räägite mittetehnilise taustaga kolleegi või kliendiga, kuidas seletate keerulisi tehnilisi probleeme või väljakutseid?
- Tuletage meelde olukorda, mil pidite käsitlema tundlikku teavet. Kuidas te olukorrale lähenesite?
- Kuidas hindaksite oma suhtlusoskusi enda vaatenurgast?
Andmeteaduse intervjuuküsimuste loend: käitumuslikud
Käitumisintervjuu küsimustega otsivad tööandjad konkreetseid olukordi, mis näitavad teatud oskusi. Intervjueerija soovib mõista, kuidas olete minevikus olukordades lahendanud, mida õppisite ja mida saate nende ettevõttesse tuua.
Andmeteaduse intervjuu käitumisküsimuste näited on järgmised:
Kas mäletate olukorda, kui pidite puhastama ja korrastama suurt andmekogumit?
Uuringud on näidanud, et andmeteadlased kulutavad suurema osa oma ajast andmete ettevalmistamisele, mitte andmete kaevandamisele või modelleerimisele. Nii et kui teil on andmeteadlasena kogemusi, on peaaegu kindel, et teil on kogemusi suurandmete kogumi puhastamise ja korraldamise kohta. Tõsi on ka see, et see on ülesanne, mis vähestele tõeliselt meeldib. Kuid andmete puhastamine on ka iga ettevõtte jaoks üks olulisemaid samme. Seega peaksite värbamisjuhi läbi viima andmete ettevalmistamisel järgitava protsessi: dubleerivate vaatluste eemaldamine, struktuurivigade parandamine, kõrvalekallete filtreerimine, puuduvate andmete käsitlemine ja andmete valideerimine.
- Mõelge tagasi andmeprojektile, mille kallal olete töötanud ja kus teil tekkis probleem või väljakutse. Milline oli olukord, mis oli takistuseks ja kuidas sellest üle saite?
- Palun tooge konkreetne näide andmete kasutamisest kliendi või sidusrühma kogemuste tõstmiseks?
- Esitage konkreetne olukord, kus saavutasite eesmärgi. Kuidas sa selle saavutasid?
- Esitage konkreetne olukord, kus teil ei õnnestunud eesmärki täita. Mis läks valesti?
- Milline on teie lähenemisviis rangete tähtaegade haldamiseks ja järgimiseks?
- Kas mäletate korda, mil tekkis tööl konflikt? Kuidas sa sellega toime tulid?
Andmeteaduse intervjuuküsimuste loend parimatelt ettevõtetelt (Amazon, Google, Facebook, Microsoft)
Et anda teile aimu mõnest teisest küsimusest, mis võivad intervjuul esile kerkida, koostasime mõnede tipptehnoloogiaettevõtete andmeteaduse intervjuu küsimuste loendi.
- Mis vahe on tugivektori masinal ja logistilisel regressioonil? Tooge näiteid olukordadest, kus eelistaksite kasutada ühte, mitte teist.
- Mida teeksite, kui andmekogumist puuduvate väärtuste eemaldamine põhjustab eelarvamusi?
- Milliseid mõõdikuid hindaksite toote tervist, seotust või kasvu vaadates?
- Milliseid mõõdikuid hindaksite meie tootega seotud äriprobleemide lahendamisel või lahendamisel?
- Kuidas hindate toote toimivust?
- Kuidas teada saada, kas uus tähelepanek on kõrvalekalle?
- Kuidas määratleksite erapoolikuse ja dispersiooni kompromissi?
- Milline on teie meetod toote kasutajate hulgast juhusliku valimi valimiseks?
- Milline on teie protsess andmete vaidlustamiseks ja puhastamiseks enne masinõppe algoritmide rakendamist?
- Kuidas läheneksite tasakaalustamata binaarsele klassifikatsioonile?
- Kuidas eristada head ja halba andmete visualiseerimist?
- Looge funktsioon, mis kontrollib, kas sõna on palindroom.