Päev andmeteadlase elus

BrainStationi Data Scientisti karjäärijuhend aitab teil teha esimesi samme tulusa andmeteaduse karjääri suunas. Lugege edasi, et saada ülevaade, kuidas andmeteadlased oma päevi tööl veedavad.

Hakka andmeteadlaseks

Rääkige õppenõustajaga, et saada lisateavet selle kohta, kuidas meie alglaagrid ja kursused aitavad teil saada andmeteadlaseks.



Klõpsates nuppu Esita, nõustute meiega Tingimused .



Esita

Ei saanud esitada! Kas värskendada lehte ja proovida uuesti?

Lisateavet meie Data Science Bootcampi kohta

Aitäh!

Võtame varsti ühendust.



Vaadake Data Science Bootcampi lehte

Päev andmeteadlase elus

Kõigist Brainstationi digitaaloskuste uuringus uuritud erialadest võib andmeteadus hõlmata kõige laiemat rakenduste valikut. Kuid kuigi andmeteadus on eksisteerinud aastakümneid, on see õitsele puhkenud alles hiljuti. Kuna andmete kättesaadavus on laienenud, on ettevõtted mõistnud, kui oluline võib andmeteadus olla, ütleb Briana Brownell, Pure Strategy asutaja ja tegevjuht ning andmeteadlane 13 aastat. Iga ettevõte peab nüüd osaliselt keskenduma tehnoloogiale. Näiteks McDonald’s maksis just sel nädalal hinnanguliselt 300 miljonit dollarit oma suure andmefirma ostmise eest.

Pole siis ime, et konkurents andmeteadlaste pärast on uskumatult kõrge. Vaid kahe aastaga peaks nõudlus kasvama 28 protsenti, mis võrdub umbes 2,7 miljoni uue töökohaga. See on rohkem töökohti, kui uued lõpetajad suudavad täita – see tähendab, et muude valdkondade tehnikatöötajad peavad selle nõudluse rahuldamiseks oma oskusi täiendama ja andmetele üle minema.

Tegelikult näitab meie uuring, et see juba toimub. Ligikaudu neli viiest andmeprofessionaalist alustas oma karjääri millegi muuga ja 65 protsenti kõigist andmeteadlastest on selles valdkonnas töötanud viis aastat või vähem. Sellel tohutul uute mõtete sissevoolul on kahepoolne mõju, ütleb Brownell; ühest küljest on tulemas palju uusi ideid, ütleb ta. Kui ma vaatan mõnda andmeteaduse kogukonnast tulevat sisu, olen üllatunud, kui palju uuendusi seal on. Tagakülg on aga kalduvus ratast uuesti leiutada.



Suur nõudlus andmeteadlaste järele on suurepärane, kui olete üks (või kavatsete selleks saada), kuid tööandjate jaoks võib värbamine olla hirmutav väljakutse. Siin on ümberostmine ilmselge lahendus; praeguse töötaja andmeteaduse alal ümberõpetamine võib olla kuluefektiivsem kui uue peajaht.

Kuid isegi kui plaanite palgata uue andmeteaduse meeskonna, võib teie organisatsioon tervikuna vajada oma andmepädevust värskendama, hoiatab Brownell. Kõik tahavad töötada millegi kallal, mis mõjutab nende töökohta ja muudab inimeste elu paremaks, ütleb ta. Kui teie ettevõtte kultuur ei ole selline, et [teie andmeteadlased] saaksid mõjutada, on peaaegu võimatu palgata. Juhtkond peab olema võimeline mitte ainult teavitama potentsiaalseid töötajaid, kuidas nad saavad oma panuse anda, vaid mõistma ka ettepanekuid, mille nende andmeteaduse meeskond lõpuks esitab.

Kahjuks ütleb Brownell, et ebamugav enamik on ettevõtted, kes pole asjadest aru saanud. Meie uuring kinnitab seda: enamik vastajaid (52 protsenti) kirjeldas oma organisatsioonide andmepädevuse taset algtasemena, kusjuures kõige levinum vastus oli keskmine (31 protsenti). See viitab sellele, et mõned põhilised andmeteaduse koolitused võivad olla kasulikud suurele osale ettevõtetest, eriti juhtimises.



Seda vajadust täiustatud andmepädevuse ja suhtluse järele suurendab see, kuidas enamiku andmeteaduse meeskondi on üles ehitatud: diskreetse meeskonnana, kus tavaliselt on 10 või vähem inimest (71 protsendi vastanute sõnul) ja sageli viis või vähem (38 protsenti). ). Need tihedalt seotud meeskonnad ei saa endale lubada isolatsiooni. Suuremates ettevõtetes töötavad isikud on tavaliselt väikeses andmeteaduse spetsiifilises rühmas ja nende kliendid on organisatsioonisisesed - muud organisatsiooni osad, selgitab Brownell, seega on see meeskond, mis peab tegutsema organisatsiooni paljudes erinevates valdkondades.

Mis täpselt on andmeteadus?

Levinud arusaam (et andmeteadlased kriipsutavad numbreid) ei ole kaugeltki kaugel, ütleb Brownell. Seal on palju andmekogumeid, millest tuleb saada ülevaade, ja see hõlmab palju samme, nagu mudeli koostamine ja andmete puhastamine ning isegi lihtsalt vajalike andmete otsustamine. Lõppkokkuvõttes on see pingutus siiski eesmärgile orienteeritud: peate andmetega midagi ette võtma.

Andmed ei ole alati numbrid. Kui suurem osa vastajatest (73 protsenti) märkis, et nad töötavad arvandmetega, siis 61 protsenti ütles, et töötavad ka tekstiga, 44 protsenti struktureeritud andmetega, 13 protsenti piltidega ja 12 protsenti graafikaga (ja väikesed vähemused töötavad isegi video ja heliga — vastavalt 6 protsenti ja 4 protsenti). Need uuringutulemused viitavad sellele, kuidas andmeteadus laieneb finantstabelitest kaugemale, kaasates inimesi sellistesse projektidesse, nagu klientide rahulolu maksimeerimine või väärtuslike teadmiste kogumine sotsiaalmeedia tuletõrjevoolikust.

Selle tulemusel on andmeteaduse valdkonnas tohutult mitmekesisus, ütleb Brownell. Igal tööstusharul on oma arusaam selle kohta, millist tüüpi andmete kallal andmeteadlased töötavad, millist tüüpi tulemusi nad ootavad ja kuidas see sobib nende ettevõtte juhtimisstruktuuriga. Kuid igal juhul on eesmärk kasutada andmeid, et aidata ettevõttel teha paremaid otsuseid. See võib olla toodete paremaks muutmine, turu mõistmine, kuhu nad soovivad siseneda, rohkemate klientide hoidmine, nende tööjõu kasutamise mõistmine, heade palkade mõistmine – kõikvõimalikud erinevad asjad.

Andmeteaduse töökohad

Mõnes tehnikavaldkonnas võib generalistiks saamine olla teie parim jalg ukse ees – mitte nii andmeteaduse puhul. Tööandjad otsivad tavaliselt oma tööstusele spetsialiseerunud oskusi. Kuna andmeteadusel on nii palju erinevaid maitseid, uurisime meie küsitlust sügavamalt, uurides viit peamist töökategooriat: andmeanalüütik, teadlane, ärianalüütik, andme- ja analüüsijuht ning andmeteadlane.

Kõigi nende ametinimetuste puhul võtab andmete vaidlustamine ja puhastamine suurema osa ajast – aga milleks? Kõige sagedamini on eesmärgiks olemasoleva platvormi, toote või süsteemi optimeerimine (45 protsenti) või uute väljatöötamine (42 protsenti). Süvenedes avastasime, et olemasolevate lahenduste optimeerimine kipub langema ärianalüütikute ja andmeanalüütikute õlule, samas kui uute lahenduste väljatöötamine langeb sagedamini andmeteadlaste ja teadlaste õlule.

Andmeteadlaste kasutatavad tehnikad erinevad ka spetsialiseerumisalade lõikes. Lineaarne regressioon oli kõigis kategooriates levinud tööriist, mida mainis 54 protsenti vastanutest, kuid inimeste kasutatava tarkvara vaatamisel oli mõned üllatused.

Excel – andmekogumitega manipuleerimise tööhobune – on peaaegu üldlevinud, seda nimetas 81 protsenti kõigist vastajatest ja kõige populaarsem tööriist igas kategoorias, välja arvatud Data Scientists (kes tuginevad kõige sagedamini Pythonile) ja viitas ka suuremale tööriistakomplektile kui teised kategooriad. ). Mis teeb Exceli isegi 2019. aastal nii möödapääsmatuks?

Mulle meeldib Excelis see, kuidas see võimaldab teil andmeid näha ja neid intuitiivselt tunda, selgitas Brownell. Kasutame ka palju Pythonit ja sel juhul on andmefaili analüüsimisel see peidetud; Kui te just ei programmeeri osa oma koodist analüüsitavate toorandmete visualiseerimiseks, siis te seda ei näe. Exceli puhul on see aga otse teie ees. Sellel on palju eeliseid. Mõnikord võite andmefailiga probleeme märgata. Ma ei näe, et Excel kunagi analüüsist kaoks.

Sellegipoolest on selles valdkonnas veel pikk nimekiri muudest programmidest, mis pole selle mitmekesisust arvestades üllatav. SQL (43 protsenti) ja Python (26 protsenti) juhivad populaarsust, Tableau (23 protsenti), R (16 protsenti), Jupyter Notebooks (14 protsenti) ja käputäis teisi on saavutanud märkimisväärseid numbreid – rääkimata ilmatutest. 32 protsenti vastanutest, kes tsiteerisid muid tööriistu, isegi seda niigi pikka nimekirja arvesse võttes.

Mis on andmeteaduse tulevik?

Lõpetuseks küsisime, millised trendid kujundavad digimaastikku järgmise viie kuni kümne aasta jooksul. Masinõpe ja tehisintellekt – mõlemal on andmeteaduses rakendused – olid valdavalt arengud, millel vastajad loodavad suurimat mõju, vastavalt 80 protsenti ja 79 protsenti. Seda hoolimata asjaolust, et vähem kui veerand (23 protsenti) neist töötab praegu tehisintellektiga.

Tehisintellekt võib andmeteadust absoluutselt muuta, kinnitab Brownell, kelle ettevõte arendab tehisintellekti tooteid. See on tõesti järelevalveta õppemeetodite hiilgus. Meil on ainult nii palju aega nende andmekogumite vaatamiseks ja eriti suurte andmehulkade puhul on kõike väga raske teha. AI tööriistad võivad aidata paljastada midagi, mida te poleks arvanudki otsida. Meil on seda kindlasti juhtunud.

Muud suundumused, mida andmeteadlased loodavad lähitulevikus domineerida: asjade internet (51 protsenti), plokiahel (50 protsenti) ja e-kaubandus (36 protsenti), liitreaalsus ja virtuaalreaalsus (38 protsenti ja 27 protsenti) ning isegi hääl- põhinevad kogemused (25 protsenti) – kõik olulised esitused ja kõik valdkonnad, kus andmeteadust saab hästi kasutada.

Kategori: Uudised