Andmeteadlane
BrainStationi Data Scientisti karjäärijuhend aitab teil teha esimesi samme tulusa andmeteaduse karjääri suunas. Lugege edasi, et saada ülevaade andmeteaduse valdkonnast ja andmeteadlase töörollist.
Hakka andmeteadlaseks
Rääkige õppenõustajaga, et saada lisateavet selle kohta, kuidas meie alglaagrid ja kursused aitavad teil saada andmeteadlaseks.
Klõpsates nuppu Esita, nõustute meiega Tingimused .
Esita
Ei saanud esitada! Kas värskendada lehte ja proovida uuesti?
Lisateavet meie Data Science Bootcampi kohtaAitäh!
Võtame varsti ühendust.
Vaadake Data Science Bootcampi lehte
Mis on andmeteadlane?
Andmeteadlased koguvad, korraldavad ja analüüsivad suuri suurandmeid – struktureeritud ja struktureerimata andmeid –, et luua ettevõtetele ja teistele organisatsioonidele toimivaid andmepõhiseid ärilahendusi ja -plaane. Ühendades matemaatika, arvutiteaduse ja äritaju, peavad andmeteadlastel olema nii tehnilised oskused suurandmete töötlemiseks ja analüüsimiseks kui ka ärivaist, et leida nendes andmetes peidetud praktilisi teadmisi.
Andmeteadus vs andmekaevandamine
Andmeteaduse ja andmekaevanduse vahel on mõned erinevused. Vaatame lähemalt:
Andmeteadus
- on lai valdkond, mis kipub hõlmama masinõpet, tehisintellekti, ennustavat põhjuslikku analüüsi ja ettekirjutavat analüütikat
- Tegeleb igasuguste andmetega, sealhulgas nii struktureeritud kui ka struktureerimata andmetega
- Eesmärk on luua andmekeskseid tooteid ja teha andmepõhiseid otsuseid
- Keskendutakse andmete ja mustrite teaduslikule uurimisele
Andmete kaevandamine
- on andmeteaduse alamhulk, mis hõlmab andmete puhastamist, statistilist analüüsi ja mustrituvastust ning mõnikord ka andmete visualiseerimist, masinõpet ja andmete teisendamist.
- Tegeleb peamiselt struktureeritud andmetega, mitte struktureerimata andmetega
- Eesmärk on võtta andmeid erinevatest allikatest ja muuta need kasutatavaks
- Keskendutakse äritavadele
Mida teeb andmeteadlane?
Andmeteadlane analüüsib suuri andmekogumeid, et välja selgitada mustrid ja suundumused, mis viivad rakendatavate äriülevaadeteni ja aitavad organisatsioonidel lahendada keerulisi probleeme või tuvastada tulu- ja kasvuvõimalusi. Andmeteadlane võib töötada peaaegu igas valdkonnas ja peab olema vilunud struktureeritud ja struktureerimata andmekogumite käsitlemisel. See on multidistsiplinaarne töö ja andmeteadlaseks saamiseks peab teil olema arusaam matemaatikast, arvutiteadusest, ärist ja kommunikatsioonist, et oma tööd tõhusalt täita.
Kuigi andmeteadlase konkreetsed tööülesanded ja vastutus varieeruvad olenevalt tööstusest, ametikohast ja organisatsioonist, hõlmab enamik andmeteadlase rolle järgmisi vastutusvaldkondi.
Uurimine
Andmeteadlane peab mõistma nii valdkonna kui ka üksiku ettevõtte võimalusi ja valupunkte.
Andmete ettevalmistamine
Enne väärtuslike teadmiste leidmist peab andmeteadlane määratlema, millised andmekogumid on kasulikud ja asjakohased, enne kui kogub, eraldab, puhastab ja rakendab erinevatest allikatest struktureeritud ja struktureerimata andmeid.
Mudelite ja algoritmide loomine
Masinõppe ja tehisintellekti põhimõtteid kasutades peab andmeteadlane suutma luua ja rakendada automatiseerimisvahendite juurutamiseks vajalikke algoritme.
Andmete analüüs
Andmeteadlase jaoks on oluline, et ta saaks oma andmeid kiiresti analüüsida, et tuvastada mustreid, suundumusi ja võimalusi.
Visualiseerimine ja suhtlemine
Andmeteadlane peab suutma jutustada andmete kaudu avastatud lugusid, luues ja korraldades esteetiliselt atraktiivseid armatuurlaudu ja visualiseerimisi, ning omama ka suhtlemisoskusi, et veenda sidusrühmi ja teisi meeskonnaliikmeid, et andmetes leiduvad tulemused on tegutsemist väärt.
Viimasest BrainStationi digitaalsete oskuste uuringust selgus, et andmespetsialistid kulutasid suurema osa oma ajast andmete vaidlustamisele ja puhastamisele. Samuti jõudsid vastajad järeldusele, et nende töö eesmärk on kõige sagedamini olemasoleva platvormi, toote või süsteemi optimeerimine (45 protsenti) või uute väljatöötamine (42 protsenti).
Andmeteaduse tüübid
Andmeteaduse laiem valdkond hõlmab paljusid erinevaid distsipliine, sealhulgas:
Andmetehnoloogia
Andmeid ja andmevoogu kogu organisatsioonis toetava infrastruktuuri kavandamine, ehitamine, optimeerimine, hooldamine ja haldamine.
Andmete ettevalmistamine
Andmete puhastamine ja muutmine.
Andmete kaevandamine
Kasutatavate andmete eraldamine (ja mõnikord puhastamine ja teisendamine) suuremast andmekogumist.
Ennustav analüüs
Andmete, algoritmide ja masinõppetehnikate kasutamine erinevate võimalike tulevaste tulemuste tõenäosuse analüüsimiseks andmeanalüüsi põhjal.
Masinõpe
Analüütiliste mudelite loomise automatiseerimine andmeanalüüsi protsessis, et õppida andmetest, avastada mustreid ja anda süsteemidele võimalus teha otsuseid ilma suurema inimese sekkumiseta.
Andmete visualiseerimine
Visuaalsete elementide (sh graafikute, kaartide ja diagrammide) kasutamine andmetes leiduva ülevaate illustreerimiseks juurdepääsetaval viisil, et vaatajaskonnad mõistaksid andmetes leiduvaid trende, kõrvalekaldeid ja mustreid.
Andmeteaduse eelised
Ettevõtted kõigis tööstusharudes kõikjal maailmas pühendavad üha rohkem raha, aega ja tähelepanu andmeteadusele ning soovivad lisada oma meeskonda andmeteadlase. Uuringud näitavad, et andmepõhise otsustusprotsessi tõeliselt omaks võtnud ettevõtted on konkurentidest tootlikumad, kasumlikumad ja tõhusamad.
Andmeteadus on ülioluline, et aidata organisatsioonidel tuvastada õiged probleemid ja võimalused, aidates samal ajal kujundada selget pilti klientide ja klientide käitumisest ja vajadustest, töötajate ja toote tulemuslikkusest ning võimalikest tulevikuprobleemidest.
Andmeteadus võib aidata ettevõtetel:
- Tehke paremaid otsuseid
- Lisateavet klientide ja klientide kohta
- Kasutage suundumusi ära
- Ennusta tulevikku
Kuidas saab andmeteadus ettevõtte väärtust tõsta?
Andmeteadus on ettevõtete jaoks üha populaarsem investeering, kuna potentsiaalne ROI suurandmete väärtuse vabastamisel on tohutu. Andmeteadus on väärt investeering, kuna:
- Kui traditsiooniline on teie ettevõte. Suuremad ja vanemad ettevõtted ei ole tavaliselt nii kaugsõbralikud, kuigi COVID võis selles valdkonnas suuri muutusi tuua.
- Kui hõlpsalt saate teiste meeskonnakaaslaste ja osakondadega eemalt töötada. Kui teie töö on väga koostööpõhine, peate tõenäolisemalt isiklikult kohale ilmuma.
- Lepingu alusel või isegi konsultatsiooni alusel töötavatel andmeteadlastel võib olla rohkem paindlikkust oma asukoha valimisel.
Andmeteadlaste palgad
Kuigi andmeteadlaste palgad on piirkonniti ja tööstusharuti väga erinevad, on andmeteadlaste keskmine palk USA-s olenevalt allikast vahemikus 96 000 kuni 113 000 dollarit. Vanemandmeteadlane võib keskmiselt sisse tuua ligikaudu 130 000 dollarit.
Nõudlus andmeteadlaste järele
Andmeteadlaste järele on suur nõudlus ja napib peaaegu kõigis tööstusharudes. Deloitte Access Economicsi aruanne näitas, et 76 protsenti ettevõtetest kavatses järgmistel aastatel andmeanalüüsi võimetele kulutusi suurendada, samas kui IBM ennustas kümnendi alguses andmeteaduse nõudluse tõusu 28 protsenti.
USA tööstatistika büroo on prognoosinud andmeteaduse kasvuks järgmise 10 aasta jooksul 31 protsenti. Samal ajal leiti turgude ja turgude aruandes, et prognooside kohaselt kasvab suurandmete ülemaailmne turg 2025. aastaks 229,4 miljardi dollarini, kusjuures andmeteaduse platvorm kasvab 2024. aastaks 30 protsenti.
Näib, et igal pool maailmas kasvavad investeeringud andmeteadusesse ja koos sellega ka nõudlus Data Scientists'i järele.
Milliseid tööriistu andmeteadlased kasutavad?
Andmeteadlased kasutavad tegevusteks, sealhulgas andmete analüüsimiseks, andmete puhastamiseks ja visualiseerimiste loomiseks, mitmesuguseid tööriistu ja programme.
Python on BrainStationi digitaaloskuste uuringus küsitletud andmeteadlaste jaoks parim programmeerimiskeel. Üldotstarbeline programmeerimiskeel Python on kasulik riikliku keele töötlemise rakenduste ja andmeanalüüsi jaoks. R-i kasutatakse sageli ka andmeanalüüsiks ja andmete kaevandamiseks. Raskemate numbrite närimiseks on populaarsed Hadoopi-põhised tööriistad, nagu Hive. Masinõppe jaoks võivad andmeteadlased valida paljude tööriistade hulgast, sealhulgas h2o.ai, TensorFlow, Apache Mahout ja Accord.Net. Visualiseerimistööriistad on ka andmeteadlase arsenali oluline osa. Sellised programmid nagu Tableau, PowerBI, Bokeh, Plotly ja Infogram aitavad Data Scientistidel luua visuaalselt ahvatlevaid diagramme, soojuskaarte, graafikat, hajutusgraafikuid ja palju muud.
Andmeteadlased peaksid samuti olema ülimalt rahul nii SQL-iga (kasutatakse paljudel platvormidel, sealhulgas MySQL, Microsoft SQL ja Oracle) kui ka arvutustabeliprogrammidega (tavaliselt Excel).
Milliseid oskusi vajavad andmeteadlased?
On mitmeid oskusi, mida kõik pürgivad andmeteadlased peaksid arendama, sealhulgas:
Andmeteadlase karjääriteed
Suhteliselt uue elukutsena pole andmeteadlaste karjääriteed kivisse kirjutatud ja paljud inimesed leiavad tee andmeteaduse juurde arvutiteaduse, IT, matemaatika ja ettevõtluse taustalt. Kuid andmeteadlase karjääritee neli peamist telge on üldiselt andmed, tehnika, äri ja toode. Paljud andmeteaduse multidistsiplinaarsed rollid nõuavad mitme või kõigi nende valdkondade valdamist.
Andmeteaduses töötavad inimesed on tulevikku enim mõjutavate tehnoloogiliste muutuste eesliinil. Kuna andmeteadus võib aidata kaasa edusammudele peaaegu kõigis teistes valdkondades, on andmeteadlastel võimalik jätkata uuringuid kõiges alates rahandusest ja kaubandusest kuni aktuaaristatistika, rohelise energia, epidemioloogia, meditsiini ja farmaatsia ning telekommunikatsioonini – see nimekiri on peaaegu lõputu. Iga tööstusharu kasutab oma erinevat tüüpi andmeid, võimendades neid erinevate eesmärkide saavutamiseks erineval viisil. Ükskõik, kus see juhtub, saavad andmeteadlased suunata paremaid otsuseid, olgu see siis tootearenduse, turuanalüüsi, kliendisuhete haldamise, inimressursside või millegi muu alal.
Andmeteaduse rakendused pole mitte ainult laiad, puudutades paljusid erinevaid sektoreid, vaid on ka erinevat tüüpi andmeteadust. Kõiki neid tegevusi ühendab see, et kõik nad püüavad andmeid teadmisteks muuta. Täpsemalt kasutavad andmeteadlased metoodilist lähenemist toorandmete korrastamiseks ja analüüsimiseks, et tuvastada mustreid, millest saab kasulikku teavet tuvastada või järeldada.
Arvestades nende mõju ulatust, pole ime, et andmeteadlastel on positsioone, millel on suur mõju – ja suur nõudlus. Kuigi tee andmeteadlaseks saamiseni võib olla nõudlik, on praegu pürgivatel andmeteadlastel rohkem ressursse kui kunagi varem ja neil on rohkem võimalusi soovitud karjääri loomiseks.
Kuid kõikidel viisidel, kuidas andmeteadlased saavad panustada erinevatesse tööstusharudesse ja erinevatele karjääriteedele, mida andmeteadlane võib järgida, võib nende töö liigid jagada mõneks põhikategooriaks. Kõik andmeteadused ei sobi hästi nendesse rühmadesse, eriti arvutiteaduse esirinnas, kus pidevalt murtakse uusi maasid, kuid need annavad teile ülevaate sellest, kuidas andmeteadlased muudavad andmed ülevaateks.
Statistika
Andmeteaduse keskmes on statistika matemaatika valdkond, mis kirjeldab andmekogumi erinevaid omadusi, olgu need siis numbrid, sõnad, pildid või mõni muu mõõdetav teave. Suur osa statistikast on keskendunud lihtsalt leiduva tuvastamisele ja kirjeldamisele – eriti väga suurte andmekogumite puhul on lihtsalt teadmine, mida teave sisaldab ja mida mitte, omaette ülesanne. Andmeteaduse valdkonnas nimetatakse seda sageli kirjeldavaks analüütikaks. Kuid statistika võib minna veelgi kaugemale, testides, kas teie eeldused andmetes sisalduva kohta on õiged või, kui need on õiged, kas see on oluline või kasulik. See võib hõlmata mitte ainult andmete uurimist, vaid ka nendega manipuleerimist, et välja tuua nende silmapaistvad omadused. Selleks on palju erinevaid viise – lineaarne regressioon, logistiline regressioon ja diskriminantanalüüs, erinevad valimi võtmise meetodid ja nii edasi –, kuid lõppkokkuvõttes on kõik need meetodid selleks, et mõista andmekogumi omadusi ja kui täpselt need funktsioonid on. peegeldavad mõnda tähenduslikku tõde selle maailma kohta, millele nad vastavad.
Andmete analüüs
Kuigi see on üles ehitatud statistika alusel, läheb andmeanalüüs veidi kaugemale, et mõista põhjuslikku seost, visualiseerida ja tulemusi teistele edastada. Kui statistika eesmärk on määratleda andmekogumi mis ja millal, proovib andmeanalüüs tuvastada, miks ja kuidas. Andmeanalüütikud teevad seda andmete puhastamise, kokkuvõtete tegemise, teisendamise, modelleerimise ja testimise teel. Nagu eespool mainitud, ei piirdu see analüüs ainult numbritega. Kuigi suur osa andmete analüüsist kasutab arvulisi andmeid, on võimalik analüüsida ka muud tüüpi andmeid – näiteks klientide kirjalikku tagasisidet või sotsiaalmeedia postitusi või isegi pilte, heli ja videot.
Andmeanalüütikute üks peamisi eesmärke on mõista põhjuslikku seost, mida saab seejärel kasutada suundumuste mõistmiseks ja prognoosimiseks paljudes rakendustes. Diagnostilise analüüsi käigus otsivad andmeanalüütikud seoseid, mis viitavad põhjusele ja tagajärjele, mida saab omakorda kasutada tulemuste muutmiseks. Ennustav analüüs otsib sarnaselt mustreid, kuid laiendab neid seejärel veelgi, ekstrapoleerides nende trajektoore teadaolevatest andmetest kaugemale, et aidata ennustada, kuidas mõõdetud või hüpoteetilised sündmused, sealhulgas tulevased sündmused, võivad välja tulla. Andmeanalüüsi kõige arenenumate vormide eesmärk on anda juhiseid konkreetsete otsuste tegemiseks, modelleerides ja prognoosides erinevate valikute tulemusi, et teha kindlaks kõige sobivam tegevussuund.
Tehisintellekt ja masinõpe
Üks praegu andmeteaduses toimuvaid suuri edusamme – ja see, mis võib tulevikus avaldada tohutut mõju – on tehisintellekt ja täpsemalt masinõpe. Lühidalt öeldes hõlmab masinõpe arvuti koolitamist selliste ülesannete täitmiseks, mida me tavaliselt arvame nõudvana teatud tüüpi intelligentsusest või otsustusvõimest, näiteks võime tuvastada fotol olevaid objekte. Tavaliselt saavutatakse see rohkete näidetega selle kohta, millist otsustusvõimet võrgustikku treenite. Nagu võite ette kujutada, nõuab see nii hulgaliselt (tavaliselt struktureeritud) andmeid kui ka võimet saada arvuti nendest andmetest aru. Tugevad statistika- ja programmeerimisoskused on kohustuslikud.
Masinõppe kasulikud mõjud on praktiliselt piiramatud, kuid ennekõike on see võime täita keerulisi või pikaajalisi ülesandeid kiiremini kui ükski inimene kunagi suudaks, näiteks tuvastada miljonitest piltidest koosnevas hoidlas konkreetne sõrmejälg või teha ristviiteid. kümneid muutujaid tuhandetes meditsiinilistes toimikutes, et tuvastada seoseid, mis võivad anda vihjeid haiguse põhjustele. Piisavate andmete olemasolul saavad masinõppe eksperdid isegi koolitada närvivõrke, et toota originaalkujutisi, ammutada sisukaid teadmisi tohututest kirjutatud tekstidest, teha ennustusi tulevaste kulutrendide või muude turusündmuste kohta ning eraldada ressursse, mis sõltuvad väga keerulisest jaotusest, näiteks energiast. , maksimaalse efektiivsusega. Masinõppe kasutamise eeliseks nende ülesannete täitmiseks, erinevalt muudest automatiseerimise vormidest, seisneb see, et järelevalveta A.I. süsteem saab aja jooksul automaatselt õppida ja täiustada – isegi ilma uue programmeerimiseta.
Äriteave
Nagu võisite aimata varasemast turusündmustele viitamisest, on äri- ja rahandusmaailm üks kohti, kus masinõpe on oma varasemaid ja sügavamaid mõjusid avaldanud. Tänu tohutule hulgale numbrilistele andmetele – turundusandmebaasid, küsitlused, pangateave, müüginäitajad jne, millest enamik on hästi organiseeritud ja nendega on suhteliselt lihtne töötada – saavad andmeteadlased kasutada statistikat, andmeanalüüsi ja masinõpe, et saada teadmisi ärimaailma arvukate aspektide kohta, mis suunab otsuste langetamist ja optimeerib tulemusi, kuni selleni, et ärianalüüsist on saanud omaette andmeteaduse valdkond.
Üsna sageli ei vaata Business Intelligence'i arendajad lihtsalt kättesaadavaid andmeid, et näha, mida nad saavad avastada. nad tegelevad ennetavalt andmete kogumisega ning tehnikate ja toodete väljatöötamisega, et vastata konkreetsetele küsimustele ja saavutada konkreetseid eesmärke. Selles mõttes on äriteabe arendajad ja analüütikud äri- ja rahandusmaailma strateegilises arengus üliolulised – aidates juhtkonnal teha paremaid otsuseid ja neid kiiremini teha, mõista turgu, et teha kindlaks ettevõtte võimalused ja väljakutsed ning parandada ettevõtete üldist tõhusust. ettevõtte süsteemid ja toimimine, mille kõikehõlmav eesmärk on saavutada konkurentsieelis ja suurendada kasumit.
Andmetehnoloogia
Viimane suur õppevaldkond, kus andmeteadlased sageli töötavad, hõlmab tervet rida erinevaid ametinimetusi – andmeinsener, süsteemiarhitekt, rakenduste arhitekt, andmearhitekt, ettevõtte arhitekt või infrastruktuuriarhitekt, kui nimetada vaid mõnda. Igal neist rollidest on oma vastutusalad, millest mõned arendavad tarkvara, teised IT-süsteeme ja kolmandad viivad ettevõtte sisestruktuuri ja protsessid vastavusse tehnoloogiaga, mida ta kasutab oma äristrateegiate elluviimiseks. Neid kõiki seob see, et selles valdkonnas töötavad andmeteadlased rakendavad andmeid ja infotehnoloogiat, et luua või täiustada süsteeme, pidades silmas konkreetset funktsiooni.
Näiteks rakenduste arhitekt jälgib, kuidas ettevõte või muu ettevõte kasutab konkreetseid tehnoloogilisi lahendusi, seejärel kavandab ja arendab rakendusi (sh tarkvara või IT-taristut) jõudluse parandamiseks. Andmearhitekt arendab sarnaselt rakendusi – antud juhul lahendusi andmete salvestamiseks, haldamiseks ja analüüsimiseks. Infrastruktuuriarhitekt võib välja töötada kõikehõlmavad lahendused, mida ettevõte kasutab igapäevaseks äritegevuseks, et tagada nende lahenduste vastavus ettevõtte süsteeminõuetele, olgu see siis võrguühenduseta või pilves. Andmeinsenerid keskenduvad omakorda andmetöötlusele, andmekanalite väljatöötamisele ja juurutamisele, mis koguvad, korraldavad, salvestavad, toovad ja töötlevad organisatsiooni andmeid. Teisisõnu, selle laia andmeteaduse kategooria tunnusjoon on see, et see hõlmab asjade kavandamist ja ehitamist: süsteeme, struktuure ja protsesse, mille abil andmeteadust teostatakse.
Millised on kõige nõudlikumad andmeteaduse töökohad?
Andmeteadus üldiselt on väga nõutud oskus, nii et võimalusi on igal valdkonnal ja erialal väga palju. Tegelikult nimetas LinkedIn 2019. aastal Data Scientisti aasta kõige lootustandvamaks töökohaks ja QuantHub ennustas järgmisel aastal teravat puudust kvalifitseeritud andmeteadlastest.
Võtmesõna on siin kvalifitseeritud. Tihti on tehnilised nõuded, millele andmeteadlane peab vastama, nii spetsiifilised, et vajaliku pädevuste kogumiseks võib kuluda mõneaastane tööstuses töötamise kogemus, alustades üldteadlasena, seejärel lisades järk-järgult üha uusi võimeid ja võimeid. nende oskuste kogum.
Need on vaid mõned kõige levinumad viisid, kuidas andmeteadlased saavad seda teha – potentsiaalseid karjäärivõimalusi on sama palju kui andmeteadlasi, kuid igal juhul sõltub karjääri edendamine aja jooksul uute oskuste ja kogemuste omandamisest.
Andmeanalüütik
Nagu nimigi ütleb, analüüsivad andmeanalüütikud andmeid, kuid see lühike pealkiri kajastab vaid väikest osa sellest, mida andmeanalüütikud suudavad tegelikult saavutada. Esiteks algavad andmed harva lihtsalt kasutatavast vormist ja tavaliselt on andmeanalüütikud need, kes vastutavad vajalike andmete tuvastamise, nende kogumise ja kokkupanemise ning seejärel puhastamise ja korrastamise eest – teisendades need rohkemateks andmeteks. kasutatav vorm, määrata, mida andmekogum tegelikult sisaldab, eemaldada rikutud andmed ja hinnata nende täpsust. Siis on analüüs ise – erinevate tehnikate kasutamine andmete uurimiseks ja modelleerimiseks, mustrite otsimiseks, nendest mustritest tähenduse eraldamiseks ja nende ekstrapoleerimiseks või modelleerimiseks. Lõpuks teevad andmeanalüütikud oma ülevaate teistele kättesaadavaks, esitades andmed armatuurlaual või andmebaasis, millele teised inimesed pääsevad juurde, ning edastades oma järeldused teistele esitluste, kirjalike dokumentide ning diagrammide, graafikute ja muude visualisatsioonide kaudu.
Andmeanalüütiku karjääritee
Data Analyst on suurepärane sisenemispunkt andmeteaduse maailma; see võib olla algtaseme ametikoht, olenevalt nõutavast asjatundlikkuse tasemest. Uued andmeanalüütikud sisenevad valdkonda tavaliselt kohe pärast kooli – statistika, matemaatika, informaatika või muu sarnase kraadiga – või lähevad andmeanalüüsile üle seotud valdkonnast, nagu äri, majandus või isegi sotsiaalteadused, tavaliselt oma haridust täiendades. oskused karjääri keskel läbi andmeanalüüsi alglaagri või sarnase sertifitseerimisprogrammi.
Kuid olenemata sellest, kas tegemist on värskete koolilõpetajate või kogenud spetsialistidega, kes teevad karjääri keskpaigas muudatusi, alustavad uued andmeteadlased tavaliselt rutiinsete ülesannete täitmisega, nagu andmete hankimine ja töötlemine sellistes keeltes nagu R või SQL, andmebaaside loomine, põhianalüüsi tegemine ja loomine. visualiseerimine, kasutades selliseid programme nagu Tableau. Mitte iga andmeanalüütik ei pea teadma, kuidas neid kõiki asju teha – spetsialiseerumine võib toimuda isegi nooremal ametikohal –, kuid kui loodate oma karjääris edeneda, peaksite saama kõiki neid ülesandeid täita. Paindlikkus on selles varajases staadiumis suur eelis.
Andmeanalüütikuna edu saavutamine sõltub teatud määral sellest, millises valdkonnas te töötate – näiteks turundusest või rahandusest. Sõltuvalt sektorist ja teie töö tüübist võite spetsialiseeruda Pythonis või R-is programmeerimisele, saada andmete puhastamise professionaaliks või keskenduda ainult keerukate statistiliste mudelite loomisele või kaunite visuaalide loomisele; teisalt võite ka otsustada õppida natuke kõike, seades teid vanemandmeanalüütiku ametikohale asudes juhtpositsioonile. Piisavalt laiaulatusliku ja sügava kogemusega vanemandmeanalüütik on valmis asuma juhtrolli, jälgides teiste andmeanalüütikute meeskonda, saades lõpuks osakonnajuhiks või direktoriks. Täiendavate oskuste väljaõppega on andmeanalüütikutel ka tugev positsioon, et liikuda edasi andmeteadlase positsioonile.
Andmeteadlane
Õiged andmeteadlased saavad tavaliselt teha kõike seda, mida andmeanalüütikud saavad teha, ja lisaks veel mõned asjad – õige väljaõppe ja kogemustega võib andmeanalüütik lõpuks andmeteadlase ametikohale tõusta. Nii et jah, andmeteadlased peaksid suutma andmeid hankida, puhastada, manipuleerida, salvestada ja analüüsida, aga ka mõistma masinõppe erinevaid meetodeid ja nendega töötama ning suutma programmeerida Pythonis, R-is või sarnases statistilises programmeerimiskeeles ehitada ja hinnata täiustatud mudeleid.
Andmeteadlase karjääritee
Paljud inimesed astuvad valdkonda andmeanalüütikuna enne, kui omandavad kogemusi ja lisaoskusi, mida on vaja enda andmeteadlasteks nimetamiseks. Seejärel on Junior Data Scientisti järgmiseks sammuks tavaliselt vanemteadlane – kuigi see lihtne pealkirja muutmine lükkab ümber selle ülemineku tegemiseks kuluva töö; vanemandmeteadlane mõistab suurepäraselt peaaegu kõiki andmeteaduse aspekte – A.I, andmehoidla, andmekaevandamine, pilvandmetöötlus ja nii edasi – lisaks sellele, et nad tunnevad mõnda tööstusharuspetsiifilist valdkonda, nagu äristrateegia või tervishoiuanalüütika. , või nad on spetsialiseerunud mõnele neist valdkondadest, omades guru tasemel teadmisi.
Tasub mainida, et kuigi mõned andmeteadlased alustavad oma karjääri analüütikuga ja töötavad kõrgematel ametikohtadel erivaldkondades, nagu psühholoogia, turundus, majandus ja nii edasi, alustavad teised professionaalidena ühes neist erinevatest valdkondadest enne andmetele üleminekut. teaduslik roll.
Paljude jaoks on vanemandmeteadlane karjääri ülim eesmärk; see on juba nii kõrgetasemeline roll, et vähemalt andmeteaduse valdkonnas on see sageli kõrgeim positsioon, mida on võimalik saavutada – sinust saab lihtsalt parem, võimekam vanemandmeteadlane, kellel on suuremad spetsialiseerumisvaldkonnad. Mõnede jaoks, eriti need, kes võtavad üldisema lähenemisviisi, on aga võimalik teha täiendavaid edusamme juhtivale ametikohale, nagu juhtiv andmeteadlane, kes juhib meeskonda või osakonda või isegi andmejuht, kes juhib asutuse andmestrateegiat kõrgeimal tasemel. ja vastates ainult tegevjuhile.
Andmeinsener
Andmeinsenere eristab teistest andmevaldkonnas töötavatest professionaalidest asjaolu, et nad kavandavad ja ehitavad terveid süsteeme – sealhulgas infrastruktuuri ja protsesse, mida ettevõte nende andmete maksimaalseks kasutamiseks kasutab. See tähendab, et andmeinsenerid on inimesed, kes määravad kindlaks viisid, kuidas teised andmeteadlased saavad oma tööd teha. Milliseid andmevorme suudab ettevõtte süsteem mahutada? Milliseid meetodeid kasutatakse müügi ja turunduse või tervishoiuuuringu tulemuste andmete kogumiseks ja analüüsimiseks kättesaadavaks tegemiseks? Selleks peavad andmeinsenerid olema väga kursis sellega, millist tööd teevad teised andmeteaduse spetsialistid – andmebaasiadministraatorid, andmeanalüütikud, andmearhitektid ja nii edasi – kuni selleni, et andmeinsenerid saavad sageli täita kõiki neid rolle. hästi. Kuid kuna nad on ehitajad, kulutavad andmeinsenerid tavaliselt rohkem aega arendusele kui teised andmeteaduse spetsialistid – kirjutavad tarkvaraprogramme, loovad relatsiooniandmebaase või arendavad tööriistu, mis võimaldavad ettevõtetel osakondade vahel andmeid jagada.
Andmeinseneri karjääritee
Sarnaselt teistele andmetega töötavatele töökohtadele on andmeinseneriks saamise esimene samm sageli ülikoolikraad (tavaliselt bakalaureuse- või magistrikraad inseneriteaduses, arvutiteaduses või matemaatikas), kuid mitte alati. IT- või tarkvaraarenduse alal palju kogemusi omav inimene võib avastada, et tal on juba kõik andmeinseneriks saamiseks vajalikud oskused, välja arvatud andmeoskused ise. Sel juhul võib oskuste ümberõpe, näiteks andmete alglaager, aidata neid omandada. kuni kiiruseni. Paljusid andmeinsenerile vajalikke oskusi (nt SQL, UNIX ja Linux, ETL-i arendus või IT-süsteemide konfigureerimine) saab arendada kõrvalvaldkonnas töötades; teised (nagu masinõpe või andmekanalite loomine) nõuavad rohkem keskendunud õppimist.
Nagu öeldud, alustab enamik andmeinsenere oma karjääri mõnes arvutiteaduse alamvaldkonnas töötades, enne kui omandavad kõik nooremandmeinseneriks saamiseks vajalikud oskused – tõepoolest, enamik nooremandmeinseneride töökuulutusi eeldab ühe kuni viieaastast töökogemust. Sealt edasi on järgmine loogiline samm vanemandmeinseneriks ja juhtivandmeinseneriks. Kuid kuna nad valdavad nii paljusid IT, tarkvaratehnika ja andmeteaduse aspekte, on andmeinseneridele avatud ka palju muid ametikohti – sealhulgas andmearhitekt, lahenduste arhitekt või rakenduste arhitekt. Kui keegi soovib teha vähem praktilist tööd ja rohkem töötajaid juhtida, võib teisteks valikuteks olla tootearendusjuht – või õigete inimeste oskuste korral isegi andmejuht või teabejuht.
Kas andmeteadlased saavad kodus töötada?
Nagu paljud tehnoloogiavaldkonna töökohad, saab andmeteadlase rolle sageli täita kaugjuhtimisega, kuid see sõltub lõpuks ettevõttest, kus töötate, ja teie töö tüübist.
Millal saavad andmeteadlased kaugtööd teha?
Andmeteaduse ametikohad, mis töötavad väga tundlike või konfidentsiaalsete andmete ja teabega (mis hõlmab suurt hulka neist, isegi väljaspool privaatsusrikkaid valdkondi, nagu pangandus ja tervishoid, kuna omandiõigusega kaitstud andmed võivad olla suurettevõtte üks väärtuslikumaid varasid), leiavad, et seisavad silmitsi kaugtööga seotud piirangutega. Sellistel juhtudel peate tõenäoliselt töötama tööajal kontoris.
Mõned muud tegurid, mida tuleks arvestada:
Kategori: Uudised