Mis on andmeteadlane?

BrainStationi Data Scientisti karjäärijuhend aitab teil teha esimesi samme tulusa andmeteaduse karjääri suunas. Lugege edasi, et saada ülevaade andmeteadlase töörollist, andmeteaduse ajaloost ja andmeteadlaseks saamiseks vajalikest oskustest.

Hakka andmeteadlaseks

Rääkige õppenõustajaga, et saada lisateavet selle kohta, kuidas meie alglaagrid ja kursused aitavad teil saada andmeteadlaseks.



Klõpsates nuppu Esita, nõustute meiega Tingimused .



Esita

Ei saanud esitada! Kas värskendada lehte ja proovida uuesti?

Lisateavet meie Data Science Bootcampi kohta

Aitäh!

Võtame varsti ühendust.



Vaadake Data Science Bootcampi lehte

Mis on andmeteadlane?

Andmeteadlane on andmeekspert, kellel on analüütilised ja tehnilised oskused keeruliste probleemide lahendamiseks. Andmeteadlase roll hõlmab arvutiteaduse, matemaatika ja statistika kasutamist andmete mustrite leidmiseks ja organisatsioonide jaoks rakendatavate strateegiate väljatöötamiseks.

Andmeteadlased kulutavad palju aega andmete kogumisele, korraldamisele, modelleerimisele ja uurimisele erinevatest vaatenurkadest, sealhulgas sellistest, mida pole varem vaadatud. Kui tundub, et andmeteadus ei paku ainsat tegevuskaarti probleemist lahenduseni, siis see pole nii. Nagu biostatistikaprofessor Jeff Leek selgitab, pole „andmeteaduse” märksõna „andmed”; see on 'teadus' – mis tähendab, et definitsiooni järgi on andmeteadus uurimuslik valdkond.

Kuna andmeteadlastel on tavaliselt üks jalg igas äri- ja IT-maailmas, on nad väga nõutud ja kõrgelt tasustatud. Enamik ettevõtteid on hiljuti mõistnud andmeteaduse tohutut jõudu ja väärtust ning seda, et nad ei saa enam lubada eirata struktureerimata andmete hulka, mis neil on nende kasutajate ja klientide käeulatuses. Kuid keegi peab selle rahutu segaduse kulla saamiseks kaevandama – ja siin tuleb appi andmeteadlane.



Arvestades suurandmete äkilise esiletõusmise tõttu kasvavat nõudlust andmeteaduse järele, ei alustanud enamik andmeteadlasi oma karjääri selles valdkonnas. Paljud alustavad enne üleminekut andmeanalüütikute või statistikutena. 2020. aasta BrainStationi digitaaloskuste uuring näitas, et 76 protsenti vastanutest ei alustanud oma karjääri andmetega ja 68 protsenti on töötanud viis aastat või vähem.

Seda seetõttu, et andmeteadus oma praegusel kujul on suhteliselt uus valdkond.

Andmeteaduse ajalugu

Tegelikult tõusis tänapäevase andmeteaduse ajalugu ja üldine huvi suurandmete vastu 90ndate keskel, kui Business Week avaldas andmebaasiturunduse teemalise kaaneloo, milles märgiti, et ettevõtted koguvad oma klientide kohta suuri andmeid ja kasutavad seda. ennustada, kui suure tõenäosusega nad mõne toote ostavad, ja koostada turundussõnum, mis paneks teid sellesse suurema tõenäosusega ostma.



Kaks aastat hiljem kogunesid Rahvusvahelise Klassifikatsiooniühingute Föderatsiooni liikmed oma iga kahe aasta tagant toimuvale koosolekule ning esimest korda lisati andmeteadus ka konverentsi pealkirja (Andmeteadus, klassifitseerimine ja sellega seotud meetodid.) Samal aastal toimus ka andmeteadus. avaldati mõjukas paber pealkirjaga Andmekaevandamisest teadmiste avastamiseni andmebaasides ja järgmisel aastal ilmus ajakiri Data Mining and Knowledge Discovery. Samuti 1997. aastal C.F. Jeff Wu pidas Michigani ülikooli statistika õppetooli H. C. Carveri inauguratsiooniloengu, milles ta kutsus üles nimetama statistika ümber andmeteaduseks ja statistikud andmeteadlasteks.

2002. aastal ilmus Data Science Journal, millele järgnes järgmisel aastal Journal of Data Science. Ja 2007. aastal asutati Shanghais Dataoloogia ja Andmeteaduse Uurimiskeskus.

Siiski võisid need, kes ei olnud andmeteaduse suundumustega seotud, jahmunud, kui 2009. aastal ütles Google'i peaökonomist Hal Varian McKinsey Quarterlyle, et järgmise 10 aasta seksikas töökoht on statistikud. Aeg on tõestanud, et tal on õigus. Teil oleks raske leida edukat ettevõtet, mis ei kulutaks raha selleks, et leida loovaid ja tõhusaid viise suurandmete võimsuse ärakasutamiseks. Andmeteadlased on selle keskmes.

Kuidas saada andmeteadlaseks

Ka andmeteadlaseks saamise teed on aastate jooksul muutunud. Algselt oli andmeteadlase roll akadeemiline ja siiani on paljud andmeteadlased kõrgelt haritud. Tegelikult on 88 protsendil vähemalt magistrikraad ja 46 protsendil doktorikraad. Sageli algab andmeteaduse karjäär bakalaureusekraadiga arvutiteaduses, matemaatikas või statistikas

Samuti on spetsiaalselt andmeteadusega seotud ülikooliprogramme, näiteks Põhja-Carolina osariigi ülikooli täiustatud analüüsi instituut. Ja seal, kus lootusrikkad andmeteadlased jäeti suures osas arvutiteadust õppima, pakuvad nüüdseks paljud ülikoolid lõpuks andmeteaduse kraadi. Syracuse'i ülikool, UC Berkeley, John Hopkinsi ülikool, Columbia ülikool ja Michigani ülikool on ühed tipptasemel koolid, mis pakuvad nüüd andmeteaduse magistrikraadi.

Sellegipoolest pole see kõrge haridustase või andmeteaduse kraad andmeteaduse õppimiseks raske nõue. Lihvitud portfoolio ja tõsiste tehniliste oskuste näitamine CV võib olla piisav, et jõuda andmeteaduse algtaseme töökohani.

Üha rohkem on ka alglaagreid ja tunnistuste kursusi, mis õpetavad andmeteaduse ja analüütika oskusi. Karjäärimuutjatele, kes soovivad kiirelt sukelduda paljutõotavasse valdkonda – või neile, kellel pole lihtsalt aega ega raha aastatepikkuseks ülikoolis õppimiseks – võib see olla ahvatlev valik. Need keskendunud ja kõikehõlmavad programmid lubavad anda lõpetajatele kõik vajalikud tehnilised oskused ja hulga karjääriteenuseid, et tagada nende vilistlaste uue põlvkonna andmeteaduse tähte. See on ka tõhus meetod oma portfelli sära tagamiseks, kuna valdkonna veteranid jälgivad teie seljatagust.

Eduka andmeteadlase omadused

Olenemata oma hariduslikust taustast jagavad head andmeteadlased mitmeid omadusi.

Esiteks ei saa mööda tõsiasjast, et andmeteadlaseks saamiseks peate omandama teatud oskused. Iga andmeteadlane peaks teadma Pythoni, R-i, SQL-i, Hadoopi ja Sparki käitumist. Kõik andmeteadlased peaksid olema hästi kursis ka järgmistes valdkondades: andmeanalüütika, andmete kogumine, andmeanalüüs, statistiline analüüs, andmete visualiseerimine ja aruandlustehnoloogiad, andmebaasid, nagu Postgres ja MySQL, ennustav analüüs, masinõpe, tehisintellekt ja programmeerimine.

Ja jah, andmeteadlase roll hõlmab kindlasti numbreid. Nad töötavad suurte andmemahtude ja andmekogumitega. Andmeteadlased otsustavad, milliseid andmeid on vaja, puhastavad andmed, koostavad mudelid selle kohta, mida andmed võivad näidata, ja korraldavad need varjatud arusaamade avaldamiseks. Seda kõike tehakse suurema ärieesmärgi teenimiseks.

Kuigi andmeteadlased töötavad numbritega, on oluline märkida, et andmekogumid võivad koosneda ka tekstist, struktureeritud andmetest, piltidest, videost, helist ja graafikast. Andmete tüüp, mida andmeteadlane oma igapäevases tööelus kasutab, sõltub suuresti tööstusest. Kuid kõrgel tasemel on andmeteadlase ülesandeks võtta need andmed – mis tahes kujul – ja lõpuks kasutada neid, et aidata juhtidel teha targemaid otsuseid. See võib toimuda toote või teenuse täiustamise, tõhusamate töövoogude leidmise, uute turuülevaadete leidmise või klientide kogemuste parandamise vormis.

Andmeteaduse pehmed oskused

Hea andmeteadlane oskab hästi visualiseerida ja esitada andmeid – see on valdkond, mis ühendab tehnilised oskused ja pehmed oskused. Andmete teisendamiseks tabelitest diagrammideks, graafikuteks ja armatuurlaudadeks saab kasutada mitmeid tööriistu, sealhulgas Tableau, Plotly, Bokeh ja Matplotlib, ning nende tööriistade valdamine vastab andmete visualiseerimise tehnilisele poolele.

Andmeteadusega seotud pehmed oskused tulevad esile siis, kui proovite kindlaks teha, millist tüüpi visualiseerimine teie leide kõige tõhusamalt edastab, ning teil on esteetilist maitset, et teada saada, kuidas oma leide esitada viisil, mis muudab need kõige suuremaks ja veenvamaks. mõju otsustajatele, kellele teave esitatakse.

Lisaks vajavad suurepärased andmeteadlased oma rollis silma paistmiseks laia valikut pehmeid oskusi. Esiteks on oluline mõista äri. Teil võivad olla kõik maailma tehnilised oskused, kuid kui te ei mõista äripõhimõtteid ega oma ettevõtte eesmärke, ei kasutata neid oskusi produktiivsel ja tõhusal viisil.

Suhtlemisoskused on samuti üliolulised, kui esitate oma järeldused, esitate oma seisukoha nende leidudega seotud muudatuste rakendamiseks ja proovite oma ettevõtte üldises organisatsioonistrateegias kaasa rääkida.

BrainStatoini uuringu kohaselt hindas 83 protsenti andmespetsialistidest üldist andmepädevust keskmiseks või madalaks ning 89 protsenti ütles, et see puudus mõjutab nende organisatsiooni projektide edu. Lisaks ütles 59 protsenti, et nende ettevõte oleks edukam, kui nende töötajatel oleks andmeoskused.

See illustreerib kahte asja: andmeprofessionaalide järele on suur nõudlus ja selles valdkonnas töötate inimestega, kes tõenäoliselt andmetest palju aru ei saa, ning teie jaoks on ülioluline leida viise, kuidas edastada oma sõnum mõjuval ja juurdepääsetaval viisil. edu.

Andmeteadlane peab olema ka hea meeskonnamängija. Teil on tegemist suurte, multidistsiplinaarsete meeskondadega ja tõhus andmeteadlane ei saa oma valitud projektidega lihtsalt isoleeritult töötada. Peate koordineerima ja tegema koostööd paljude inimestega, kes täidavad teisi tehnilisi ja mittetehnilisi rolle.

Programmeerimiskeeled andmeteaduse jaoks

Python, R, SQL ja Java on ühed populaarseimad programmeerimiskeeled, mida andmeteadlased kasutavad.

Python

Juurdepääsetav, hõlpsasti kasutatav ja mitmekülgne Python on paljude andmeteadlaste jaoks parim programmeerimiskeel.

R

R pakub mitmesuguseid domeenispetsiifilisi pakette, mis vastavad andmeteadlastel vajaminevatele statistika- ja andmete visualiseerimisrakendustele.

SQL

SQL ehk struktureeritud päringu keel on domeenispetsiifiline keel, mida kasutatakse andmete haldamiseks relatsiooniandmebaasides.

Java

Osa Java kasulikkusest seisneb selle populaarsuses: paljud ettevõtted kasutasid Java taustasüsteemide ja rakenduste loomiseks lauaarvutitele, mobiilseadmetele ja veebile. Java kasutamise tundmine võimaldab põimida andmeteaduse tootmiskoodi otse olemasolevasse andmebaasi.

Trepid

Kasutajasõbralik ja paindlik Scala on ideaalne programmeerimiskeel suurte andmemahtude käsitlemiseks.

Julia

Julia on mõeldud arvuliseks analüüsiks ja arvutusteaduseks ning kasulik keerukate matemaatiliste toimingute lahendamiseks.

MATLAB

MATLABi kasutatakse tööstuses ja akadeemilistes ringkondades tänu selle intensiivsele matemaatilisele funktsionaalsusele.

Selle kohta lisateabe saamiseks klõpsake siin Töökohad andmeteaduses

Erinevate andmete ja andmetega külgnevate rollide erinevuse mõistmine, mida tavalises andmemeeskonnas võib leida, võib olla keeruline. Siin on mõned andmeteaduse ametinimetused ja nende erinevused:

    Andmeteadlane. Erinevalt andmeanalüütikutest peavad andmeteadlased mõistma ettevõtte ees seisvaid väljakutseid ning pakkuma andmeanalüüsi ja andmetöötlust kasutades parimaid lahendusi. Andmeteadlastelt oodatakse ennustavate analüüside tegemist ja struktureerimata andmete sõelumist, et pakkuda praktilisi teadmisi. Nad saavad seda teha ka suundumuste ja mustrite tuvastamisega, mis aitavad ettevõtetel teha paremaid otsuseid.Andmeanalüütik. Andmeanalüütik vastutab tohutute andmehulkade visualiseerimise, närimise ja töötlemise eest. Aeg-ajalt peavad nad ka andmebaasides päringuid tegema. Andmeanalüütiku tööriistakomplekti üks olulisemaid tööriistu on optimeerimine, mille käigus nad loovad ja muudavad algoritme, mida saab kasutada teabe kogumiseks mõnest suurimast andmebaasist ilma andmeid rikkumata.Andmeinsenerid. Andmeinsenerid loovad ja testivad skaleeritavaid suurandmete ökosüsteeme, et andmeteadlastel oleks stabiilsed ja optimeeritud andmesüsteemid, millel oma algoritme käitada. Andmeinseneride ülesandeks on ka olemasolevate süsteemide värskendamine praeguste tehnoloogiate täiendatud versioonidega, et parandada andmebaasi tõhusust.Andmebaasi administraator. Andmebaasi administraatorid vastutavad ettevõtte andmebaaside nõuetekohase toimimise eest. Lisaks võivad nad ettevõtte töötajatele teenuseid vastavalt nende vajadustele osutada või tühistada. Samuti kipuvad nad andmebaasi varundama ja taastama.Masinõppe insener. Nõudva rolliga masinõppeinsenerid viivad läbi A/B-teste, loovad andmekonveierid ja rakendavad levinud masinõppe algoritme, nagu klassifitseerimine ja rühmitamine. Neil peavad olema põhjalikud teadmised võimsate tehnoloogiate, sealhulgas SQL-i ja REST API-de kohta.Andmearhitekt. Andmebaaside turvalisuse ja tsentraliseeritud tagamiseks loob Data Architect teabehalduse andmearhitektuuri kavandid. Samuti tagavad nad, et andmeinseneridel on töötamiseks parimad tööriistad ja süsteemid.Tehisintellekti insener. Tehisintellekti insenerid töötavad traditsiooniliste masinõppetehnikatega, nagu loomuliku keele töötlemine ja närvivõrgud, et luua mudeleid, mis toidavad tehisintellektil põhinevaid rakendusi.Arvutiteadlane. Arvutiteadus on uuring selle kohta, kuidas arvuteid saab kasutada paljude probleemide lahendamiseks. Väga lihtsalt öeldes integreerib arvutiteadus teemasid, sealhulgas matemaatikat, füüsikat, inseneritööd ja disaini, et uurida, kuidas kasutada arvuteid teabe edastamiseks ja teisendamiseks. Arvutiteadlased kasutavad tehnoloogiat probleemide lahendamiseks ja tulevikuks valmistumiseks, nad kirjutavad ja programmeerivad tarkvara rakenduste loomiseks ning valideerivad ja arendavad inimeste ja erinevate seadmete vahelise suhtluse mudeleid.

Lisaks kõiki ülaltoodud rolle täitvatele inimestele teevad andmeteadlased tavaliselt kogu organisatsioonis koostööd paljude sidusrühmadega, sealhulgas kõigiga alates turundusest kuni müügini ja lõpetades IT-ga kuni tippjuhtkonnani, eriti vanemandmeteadlase tasemel. Tavaliselt on vahetu andmete meeskond siiski väiksem rühm; BrainStationi uuring näitas, et enamik andmespetsialiste töötab väikestes meeskondades, 37 protsenti alla viieliikmelistes meeskondades ja 26 protsenti viie- kuni kümneliikmelistes meeskondades.

Andmeteaduse nõudlus

Koostöö tegemine mitme erineva taustaga inimestega – selle asemel, et jääda tehnilisse silosse – on üks paljudest põhjustest, miks nii paljud inimesed soovivad saada andmeteadlaseks.

Teine on töökindlus. Alates 2012. aastast on andmeteadlaste rollid kasvanud 650 protsenti ja USA tööstatistika büroo prognoosib, et nõudlus andmeteadlaste oskuste järele kasvab 2026. aastaks veel 28 protsenti. McKinsey raport ennustab, et töötajatest jääb puudu 140 000 kuni 190 000 inimest. analüütilised oskused USA-s koos veel 1,5 miljoni juhi ja analüütikuga, kes peavad täiendama oskusi, et paremini mõista, kuidas andmepõhiseid otsuseid teha.

On ka muid põhjusi, miks suurandmete spetsialistid on nii rahulolevad ja oma tulevaste karjääriväljavaadete suhtes nii optimistlikud. Andmeteadlaste keskmine palk on 120 000 dollarit pluss (Indeedi andmetel), millele lisanduvad tavalised ahvatlevad hüved, sealhulgas pendelrände abi, aktsiaoptsioonid ja jõusaali liikmestaatus. Tööandjad, kes teavad, et neil on palju valikuvõimalusi, saavad Data Scientisti head tasu ja kohtlevad neid hästi. kui nad tahavad tööturul vaadata.

Kategori: Uudised