Rolul postului de muncă: Data scientist

Autor: Roger Morrison
Data Creației: 28 Septembrie 2021
Data Actualizării: 11 Mai 2024
Anonim
Ben Goldacre: Battling Bad Science
Video: Ben Goldacre: Battling Bad Science

Conţinut


Sursa: Sergey Khakimullin / iStockphoto

La pachet:

Oamenii de știință de date au locuri de muncă largi, care variază considerabil în funcție de aplicație. Dar un lucru pe care îl au cu toții în comun este unitatea de a folosi bine datele.

Ce face un om de știință de date în ceea ce privește inteligența artificială și mașina de învățare automată? O mulțime de profesioniști care se ocupă de acest tip de proiecte în fiecare zi ar spune că întrebarea este cam greu de răspuns pur și simplu. O întrebare mai bună ar fi: Ce fac oamenii de știință de date NU?

Un om de știință de date este parte integrantă a unui proces AI sau ML, în sensul că toate aceste proiecte depind de date mari sau de inputuri complexe. Omul de știință în date este un carierist esențial care știe să lucreze cu date pentru a produce rezultate.

Cu toate acestea, există câteva modalități de a vorbi despre ce face un om de știință de date, de calificările de care are nevoie și care este rolul său în acest proces.


Citit: 6 concepte cheie pentru știința datelor pe care le puteți stăpâni prin învățarea online

Definiții variate, drepturi variate

Mulți experți care descriu activitatea unui om de știință de date vorbesc despre aceasta în termeni generali.

„La companiile mici sau când lucrează pe o piață nouă, rolul unui om de știință de date este de a transforma surse de date relativ noi (dar evidente) în chestii care rezolvă o problemă pentru un utilizator final, ceea ce nu ar fi fost posibil, anterior, acolo unde tehnologiile folosite nu existau ”, spune Antonio Hicks, Account Manager la Mercury Global Partners. „Candidatul ideal este cineva care este matematician, parte inginer software și parte antreprenor.”

Alții răsună de această idee de bază, menționând ceea ce oamenii de știință au nevoie pentru a face față proiectelor de modelare.

„Cel mai important atribut de care are nevoie un om de știință de date este o curiozitate profundă despre lumea din jurul lor - indiferent dacă răspund la întrebări sau modele de construcție, dorința de a înțelege problema din fața lor este esențială”, spune Erin Akinci, Data Scientist Manager la Asana. „De acolo, majoritatea oamenilor vor avea nevoie de abilități în matematică și programare pentru a găsi soluții, dar tipurile specifice de matematică și programare variază mult în funcție de zona de expertiză din domeniul științei datelor.”


Fără bug-uri, fără stres - Ghidul dvs. pas cu pas pentru crearea de programe care schimbă viața fără a vă distruge viața

Nu îți poți îmbunătăți abilitățile de programare atunci când nimeni nu îi pasă de calitatea software-ului.

„Lucrările științifice excelente au mai mult de-a face cu modul în care un om de știință gândește despre o problemă, decât cu instrumentele pe care le folosesc pentru a o rezolva”, adaugă Charlie Burgoyne, fondator și CEO al Valkyrie Intelligence. Valkyrie este o companie de consultanță științifică aplicată cu proiecte impresionante sub aripa sa, cum ar fi Mark I, un aparat de rețea dedicat, care stimulează pregătirea și testarea rețelelor neuronale, îmbunătățindu-se ceea ce este posibil cu platformele anterioare de învățare a mașinilor din cloud.

"Piata cere oameni de stiinta care sunt competenti in dezvoltarea Python, design de retea neuronala si capacitatea de a modela un depozit de date in cea mai recenta arhitectura a bazelor de date", spune Burgoyne. „Aceste capacități sunt, totuși, mize de masă pentru un om de știință talentat. Ceea ce este mai puțin evident este aptitudinea unui om de știință pentru curiozitatea intrinsecă, ingeniozitatea agresivă și respectarea metodei științifice. ”

Aptitudinile unui om de știință în date

În ceea ce privește seturile de abilități practice, oamenii de știință de date au nevoie de o anumită cantitate de creativitate și experimentate în ceea ce privește modelarea. De asemenea, pot beneficia destul de mult de a avea „abilități dure”, cum ar fi codificarea experienței în Python, C ++ sau alte limbaje comune aplicate proiectelor ML.

"Python și C ++ sunt esențiale și sunt capabile să combine abilitățile de codare cu analiza și prelucrarea datelor, iar statisticile sunt abilități de bază care vor face ca un om de știință de date să iasă în evidență ca un candidat sau angajat puternic", spune Val Streif la Pramp, o platformă online de interviuri de tip „Mock”. pentru ingineri software, dezvoltatori și oameni de știință de date. „În timp ce unele dintre abilitățile de programare ar putea fi îngrijite prin asocierea unui om de știință de date cu un dezvoltator, este mult mai ușor dacă ai ambele abilități combinate într-una, din perspectiva unei companii.”

Alți experți adaugă R, Hadoop, Spark, Sas și Java pe listă, precum și tehnologii precum Tableau, Hive și MATLAB.

Toate acestea fac un CV impresionant, dar unii dintre cei care au experiență în recrutarea oamenilor de știință a datelor spun că și cealaltă parte „umană” contează. (Un tip de om de date este omul de știință a datelor despre cetățeni. Aflați mai multe în Rolul oamenilor de știință în domeniul cetățenilor din lumea datelor mari.)

„În mod tradițional, persoanele cu o educație artistică liberală diversă fac oameni de știință excelenți în date”, spune Burgoyne, făcând o distincție între ingineri, care sunt de partea clădirii, și oamenii de știință de date, a căror activitate poate fi mult mai conceptuală. El continuă:

Experiența într-un domeniu tradițional STEM, cu un accent complementar în domeniul științelor umaniste, al artei sau al afacerilor, dă acele calități care fac un om de știință excelent orientat în industrie. Trebuie spus că este la fel de important pentru capacitatea organizației de a valorifica acele calități și de a-și modela fervoarea și metodele într-o manieră productivă. Am observat că atunci când o inițiativă în domeniul științelor datelor nu reușește, organizația este la fel de probabil să fie la fel de vinovată ca și oamenii de știință. Oamenii de știință nu sunt ingineri. Ele nu sunt conduse să execute și să construiască. Sunt determinate să descopere și să înțeleagă. Organizațiile care înțeleg această diferență sunt bine răsplătite pentru cultivarea ambelor domenii.

În ceea ce privește datele de care se aplică de obicei oamenii de știință, asta are legătură cu obiectivele de bază ale companiei. Unele firme urmăresc un internet descentralizat - unele se joacă cu IoT sau SaaS. Alții încearcă să fie pionieri AI „prietenoasă” sau „etică” sau „transparentă”.

În orice caz, oamenii de știință de date ar putea împiedica diferența dintre valorile tari pe datele pe care le folosesc, în orice stivă tehnologică este în joc, și munca de freeweling de conceptualizare a funcționalității AI / ML.

„Angajăm oameni de știință pentru a gestiona colectarea și curățarea datelor, precum și traducerea datelor în informații semnificative”, spune Michael Hupp, managerul Data Science and Analytics la G2 Crowd. El elaborează:

În mod obișnuit, aceasta înseamnă gestionarea oricăror algoritmi importanți care conduc la motorul de date al unei companii și să fie fluent în instrumentele și limbajele cheie de analiză, dar în ultimii ani a inclus și câmpuri emergente precum procesarea limbajului natural, învățarea automată, alte forme de analiză activată AI. Cei mai de succes oameni de știință de date sunt cei care își combină abilitățile dure cu o abilitate de a învăța rapid și capacitatea de a comunica eficient ideile pe care le descoperă, astfel încât să fie semnificative pentru afacerile lor.

Cu aceste tipuri de informații, este mai ușor pentru tinerii profesioniști sau studenți să-și dea seama dacă oamenii de știință de date ar fi un rol bun pentru ei și cum să dobândească abilități. Învățarea STEM devine din ce în ce mai accesibilă în școlile din țară, dar nu există niciun înlocuitor pentru pasiunea pentru codificare și tehnologie și capacitatea de a învăța din mers.