Data Scientist

Data Scientist

Descrizione

Il Data Scientist identifica correlazioni tra i dati e prevede gli andamenti futuri del business. Per farlo, spesso fa ricorso a modelli statistici, algoritmi e sistemi di machine learning. Il Data Scientist lavora sui dati che il Data Analyst ha ordinato ed elaborato per poi creare modelli predittivi. Se il Data Analyst, basandosi sui dati raccolti, elabora informazioni strategiche per le decisioni di business, il Data Scientist si basa sugli stessi dati per progettare modelli matematici e prevedere gli andamenti futuri.

Attività principali richieste dal mercato

  • raccogliere enormi volumi di dati strutturati e non strutturati
  • pulire i dati per eliminare le informazioni irrilevanti e preparare i dati per la pre-elaborazione e la modellazione
  • eseguire analisi esplorative dei dati (EDA, Exploratory Data Analysis) per determinare come gestire i dati mancanti e per cercare tendenze e opportunità
  • codificare nuovi algoritmi per la raccolta e l'elaborazione dei data set
  • comunicare previsioni e risultati agli stakeholder attraverso report e data visualization
  • raccomandare modifiche a procedure e strategie esistenti

Requisiti/livello formazione

Per svolgere questo ruolo sono richieste una conoscenza avanzata dei principi di statistica nonchè competenze di matematica e di programmazione. Sono necessarie lauree in campo informatico, matematico, statistico o affini, che consentano di acquisire competenze diversificate, dalla tecnologia al mercato alla capacita` di utilizzare intelligenza artificiale, tecniche di machine learning, linguaggi di programmazione e tool di visualizzazione dati. Mentre si può imparare autonomamente la programmazione (per es. con corsi di Python on line) per imparare i fondamenti dello statistical pattern recognition e del Machine Learning servono solide basi di matematica e di statistica. Ai più alti livelli si richiedono, oltre alla laurea in ambito economico-scientifico, anche master, corsi di specializzazione e certificazioni.  Altrettanto importante è maturare esperienza all’interno di progetti volti all’implementazione e alla gestione di soluzioni di Business Intelligence integrando la formazione accademica con esperienza diretta. La crescente complessità dei progetti richiede il lavoro in team per cui nella progressione di carriera di un data scientist le mansioni di tipo gestionale diventano sempre più rilevanti. Un buon portafoglio di conoscenze include tematiche quali semantica ed ontologie per la gestione delle informazioni, text Mining & Natural Language Processing, digital Marketing & web analytics, gestione dei dati e dei processi attraverso piattaforme collaborative, aspetti legali ed etici del trattamento e della gestione dei dati.

Skills tecnologiche

  • esperienza dei database SQL Server e/o Synapse e/o altri RDBMS di mercato (Oracle, PostgreSQL, My SQL, …)                            
  • competenze di migrazione e/o integrazione sistemi di BI                            
  • architettura e modellazione di dati,  esperienza in Data Warehouse Architecture per la modellazione dati complessi (modello ER, Logico, Fisico)                            
  • strumenti e tecniche di business intelligence (BI) e data warehouse (DW), conoscenza dei linguaggi SQL, DAX, M e conoscenza di MS PowerBI                            
  • conoscenza dei sistemi di Business Intelligence della piattaforma Microsoft (SSAS Tabular e OLAP, AAS Tabular)                            
  • conoscenza dei sistemi di Business Intelligence di piattaforme non Microsoft (Tableau, SAP BO, Qlik Sense, …)                            
  • conoscenza avanzata dei linguaggi di programmazione (come Python, SQL, Scala, Java, R, MATLAB)                            
  • piattaforme di big data (come MongoDB, Oracle, Microsoft Azure, Cloudera)                            
  • tecniche di machine learning (natural language processing, classification, clustering, ensemble methods, deep learning)                            
  • estrazione di dati (data mining), pulizia dei dati (data cleaning) e manipolazione dei dati (data discovery, data wrangling/data munging)                            
  • competenze in strumenti e tecniche di data visualization (ad esempio, Tableau, SAS, D3.js, oltre alle librerie di Python, Java ed R)                            
  • competenze di Tuning: BI, DWH, ETL, ELT, Disaster Recovery, High Availability                            
  • conoscenza di almeno un sistema di Extract/Transfer/Load data (SSIS, Informatica, Talend, Datastage)

Principali certificazioni richieste dal mercato

Certificazione CompTIA Data+, Certificazione di analista di dati Cloudera Certified Associate (CCA),  Certificato Microsoft: Data Analyst Associate, Associato certificato Microsoft Azure Data Scientist, Programma di analisi dei dati di CareerFoundry, Certificato IBM Data Science Professional, SAS Certified Advanced Analytics Professional che utilizza SAS 9, Programma di certificazione online di Wharton Business Analytics, Certificato di analisi dei dati di BrainStation