Soufiane Rital est Data Scientist chez Dassault Systemes. Dans le cadre du partenariat avec l’École d’Ingénieurs ESILV, il est intervenu afin de présenter aux futurs ingénieurs, 3 métiers liés à la Data, des profils recherchés au sein des organisations.
Dassault Systemes, « The 3DExperience Company », est le premier éditeur de logiciels français, et propose aux entreprises et aux particuliers des logiciels spécialisés dans la conception 3D.
A l’occasion de la collaboration avec l’ESILV, Dassault Systemes participe aux forums entreprises et forums d’alternance, intervient à l’occasion de conférences d’experts pour les 4e et 5e année, se positionne sur des conférences métiers pour les 4e année ou encore participe aux tables rondes dans le choix des majeures des futurs ingénieurs de l’ESILV.
La conférence de présentation des métiers du Big Data a bénéficié aux élèves-ingénieurs de la majeure Informatique, big data et objets connectés.
En qualité d’expert, M. Rital évoque la « Data Double face » celle qui va permettre d’un côté de créer et d’améliorer les services et de l’autre de surveiller ceux-ci. La problématique de la donnée est en effet de faire parler celle-ci, de lui conférer une réelle valeur.
Dans le but de stocker, d’analyser et de faire parler la donnée, ce sont 3 métiers vers lesquels les ingénieurs peuvent se tourner : le data ingénieur, le data scientist et l’ingénieur data vizualisation. Les 3 métiers se doivent impérativement de maîtriser la programmation et la complexité algorithmique.
Les métiers du Big Data
https://www.youtube.com/watch?v=4eplsExToH0
Data Ingénieur
Le Data Ingénieur est celui qui va se charger de récupérer les données en Open Data, Open API ou encore Open IOT . Il doit maîtriser le workflow des données de l’entreprise et connaître les différents métiers de l’entreprise.
En deuxième lieu, l’ingénieur doit savoir maitriser le web scraping, l’extraction du contenu de sites web, le crawling, logiciels automatiques ou robots qui vont permettre le scraping. Les futurs data ingénieurs doivent maîtriser des langages de programmation, au moins Python voire Java ou C++.
Côté « stockage de données » il faut maîtriser les bases de données relationnelles avec NewSQL et NoSQL.
Data Scientist
80% du travail du Data Scientist est de travailler sur les data collectées par le data ingénieur et de nettoyer les données récupérées. Il doit faire parler ces données par des classifieurs.
Le Data Scientist doit également maîtriser les différents aspects de la data au sein de l’entreprise, de la récupération des données et les langages de programmation Python, Java et C++.
Afin de réellement pouvoir produire une analyse de ces données une fois récupérées, l’ingénieur data scientist doit être compétent en statistiques descriptives et inférentielles mais aussi en graphes et algorithmes pour extraire l’information des données brutes.
Ingénieur Data Viz
L’ingénieur Data Viz ou Data Vizualisation a pour objectif la mise en forme des données récoltées, extraites puis traitées.
Responsable de la partie visualisation des données, il doit se doter, en plus des connaissances des data collectées au sein de l’entreprise et des outils de programmation, d’outils de visualisation comme AngularJs, D3-js, HighCharts ou encore Graphviz.
En ce qui concerne la programmation, avec Python, Java et C++ le Data viz ingénieur doit connaître le langage Javascript car la valorisation de la donnée passe le plus souvent par des plateformes web, où ce langage règne en maitre pour le design d’interface.