Prédire avec justesse les besoins des consommateurs, anticiper de nouvelles tendances, détecter la probabilité d’une maladie avant même que celle-ci ne se déclare… Tout cela devient possible et même précis grâce à des spécialistes de la donnée numérique, en particulier les data scientists et les data engineers.
E-commerce, finance, banque-assurance, santé… Dans tous les domaines, la transformation digitale entraîne la collecte d’une quantité massive de données que les entreprises et les acteurs publics cherchent aujourd’hui à exploiter.
Si ces professionnels de la data science ont pour point commun la passion des chiffres et de l’informatique, leurs missions et compétences diffèrent. Explications.
Data scientist, l’explorateur-interprète des données
Les algorithmes de recommandation qui tournent derrière « les personnes que vous pourriez connaître » sur les réseaux sociaux, « les films ou séries que vous pourriez aimer » sur Netflix, les « produits que vous pourriez aussi acheter » sur Amazon et les autres sites d’E-Commerce ont été créés par des data scientists.
Leur rôle est d’analyser de multiples sources de données, d’en extraire de grandes tendances et d’élaborer des modèles prédictifs à partir des big data. Un data scientist doit maîtriser l’environnement informatique, les outils statistiques et les enjeux du secteur d’activité de l’entreprise.
En fouillant dans les données, il se transforme en détective pour mener l’enquête face à une question complexe et pouvoir ainsi conseiller l’entreprise en tant que consultant, grâce à une vision transverse. Il pourra également développer des algorithmes statistiques pour anticiper le comportement d’une variable, recommander des actions à effectuer ou catégoriser des données en fonction de leur degré de similarité. Cette dimension prédictive lui est spécifique et le distingue du métier de statisticien ou d’analyste des données. Il doit en outre mettre en place des tests et des contrôles pour vérifier l’exactitude de ses résultats.
Ce poste nécessite d’utiliser plusieurs outils d’analyse et implique un certain niveau d’expertise technique en programmation, statistiques, machine learning, génie logiciel, data vizualisation mais pas seulement : le data scientist a une vision d’ensemble et doit s’adapter aux demandes des différents clients.
C’est une position à hautes responsabilités qui demande non seulement de savoir coder mais aussi de rédiger des rapports et de communiquer avec les responsables d’une entreprise. Les esprits ouverts, logiques et créatifs peuvent s’épanouir dans ce métier qui exige de trouver des liens entre des données a priori déconnectées.
Data engineer, l’architecte de données exploitables
Moins connus que les data scientists, les data engineers ou ingénieurs de données sont pourtant un maillon essentiel du processus d’analyse de données. Ils interviennent en amont du scientifique des données, pour consolider et préparer “l’or noir des entreprises”. Leur objectif est d’assurer la qualité, la fiabilité et l’homogénéité des données afin que les data scientists puissent les faire parler pour créer de la valeur avec ce capital immatériel détenu par les entreprises.
Les data engineers sont ainsi responsables de la création et de la maintenance de l’environnement qui permet à presque toutes les autres fonctions du monde des données d’opérer. Par data engineering, on entend qu’ils sont responsables du développement, de la construction, de la maintenance et du test des architectures, telles que les bases de données et les systèmes de traitement. Ils sont les garants de la chaîne de production de la donnée et de son bon déroulement, de l’extraction de la donnée à sa visualisation.
Ce métier conjugue des compétences techniques, technologiques, scientifiques et business. Il nécessite de maîtriser les cadriciels (Hadoop, Spark, Hive, Storm, Pig, etc.) et les logiciels de base de données, ainsi que l’anglais technique pour une bonne prise en main des outils. En matière de soft skills, l’ingénieur de données doit avoir une bonne communication orale pour pouvoir présenter des rapports des analyses. Il possède également beaucoup de rigueur, de capacité d’analyse et de synthèse, d’écoute et de curiosité.
Des métiers d’avenir
Complémentaires, data engineers et data scientists travaillent ensemble pour faire parler les données et en tirer les enseignements permettant aux décideurs de prendre les meilleures décisions.
Portés par la diversité des formats de données du numérique et l’explosion du volume des données, ces deux métiers ont le vent en poupe. Inconnus il y a quelques années, ils viennent tout juste d’émerger et l’on prévoit leur explosion dans quelque temps, du fait de la croissance des besoins.
Il y a donc de nombreux postes à pourvoir. En raison d’une forte demande, les rémunérations des jeunes diplômés peuvent être parfois très alléchantes. Les data scientists comme les data engineers peuvent gagner, en début de carrière, entre 40 000 et 50 000 euros annuels, nettement au-dessus de la rémunération moyenne des ingénieurs en sortie d’école (environ 35 000 euros). Cette rémunération varie en fonction de la région et du secteur d’activité.