Une étude menée par le cabinet Forrester sur le cycle des technologies et usages Big Data selon la méthodologie TechRadar™.
L’étude est menée sur des technologies en les caractérisant au travers de 4 phases : création, survie, croissance, équilibre et déclin.
Forrester constate que la majorité des technologies Big Data est en phase de croissance : les 8 usages ci-dessous sont ceux les plus susceptibles de créer de la valeur ajoutée pour les entreprises.
La méthodologie TechRadar de Forrester évalue le succès potentiel de chaque technologie qui est également positionnée sur une phase de maturité spécifique.
Analyse prédictive
Solutions logicielles et/ou matérielles qui permettent aux entreprises de découvrir, évaluer, optimiser et déployer des modèles prédictifs en analysant les sources de données pour améliorer les performances de grandes entreprises ou d’atténuer les risques.
Bases de données NoSQL
NoSQL (Not Only SQL) ne vient pas remplacer les BD relationnelles mais proposer une alternative ou compléter les fonctionnalités des Systèmes de Gestion de Bases de Données Relationnelles dans l’objectif de fournir des solutions plus pertinentes dans certaines situations.
Search and Knowledge discovery
Outils et technologies permettant l’extraction de l’information et des données non structurées et structurées à partir de multiples sources telles que des systèmes de fichiers, des bases de données, des flux, des API, et d’autres plates-formes et applications.
Stream Analytics – Analyse de données en temps réel
Un logiciel qui permet de filtrer, d’agréger, d’enrichir et d’analyser un débit élevé de données provenant de multiples sources de données disparates en direct et en tout format de données.
In-memory data fabric
Cette technologie permet d’accéder et de traiter à faible latence de grandes quantités de données en distribuant les données sur la mémoire DRAM, Flash ou SSD d’un système informatique distribué.
Systèmes de fichiers distribués
Un réseau informatique où les données sont stockées sur plusieurs nœuds, souvent d’une manière répliquée, pour satisfaire des problématiques de redondance et de performance.
Virtualisation des données
Une technologie qui fournit des informations provenant de diverses sources de données, y compris les sources de données volumineuses tels que Hadoop et les flux de données distribuées en temps réel ou quasi réel.
Intégration des données
L’ensemble des outils pour l’orchestration des données à travers des solutions telles que Amazon Elastic MapReduce (EMR), Apache Hive, Pig Apache, Spark Apache, MapReduce, Couchbase, Hadoop et MongoDB.
Le Big Data en école d’ingénieurs
L’ESILV propose une majeure de son cursus ingénieur dédiée au Big Data, à minformatique et aux objects connectés, avec des enseignements répartis sur deux ans.
Une option de dernière année est également disponible, abordant plus en détails les problématiques techniques liées au Big Data au travers de deux principaux modules « ecosystème big data » et « fouille de données ».
Un Mastère Spécialisé « Assurance, Actuariat et Big Data », une formation labellisée par la Conférence des Grandes Ecoles, est également proposé à l’ESILV.
Enfin, de nombreux stages, projets t travaux de recherche sont conduits chaque année par les étudiants et enseignants chercheurs autour des problématiques du Big Data.