Les tendances clés du Big Data
Dossier Data
Au sein d’un paysage Big Data en pleine effervescence, 2024 marque un point de bascule. Selon Xerfi, le marché de la donnée représentait en 2023 plus de 2,7 milliards d’euros en France. Par ailleurs, il devrait connaître une croissance de l’ordre de 4% d’ici 2026. Le traitement massif des données ne se contente plus de promesses : il draine ingénierie logicielle et matérielle dans des flux créatifs de valeur technologique et économique. Cloud, intelligence artificielle, data mesh, data pipelines ; Autant de termes autrefois abscons qui gagnent désormais en compréhensibilité et maturité. Mais la montée en régime de l’exploitation des données interroge également modèles organisationnels et enjeux sociétaux. Zoom sur les principales tendances attendues de la data en 2024.
Migration confirmée des datas dans le cloud
En premier lieu, on observe que la migration des données vers le cloud s’impose désormais comme une tendance dominante et structurelle du marché Big Data. De plus en plus d’organisations choisissent de stocker et de traiter leurs données via des solutions cloud, qu’il s’agisse d’Infrastructure as a Service (IaaS), Platform as a Service (PaaS) ou encore Software as a Service (SaaS).
Cet essor du cloud computing pour le Big Data présente de multiples avantages :
Élasticité des ressources,
Mutualisation des coûts d’infrastructure,
Simplicité opérationnelle,
Rapidité de mise en œuvre,
Etc.
D’après IDC, le marché mondial du Big Data basé sur le cloud devrait ainsi croître de plus de 30% par an dans les prochaines années.
Toutefois, rares sont les entreprises qui adoptent une stratégie 100% cloud en matière de données. On observe plutôt l’émergence d’architectures hybrides, mêlant cloud public, cloud privé et infrastructures on-premise. Cette cohabitation permet de tirer parti des atouts respectifs de chaque approche tout en répondant aux contraintes légales, budgétaires ou techniques propres à chaque organisation.
Qu’il s’agisse de cloud public ou d’architectures hybrides, la migration des données dans le cloud parachève donc la transformation numérique des directions métiers, DSI et data scientists, leur permettant de bâtir des stratégies data-centric agiles et innovantes.
L’impact (inévitable) de l’IA
2023 a été, sans conteste, l’année de l’IA. Depuis, cette dernière a pris une importance croissante dans les stratégies Big Data des entreprises. En effet, les algorithmes d'apprentissage automatique permettent d'exploiter des jeux de données massifs pour en extraire de la valeur, que ce soit à des fins de classification, de prédiction, de recommandation ou d'optimisation.
On observe ainsi un recours grandissant au machine learning et au deep learning pour traiter des workloads analytiques. Par exemple, la reconnaissance d'images, le traitement du langage naturel ou la détection d'anomalies sont autant de cas d'usage qui deviennent possibles grâce à l'IA. Ces technologies autorisent également l'analyse en temps réel de flux de données importants.
Pour autant, la mise en œuvre de projets d'IA de bout en bout reste complexe pour de nombreuses organisations. Elle nécessite non seulement des data scientists qualifiés mais également des jeux de données adaptés et bien documentés pour entraîner les algorithmes.
Quoi qu'il en soit, l'IA transforme en profondeur l'exploitation et la valorisation des big data. Couplée au cloud, elle permet désormais d'envisager des traitements sophistiqués pour des entreprises de toute taille et renforce le caractère stratégique des données.
L’essor du Data Mesh et des Data Products
Face à la multiplication des data lakes, data hubs et data warehouses ces dernières années, une approche alternative émerge progressivement : le Data Mesh. Celui-ci prône une architecture distribuée et axée produit pour la gestion des données à l'échelle de l'entreprise.
En pratique, le data mesh segmente les données en multiples data products indépendants, gérés par des équipes spécialisées comme de véritables produits. La décentralisation constitue souvent la clé du succès des projets et des architectures de données.
Chaque data product expose ses jeux de données via des APIs autonomes. Cette architecture décentralisée vise à accroître l’agilité des organisations sur leurs données et à responsabiliser les métiers, bien qu’un data lake demeure, la plupart du temps, indispensable.
En parallèle, l'histoire des data products prend une trajectoire propre. Il est possible de les développer pour faciliter gouvernance et partage des données, sans nécessairement adopter le data mesh. On assistera ainsi probablement en 2024 à la poursuite du développement du concept de data product, qui prend différentes formes selon les solutions, architectures et cas d'usage en place.
Stratégies commerciales data driven
Qu’en est-il de la data appliquée au marketing ? De plus en plus d’entreprises adoptent des stratégies commerciales et marketing centrées sur la data, ou « data-driven ». L’analyse fine des données clients, produits et canaux permet en effet d’apporter de la valeur tant en termes d’innovation que d’optimisation des opérations.
Ainsi, un fabricant peut par exemple s’appuyer sur les data analytics pour améliorer ses prévisions de ventes et adapter sa supply chain en conséquence. Un retailer peut quant à lui utiliser le machine learning sur ses données e-commerce pour affiner les recommandations faites à ses clients.
Au-delà de ces applications analytiques, la data modifie également en profondeur le marketing et la relation client. On observe ainsi l’émergence de stratégies « customer data platform » (CDP) qui visent à centraliser l’ensemble des données clients disponibles pour optimiser la personnalisation des messages et des offres sur tous les canaux.
Cela dit, le développement de telles stratégies data-driven soulève également des défis en matière de gouvernance. La conformité avec le RGPD notamment et la gestion éthique des données clients sont essentielles pour transformer la data en véritable avantage concurrentiel durable.
Vous cherchez une mission Big Data ?
Le défi de la gouvernance
Ici, cybersécurité et conformité réglementaire s’invitent au premier plan. Avec la recrudescence des cyberattaques par ransomware, le besoin de protection et de traçabilité des données sensibles est plus urgent que jamais. Dans le même temps, le RGPD et les contraintes légales forcent à une généalogie sans faille des traitements, matérialisée par le lineage.
Mais les aspects plus fonctionnels ne doivent pas être négligés. Catalogage exhaustif, observabilité des pipelines, orchestration des data flows : autant d’axes garants de la qualité et donc de la valeur des datas. Sans parler de la définition précise des rôles et responsabilités, primordiale dans un contexte de plus en plus décentralisé.
Le marché des DaaS en pleine expansion
Enfin, on assiste ces dernières années à une très forte croissance des offres de type « Data as a Service » (DaaS). Ce modèle consiste pour un fournisseur à proposer l'accès à des données brutes ou enrichies via une API ou une interface web.
Les cas d'usage se multiplient à mesure que les organisations prennent conscience de la valeur potentielle de leurs données. Certains commercialisent ainsi leurs datas propriétaires. D'autres monétisent des données agrégées ou des insights analytiques basés sur du Big Data.
Au-delà de la valorisation directe, le DaaS présente aussi des avantages en interne. Il facilite le partage des données au sein d'une entreprise selon le modèle du marché, en responsabilisant les métiers. On parle alors de « data marketplace ».
En conclusion
Plus que de simples promesses, le traitement et l'analyse des données sont ainsi devenus un fondement technologique et économique pour les organisations. Au carrefour de techniques en pleine maturité comme le cloud et l'IA, le Big Data trace la route des innovations de demain, qu'il s'agisse de cybersécurité prédictive, de jumeaux numériques ou encore d'assistants conversationnels. Parallèlement, les modèles économiques autour des données se développent rapidement.
Mais si le potentiel semble immense, la capacité des organisations à mettre en place une gouvernance à la hauteur des enjeux actuels reste un facteur déterminant pour transformer ces perspectives en réalité. En définitive, les données concentrent aujourd’hui tous les défis et toutes les promesses du monde numérique.
Romain Frutos, rédacteur passionné par l’IT et les nouvelles technologies.
Dossier Data
Dossier Data
Inscription à la newsletter
Si vous êtes passioné.e d'IT, vous allez adorer notre newsletter
Commentaire
Connectez-vous ou créez votre compte pour réagir à l’article.