in

Data leaders : pourquoi capitaliser dès aujourd’hui sur le “smart” data catalog Zeenea ?

Machine Learning Data Catalog (MLDC) : c’est bien mais pas suffisant !

C’est avéré, les données sont un atout, aucun secteur n’y échappe. Si l’expression est un peu cliché, elle se traduit par une appropriation et une capacité d’analyse variable de la donnée d’une entreprise et même d’un utilisateur à l’autre. Les data Catalogs sont à ce titre devenus une solution incontournable pour les responsables data en première ligne comme pour les usagers divers et variés qui en tirent une valeur stratégique au quotidien. Qu’on les appelle data champions ou data leaders, ils jouent un rôle décisif dans la diffusion d’une stratégie data efficace visant à convertir les usagers avec la donnée et à l’utiliser : en toute confiance, à bon escient, en toute sécurité et confidentialité. Tout l’enjeu pour les organisations est donc de se doter de solutions de data catalog qui leur ressemble pour mieux trouver, inventorier et analyser des données très diverses et très distribuées. Si l’opération relève du jeu d’enfant pour les géants du web – les « Big Five » (Google, Apple, Facebook, Amazon, Microsoft) et autres acteurs data-driven par essence – le défi des entreprises plus ou moins matures sur le sujet est d’emmener tous leurs collaborateurs dans cette aventure captivante de la donnée. Elles peuvent alors compter sur le “smart data catalog”, dont l’intelligence se traduit tant dans ses fonctionnalités Machine Learning que dans ses usages. Pour Zeenea, dont les solutions de data catalog sont 100 % Cloud, être smart ne se résume cependant pas à des fonctionnalités de Machine Learning !

Qui dit “données”, dit être capable de les comprendre et d’y accéder

Idéalement, il devrait y avoir un endroit qui répertorie toutes les applications, quelles données sont stockées dans quelles applications et comment elles sont toutes reliées entre elles, à l’image d’une carte interactive des données d’entreprise.

Sur le terrain, le double défi auxquelles les entreprises sont confrontées consiste à gérer une multitude de sources de données, elles-mêmes généralement orchestrées selon une logique de Cloud hybride imposant la prise en compte d’enjeux de gouvernance et de sécurité spécifiques.

C’est justement pour contourner ces freins que le « smart » data catalog Zeenea est notamment en phase avec les organisations opérant dans l’écosystème de l’Internet des objets et de l’edge computing où le flux de données en continu est en grande partie opéré en temps réel.

Le Machine Learning Data Catalog (MLDC) relève le défi de la gestion et de la gouvernance des données en permettant un suivi optimal de la lignée des données et en délivrant une analyse précise de la manière dont

elles sont consommées en interne. Selon Forrester Research, le MLDC est défini comme des catalogues de métadonnées propulsés au machine learning. Ils connectent de façon automatique les actifs de données pour en tirer de la valeur économique et commerciale en éliminant les inefficacités, les retards et les inexactitudes inhérents aux processus manuels et erreurs humaines de gestion et de gouvernance des métadonnées.

Smart data catalogs, un « must-have » pour les data leaders

Ce qui caractérise le ML data catalog Zeenea c’est sa flexibilité et son approche user centric. Dans la plateforme Zeenea, c’est l’outil qui s’adapte à l’entreprise et pas l’inverse, afin de stimuler l’innovation et favoriser une culture des données axée sur l’analyse à la portée de tous les collaborateurs. Quant à l’interface intelligente, elle se traduit notamment par les éléments différenciateurs suivants :

Un design façonné selon une approche simplifiée de classification de l’information (knowledge graph/graphique de connaissance), source de gain de temps, de recherche optimisée et d’une meilleur compréhension pour ses utilisateurs du lien entre les différents actifs du data catalog. Cette configuration permet à l’interface d’évoluer au rythme des besoins et de la digitalisation de l’entreprise afin que le data catalog puisse, dans le temps, prendre en charge de nouvelles évolutions data et de nouveaux cas d’utilisation.

Une expérience utilisateur adaptative pour que les utilisateurs puissent se l’approprier, le maintenir et le comprendre, qu’ils s’agissent de profils expérimentés ou non. Un data scientist s’attend à des informations statistiques, tandis qu’un responsable de la conformité s’attend à des informations sur diverses politiques réglementaires. Le data catalog est paramétré pour présenter les informations les plus pertinentes à chacun des suffisamment simple à gérer utilisateurs finaux.

Un système d’inventaire intelligent connecté (Big Data, noSQL, Cloud, Data Warehouse, etc.) pour synchroniser en temps réel le contenu du data catalog avec celui des systèmes opérationnels de ses utilisateurs. Lorsque les utilisateurs consultent le catalogue de données et découvrent qu’il ne dispose pas d’une liste actualisée des actifs de données, ils s’en méfient et finissent par s’en détourner. Contreproductif, le catalogue de données est alors moins utilisé, est mis à jour avec moins de précision et devient encore moins fiable, un cercle vicieux à éviter. A ce titre, Zeenea propose une couche d’automatisation pour ramener les bonnes informations des systèmes au catalogue.

Le centre névralgique du data catalog est son moteur de recherche. connecté (Big Data, noSQL, Cloud, Data Warehouse, etc.) pour synchroniser en temps réel le contenu du data catalog avec celui des systèmes opérationnels de ses utilisateurs. Lorsque les utilisateurs consultent le catalogue de données et découvrent qu’il ne dispose pas d’une liste actualisée des actifs de données, ils s’en méfient et finissent par s’en détourner. Contreproductif, le catalogue de données est alors moins utilisé, est mis à jour avec moins de précision et devient encore moins fiable, un cercle vicieux à éviter. A ce titre, Zeenea propose

L’intelligence du MLDC Zeenea réside dans sa capacité à appréhender de manière holistique la recherche à haute et à faible intention. Il fournit des réponses efficaces dans le cas de requêtes précises mais aussi dans les situations où l’utilisateur n’est pas exactement sûr de ce qu’il cherche.

La gestion intelligente des métadonnées (aussi appelée « data catalog augmenté ») qui possède des capacités de Machine Learning permettant de détecter certains types de données, d’ajouter des tags ou des règles statistiques sur les données aide également les data stewards à mieux paramétrer leurs métadonnées. Suivant des principes analogues au système de tracking publicitaire, lorsque l’utilisateur a trouvé quelque chose, le catalogue lui propose des alternatives basées à la fois sur son profil et sur la reconnaissance de schémas similaires.

Bénéfices du Machine Learning Data Catalog

Dans une économie numérique où de nombreuses entreprises traversent différentes phases de transformation, la gestion des données en tant qu’actif stratégique devient essentielle, L’adoption d’un “smart” data catalog permet aux entreprises qui s’en emparent de devenir à la fois plus compétitives et plus résilientes, à la clé :

  • Une démocratisation des données accélérée : la gestion des métadonnées devient plus agile avec des références et des modèles contextuels rendant les données prêtes et fiables pour de futures activations
  • Un meilleur contrôle de la gestion et de la gouvernance des données : les entreprises peuvent tirer profit des MLDC en opérant un alignement opérationnel entre les opérations de données, leur gouvernance, leur approche analytique et les consommateurs de données pour activer ces dernières de manière plus efficace
  • Une meilleure compréhension de l’utilisation des données et du comportement à adopter en matière de sécurité ;
  • Un levier d’innovation accru (nouveaux produits/services)
  • La capacité d’automatiser un nombre important de tâches liées au développement, à l’administration et à la gouvernance des données qui contribue à repositionner leur valeur ajoutée dans l’entreprise;

La gestion des données et la gouvernance sont aujourd’hui une préoccupation importante et croissante pour les organisations. MLDC fournit une solution permettant aux utilisateurs de classer, d’accéder, d’interpréter et de collaborer autour de données provenant de multiples sources. En plus d’améliorer la facilité de découverte et l’accessibilité, elle les aide à se conformer à de nombreuses nouvelles réglementations sur les données.

Morgane
Morgane Palomo

Diplômée d'un master un brand management marketing, sa curiosité et sa soif de savoir ne sont étanchées. De nature créative, elle a su diversifier ses expériences. De la création graphique, à l'événementiel en passant par la communication interne et le marketing digital, elle s’est construit un savoir pluriel et avant tout polyvalent.

Written by Morgane Palomo

Diplômée d'un master un brand management marketing, sa curiosité et sa soif de savoir ne sont étanchées. De nature créative, elle a su diversifier ses expériences. De la création graphique, à l'événementiel en passant par la communication interne et le marketing digital, elle s’est construit un savoir pluriel et avant tout polyvalent.