Pour que cela ne devienne pas un sacerdoce, il existe un processus et une pratique à mettre en œuvre. Sachons adapter notre gouvernance aux usages des collaborateurs pour garantir l’exploitation de la donnée en toute confiance.
Avec la prolifération des données recueillies ou produites en entreprise, stockées dans les bases de données décisionnelles, les applications ou le cloud, l’on s’aperçoit que les opportunités d’analyses mais également les besoins de traitement émis par les métiers et les organisations ne font que croître. Alors que les utilisateurs réclament toujours plus d’autonomie dans l’exploration et l’usage de la data, un conflit entre les attentes et les questions cruciales de gouvernance se dessine.
D’un côté, une forte volonté de renforcer ses qualités data driven et de se différencier, des espoirs d’innovation qui reposent tout à la fois sur les analyses à créer et les atouts de l’intelligence artificielle. Et de l’autre, une réalité, contrainte principalement par les réglementations, quelque peu différente des demandes, voire des exigences des utilisateurs.
L’information et la donnée deviennent des enjeux géopolitiques, réglementés par des États soucieux de garder le contrôle dans un monde numérique en évolution permanente. Au cœur du cyclone réglementaire, les entreprises, parfois paralysées, oscillent entre respect des textes et opportunités business et doivent gérer une tension grandissante au sein de leurs services.
Pourtant, il n’y a pas lieu d’alimenter un quelconque conflit. Au contraire, marier gouvernance et exploitation de la donnée permet à la fois de s’assurer de sa conformité réglementaire et d’une exploitation utile de son information disponible. Comment ? En adaptant correctement son modèle de gouvernance d’une part aux données dont on est dépositaire et d’autre part aux utilisateurs.
Mais qu’est-ce qu’est exactement la gouvernance de la donnée ? C’est un processus constant, évolutif et quantifiable, qui vise à déterminer avec précision quelles données bénéficient de quel niveau de gouvernance et de certification pour un usage défini dans un contexte particulier.
Voici pour une définition, laquelle laisse entrapercevoir la démarche à entreprendre. L’entreprise pilotant ses objectifs à l’aune de ses données devra immanquablement s’intéresser de près à ses utilisateurs. Certains, peu formés, sont essentiellement des consommateurs d’information. D’autres, plus autonomes et plus au fait des usages acceptables de la data, disposeront de plus de latitude.
On le comprend aisément, le niveau d’autonomie et de gouvernance sont complémentaires et inversement proportionnels. Ainsi, toute donnée exposée à des tiers via le site internet ou une API est gérée sous le niveau de gouvernance le plus élevé, puisqu’on ne peut supposer a priori que ces tiers sauront convenablement traiter l’information. A l’inverse, en interne par exemple, les données propres à un même département et non destinées à quitter le périmètre, ne relèvent pas, a priori, de règle de gouvernance particulière.
Sous l’égide d’un Chief Data Officer, en charge de la vision et de la stratégie Data de l’entreprise, se réunissent ainsi tous ceux et celles qui ont des attentes et des rôles fort différents, afin de mettre sur pied un modèle de gouvernance adaptable à l’usage applicable. Il ne s’agit pas, évidemment, de décider d’une gouvernance globale, couvrant l’ensemble de l’information détenue, par précaution. C’est une approche collaborative et itérative qu’il faut privilégier, en adaptant le niveau de gouvernance aux usages et aux compétences de chacun au fil de la production et du temps.
La démarche fait émerger un processus qui permet à chacun de contribuer à la découverte des données susceptibles d’être gouvernées et d’effectuer un tri en fonction des réglementations.
Ce n’est qu’ensuite et autour de ce processus que s’inscrit la pratique supportée par la technologie. Dans ce cadre, on recommande généralement de laisser les utilisateurs accéder à l’ensemble de l’information, afin qu’ils débutent leurs analyses et créent leurs premiers rapports. Le monitoring de l’usage de la donnée permet alors d’identifier celles sujettes à gouvernance, puis à certification quand elles ont été complétées. Un monitoring réussi est un monitoring alimenté par une cartographie des données, des usages et des sources. De ce fait, cette collecte des usages de la donnée dans l’entreprise permet d’enrichir considérablement l’offre de services. Il devient possible par exemple de faire de la recommandation de données certifiées, à l’instar des sites marchands recommandant des produits en fonction des pages visitées. La proposition évite en outre aux utilisateurs, avertis, de réinventer sans cesse la roue.
Le grand intérêt de la pratique est sa déclinaison en self-service des données certifiées pour les consommateurs d’information, les données non certifiées étant réservées aux utilisateurs plus aguerris. Progressivement, la pratique de la gouvernance s’étoffe de niveaux. Local pour des analystes, départemental et réservé à un petit nombre, d’entreprise pour des données susceptibles d’être partagées par tous voire avec des tiers.
A ce jour, beaucoup d’entreprises, notamment nord-américaines et ouest-européennes, ont déjà réalisé une part importante de ce travail de gouvernance et disposent donc d’un important capital de données gouvernées. Mais l’affluence des données de capteurs et de celles issues du click stream pour ne citer qu’elles contribuent à étendre le champ d’analyse, à dépasser la gouvernance traditionnelle et à faire preuve de créativité. C’est pourquoi la data-stratégie choisie doit éviter la rigidité de ses règles. Par ailleurs, en avançant pas à pas, le processus permet de juguler l’aspect parfois titanesque de la tâche.
Enfin, évitons de contraindre les utilisateurs, c’est une méthode qui n’a jamais fait ses preuves. Le paysage technologique des entreprises s’est beaucoup diversifié et bien souvent les outils d’analyse sont choisis par les métiers eux-mêmes. Tant qu’une donnée est dûment certifiée, il est tout à fait possible de la mettre à disposition, de la promouvoir et de l’exploiter sur une solution tierce.