Mick Levy, auteur de Sortez vos données du frigo, développe une vision à 360° pour vous faire entrer de plain-pied dans la révolution des données et de l’IA.
Pourquoi avoir écrit ce livre ?
Voilà 20 ans que je conseille et accompagne les entreprises dans la valorisation de leurs données. Cette expérience, nourrie par des projets dans des organisations de multiples secteurs d’activité, m’a donné la conviction que les données sont un actif totalement sous-exploité. C’est même certainement l’actif le moins exploité de toute l’entreprise. Pourtant, toutes en stockent ! Mais peu ont conscience de leur valeur et de leur potentiel.
A l’inverse, les scandales planétaires de la NSA ou de Facebook/Cambridge Analytica et les multiples dérives d’usages débridés de l’intelligence artificielle (iA) révèlent les dangers d’une exploitation débridée des données.
Alors, il faut faire la synthèse de ces deux constats. Et c’est pourquoi je milite auprès des entreprises pour qu’elles aient une exploitation intensive et responsable des données. Je le faisais déjà par le biais de conférences ou d’articles de blog, mais j’ai eu envie d’aller plus loin, et la rédaction de ce livre m’est apparue évidente.
La Data, l’or noir du 21e siècle ?
Il y a effectivement, une valeur énorme à tirer de l’exploitation des données, en particulier avec l’iA. Amélioration de l’efficacité opérationnelle, transformation de l’expérience clients, maîtrise des risques, ou encore innovation sont autant de familles d’usages possibles. De ces quatre familles dérivent des milliers d’applications et opportunités. J’en ai d’ailleurs dressé un catalogue de 101 et détaillé 10 cas d’entreprises dans le livre. Bref, il y a de la valeur pour les organisations de tous les secteurs d’activité !
Si les données sont une matière première à valoriser, pourquoi sont-elles si peu exploitées ?
Mais l'exploitation des données à l’échelle de l’organisation est une discipline exigeante. En plus des enjeux techniques, elle fait appel à de nouvelles compétences, entraîne une nouvelle organisation du travail, nécessite la mise en œuvre d’une gouvernance dédiée et impose une approche spécifique pour la protection des données personnelles et l’éthique. C’est cela qui explique d’ailleurs le développement des nouveaux métiers de la data. Data Scientist, mais aussi Data Analyst, Data Steward, Data Engineer, Data Protection Officer… autant de professions très récentes appelées à fortement se développer dans les années qui viennent pour permettre une exploitation efficace des données.
Au final, je crois que la raison principale de la sous-exploitation des données par les entreprises est le manque de compréhension de cette matière et de ses opportunités. Ainsi, les données sont peu exploitées car beaucoup d’entreprises n’ont simplement pas pris conscience de la valeur qu’elles peuvent en extraire. Elles n’appréhendent pas encore la data comme un actif à part entière et ne perçoivent pas qu’il faut déployer les mêmes moyens que pour les autres actifs de l’entreprise.
Qu’est-ce qu’une entreprise Data-centric ?
Pour répondre simplement, une entreprise data-centric est une entreprise qui place les données au cœur de son fonctionnement. Ses décisions sont alors prises en étant éclairées et objectivées par les données qui irriguent les différents départements de l’entreprise. Ceux-ci les exploitent pour leurs propres besoins mais aussi pour créer de nouveaux produits et services à forte valeur ajoutée. Ainsi, les entreprises data-centric exploitent les données non seulement pour leur pilotage (le décisionnel avec ses indicateurs et tableaux de bord), mais aussi pour anticiper les situations à venir et se projeter vers l’action. C’est là que réside le plus de valeur, dans la prédiction et la projection sur le futur, et c’est ce qui explique l’engouement pour les technologies d’iA.
La libération des données ne représente pas seulement un enjeu technique. Pouvez-vous nous dire quels autres enjeux elle recouvre ?
Les entreprises data-centric ont compris que l’exploitation intensive et responsable des données et de l’iA exige un changement de culture et une véritable transformation. On ne peut pas devenir data-centric du jour au lendemain et le changement à opérer doit être conduit efficacement. Il faut tout d’abord prendre conscience que les données sont l’affaire de tous. Tant côté DSI que côté métier, tant pour les managers que pour les opérationnels, tant pour les décideurs des comités exécutifs que pour les opérateurs. Des actions d’acculturation sont à ainsi mener pour une large partie des collaborateurs. L’objectif est de faire prendre conscience que les données font partie intégrante du patrimoine vivant de l’entreprise. En plus de cette large acculturation, des actions de formation sont à réaliser pour les personnes qui interviennent directement sur les projets et dans les usages des données et de l’iA. Beaucoup d’entreprises font l’erreur de ne prévoir que des formations à dominante technique. Si le sujet peut sembler technologique de prime abord, l’enjeu est en fait business et vient questionner la culture et le fonctionnement quotidien de l’organisation.
Il existe un problème de confiance avec la data et l’IA qui sont des sujets fortement débattus. Comment garantir une utilisation éthique des données ?
Il est clair qu’il n’y aura pas d’exploitation durable et intensive des données sans une approche responsable de la part des entreprises ! Les pouvoirs que peuvent avoir certaines entreprises avec l’iA leur imposent de grandes responsabilités. La question est donc de parvenir à développer des algorithmes dignes de confiance.
Ce large sujet de la confiance revêt en fait trois dimensions.
La première est celle de l’éthique. Prenant source dans la philosophie, elle devient très concrète quand elle s’applique à l’iA. C’est ainsi l’éthique qui doit guider les entreprises dans leurs choix sur les usages appropriés. Elle va poser des questions essentielles, notamment face aux iA qu’on qualifie d’autonomes ou d’auto-apprenantes, c’est-à-dire qui réagissent automatiquement aux situations qui leur sont soumises.
La seconde dimension est celle de la protection des données personnelles. Encadré en Europe par le fameux Règlement Général sur la Protection des Données (RGPD), ce sujet constitue un socle pour la confiance, en fixant les principes et règles à appliquer pour protéger les données personnelles, et donc la vie privée des citoyens, consommateurs, clients ou collaborateurs.
La troisième dimension est imposée du fait du fonctionnement technique de l’iA, basé sur l’apprentissage machine (machine learning) et sur des approches complexes, regroupées sous le terme d’apprentissage profond (deep learning). Ces techniques impliquent des enjeux majeurs relatifs à l’équité, à la transparence des décisions et à la responsabilité des algorithmes. Mal utilisée, l’iA peut alors se transformer en machine à amplifier les inégalités, et ce, sans même pouvoir expliquer les raisons qui les ont conduites à cette mauvaise conduite !
Le sujet de la confiance est donc crucial pour le développement et l’acceptation dans les entreprises et dans la société des usages des données et de l’iA. C’est pourquoi je me suis attaché à proposer un plan composé de 10 actions concrètes pour établir des algorithmes dignes de confiance. Je qualifie mon livre de manifeste pour une exploitation intensive et responsable des données car il y a énormément de valeur à tirer de la data, mais elle ne sera pas durable sans l’instauration de son corolaire qui consiste à agir avec responsabilité et éthique.