Surmonter la paralysie des données lors de la préparation à l’intégration de l’IA
4 Février 2019
4 Février 2019
Tout projet d’IA est alimenté par les données. Elles n’ont pas besoin d’être parfaites, mais elles doivent afficher une qualité et une uniformité suffisantes pour être en mesure de faire ressortir des modèles récurrents. Toutefois, de nombreuses entreprises sont submergées par le volume, la vitesse et la variété de leurs données, et ont donc de la difficulté à récolter le dernier des quatre « V » : la valeur. Comment devrions-nous considérer les stratégies de préparation des données, si nous voulons éviter une éventuelle paralysie – ou un excès d’ambition – dans vos projets d’IA?
Meilleures sont les données, plus l’IA livrera la marchandise. Mais pour beaucoup d’organisations, un problème demeure : 85 % de leurs données sont soit cachées (dont la valeur est inconnue), redondantes, obsolètes ou insignifiantes..
Il n’est pas toujours facile de déterminer où se trouve la valeur, mais pour pouvoir au moins contempler l’ensemble du paysage, les données doivent être nettoyées et intégrées dans vos activités. On parle ici de données correctement structurées et formatées, qui permettent de créer la base d’entraînement requise pour vos modèles d’IA.
Le travail de restructuration des données n’est peut-être pas très compliqué, mais il est pesant. Les numéros de téléphone, par exemple, doivent être formatés de façon uniforme, avec les espaces toujours aux mêmes endroits. Un autre cas? Pensez aux adresses postales : si une personne indique « New York » comme étant sa ville de résidence, mais qu’une autre inscrit « New-York », et une troisième « NYC », les modèles d’IA considéreront comme distinctes ces trois localisations, à moins d’avoir été « formés » pour les assimiler à une seule.
Les dirigeants savent que leur compétitivité dépend de leur utilisation des données, mais ils savent aussi combien la tâche de nettoyage de ces dernières est monumentale. Non seulement cette corvée est coûteuse et chronophage, mais dans bien des cas, leurs responsables ne sauront pas par où commencer et resteront paralysés.
Confier ce travail pénible aux experts en données n’est pas toujours la meilleure solution. Lorsque ces effectifs inestimables se retrouvent pris avec ce fardeau, ils se retrouvent alors souvent piégés dans un véritable « donjon numérique », au détriment de leurs responsabilités d’analyse – autrement plus cruciales – qui permettent de trouver et exploiter des solutions transformatrices, de créer de nouvelles expériences clients et plus encore.
Confier ce travail pénible aux experts en données n’est pas toujours la meilleure solution. Lorsque ces effectifs inestimables se retrouvent pris avec ce fardeau, ils se retrouvent alors souvent piégés dans un véritable « donjon numérique ».
Pour retirer le maximum de bénéfices des données et entraîner une transformation profitable, les entreprises voudront éviter cette paralysie et trouver la voie qui fera progresser leur programme d’IA. Toutefois, les entreprises doivent également tenir compte des risques associés à une stratégie trop ambitieuse, qui peut être tout aussi dommageable que la corvée de données; considérez l’exemple ci-dessous :
Les entreprises doivent également tenir compte des risques associés à une stratégie trop ambitieuse, qui peut être tout aussi dommageable que la paralysie des données.
Je conseille d’évaluer ce qui doit être fait avec vos données dans une perspective globale, pour ensuite isoler un aspect restreint, mais prioritaire pour l’organisation. Il constituera un point de départ capital et ciblé, qui permettra d’instaurer un élan porteur et reproductible capable de faire boule de neige à l’échelle de l’entreprise.
On pourra commencer par choisir, par exemple, 10 points sensibles où une amélioration est nécessaire, ensuite les classer et se concentrer uniquement sur les deux premiers – pour découvrir qu’on peut ainsi réaliser une amélioration substantielle par rapport à une mesure clé. Trouvez un tel point sensible dans votre entreprise et sortez votre loupe avant de passer aux suivants. Cette façon de procéder vous permet de concrétiser des succès tangibles en matière d’IA, gagner la confiance des parties prenantes et établir des méthodes qui pourront être reproduites et déployées.