Quel lien entre l’IA, la gestion de l’information et les données ?
L’intelligence artificielle, la gestion de l’information, et les données structurées et non structurées avec M-Files
L’intelligence artificielle, la gestion de l’information, et les données structurées et non structurées avec M-Files
L’intelligence artificielle (IA) transforme chaque jour la gestion de l’information, les innovations allant de plus en plus vite. Nous nous sommes entretenus avec Ville Somppi, Vice President Industry Solutions chez M-Files, sur ces évolutions, pour comprendre ce qu’elles signifient pour les collaborateurs, comment l’IA va aider les organisations à gérer la différence entre les données structurées et non structurées.
L’Intelligence Artificielle (IA) et l’avenir du travail
Certains leaders pensent que l’IA va supprimer des postes. Quel sera selon vous l’impact de l’IA sur l’avenir du travail ?
En fait, l'IA renforcera l'ingéniosité et la créativité de l'homme. Les ordinateurs font ce que vous leur demandez. Si vous posez la bonne question, l'IA connaîtra la réponse. Dans le cas de l'IA générative, le résultat est peut-être correct à moitié, voire à 90%, si vous avez une idée de ce qu'il faut produire. L'IA offrira de nouvelles opportunités aux collaborateurs grâce à l’automatisation de la gestion de l’information (knowledge work automation).
Spontanément, l’IA ne sait pas ce qu’il faut créer. Une personne, un intervenant intelligent, doit lui demander quoi faire et ensuite valider que le contenu produit est conforme à ce qui a été demandé. La partie la plus lente d’un travail de création, celle des essais à partir d'une idée originale, sera accélérée, mais l'IA ne remplacera pas la vision du collaborateur, ni l’utilisation de sa créativité pour la mettre en forme.
Le chemin vers l’automatisation de la gestion de l’information (Knowledge Work Automation)
Lorsque l'on parle d'optimisation des performances au travail, il est généralement question de gestion des fichiers et des processus, ce qui nous fait entrer dans la phase suivante de l'automatisation. Cette évolution résulte-t-elle de l'amélioration de la bande passante et de l’accélération des processus, en-a-t-on toujours rêvé ou est-ce nouveau ?
On en a toujours rêvé, mais le processus a été long. L’histoire de l’informatique n’a que 50 ou 60 ans. Les premiers ordinateurs étaient tout juste capables de stocker des données. Ensuite, sont arrivées les interfaces graphiques, et nous avons trouvé le moyen de visualiser l’information sur un écran – et non plus simplement imprimée sur du papier. L’interface graphique fait que l’utilisateur n’a plus besoin d’être un scientifique pour comprendre ce que fait un ordinateur, mais des tâches importantes telles que la gestion documentaire (GED), la gestion de contenu (ECM) et la gestion des workflows restaient encore totalement manuelles.
L'idée a toujours été d’automatiser la gestion de l’information et d’utiliser l’innovation pour rendre le travail plus facile – pour améliorer la productivité. Demander à un ordinateur une opération a toujours nécessité le langage parlé ou écrit. Des décennies plus tôt, les ordinateurs pouvaient effectuer des calculs ou des simulations très puissants pour aider à concevoir quelque chose d'aussi complexe qu'une mission sur Mars. Demain, vous pourrez dire : "Hé, ChatGPT, peux-tu concevoir un atterrisseur pour Mars sur la base de cet exemple ?". Au lieu de passer des milliers d'heures à utiliser une souris et un clavier pour dessiner le plan en 3D, il est beaucoup plus rapide d'arriver à une ébauche de conception réalisable à affiner. Il n'est pas nécessaire de tout expliquer littéralement : c'est la révolution.
Données structurées versus données non structurées
De nombreux logiciels que nous utilisons aujourd’hui, de la gestion de fichiers à la gestion des processus, utilisent des données structurées, comme des fichiers Word et PowerPoint. Mais les tweets peuvent être légalement découverts par les tribunaux et sont donc considérés comme des données non structurées. En matière de gestion de l’information et de gestion documentaire (GED), y-a-t-il vraiment une différence entre les données structurées et les données non structurées ou cette différence s’est-elle complètement estompée ?
Traditionnellement, les ordinateurs ont besoin d’une structure pour comprendre les données. Supposons que le nom de votre entreprise ne soit composée que de texte. Un système structuré, comme un outil de gestion de la relation client, peut lire le numéro d'identification correspondant au nom de votre entreprise ; il ne prendra en compte que l’identification et saura toujours quel numéro d'identification est associé à votre entreprise. Un ordinateur ne comprendra pas des données non structurées écrites par des humains, sans signification explicitement définie - ce n'est que du texte.
Avec les grands modèles de langage, la structure est moins importante car les ordinateurs peuvent traiter des données non structurées plus efficacement pour extraire le sens et tous les points de données intéressants. Supposons qu'un contrat soit valide et applicable en 2024. Si nous extrayons cette période sous forme de données structurées, l'ordinateur sait quand le contrat s'applique. Avec l'IA générative et son moteur d'inférence, vous pouvez demander ce que signifie un élément donné dans une ressource non structurée, et l'IA le comprend car elle peut lire et interpréter un contenu non structuré.
Il y a une différence entre les données structurées et les données non structurées. Les premières sont destinées à être lues et comprises par les ordinateurs, tandis que les secondes circulent librement - jusqu'à présent, les ordinateurs avaient du mal à les comprendre. Il est moins important aujourd'hui de tout avoir sous forme de données structurées, mais les données structurées sont toujours la façon dont les ordinateurs communiquent entre eux. Vous ne pouvez pas vraiment calculer la phrase "midi et quart / '12h15'", car un ordinateur ne voit par défaut que du texte. Un modèle de langage étendu peut convertir cette expression humaine en données structurées compréhensibles par l'ordinateur, ce qui permet d'effectuer des calculs normaux.
L'importance de l'intention informationnelle
Pourquoi les données structurées sont-elles plus faciles à comprendre pour les ordinateurs, et comment la plateforme M-Files prend-elle en compte les données non structurées ?
Avec des données structurées, vous n’avez pas que la valeur de la donnée, vous avez également son sens, son type, et l’intention informationnelle. Par exemple, un type de données est le nom de l’entreprise. Chaque logiciel utilisant ce point de donnée sait que cette désignation fait référence au nom de l’entreprise, ainsi qu’au type de donnée. Les données structurées aident les logiciels à différencier un champ texte et un champ chiffre. Et dans un champ chiffre, ce que signifie ce chiffre. Est-ce un montant ou un code postal ? Avec les données structurées, les ordinateurs savent de quoi vous parlez avec chaque élément d’information.
Si vous téléchargez un contrat dans M-Files, ce n'est qu'un document. Il n'est pas structuré, il a été créé par une personne, mais nous pouvons extraire des points de données intéressants sous forme de métadonnées structurées. Parce que M-Files peut renseigner les documents avec des métadonnées telles que la validité du contrat, nous pouvons transformer des parties de ces données non structurées en données structurées afin que les ordinateurs puissent les traiter pour appliquer des règles métier et permettre tous les types d'automatisation de la gestion de l’information.
L'IA générative a un coût
Le format des données a-t-il un impact sur le coût d’utilisation de l’IA générative ? Les données non structurées sont-elles plus chères à traiter, et les nouveaux modèles de langage ont-ils changé les choses ?
Utiliser l’IA générative peut être coûteux car l’ordinateur doit effectuer beaucoup de traitements pour comprendre le contenu, pour s’y retrouver dans le chaos organisationnel existant ou pour repérer la période de validité d’un contrat, contrairement à quelqu'un qui lirait simplement ces informations à partir des métadonnées. Si vous faites cela un million de fois, vous paierez probablement 50 000 euros à l'entreprise qui fournit le service d'IA générative, car son IA réalise des tâches complexes.
Mais vous pouvez le faire systématiquement à partir d'un champ de données structuré et à faible coût parce que c'est simple. Les grands modèles de langage ne sont que de gigantesques formules mathématiques alimentées par des réseaux neuronaux profonds. Vous saisissez une valeur d'entrée et la valeur de sortie apparaît. Mais le coût de cette opération mathématique est très élevé par rapport à ce que l'on pouvait faire il y a 50 ans.
L’élément coût est très important. Nous ne pouvons pas seulement remplacer toutes les anciennes technologies de l'information et utiliser l'intelligence artificielle et l'IA générative pour tout, parce que c'est environ un milliard de fois plus cher.
J'ai ici un smartphone qui a plus de puissance de calcul et plus de contrôle sur les technologies de l'information que tous les superordinateurs des années 1990. Les grands modèles de langage et les IA génératives qui comprennent le langage sont possibles parce que nous disposons d'une puissance de calcul beaucoup plus importante que par le passé - ce qui ne les rend pas bon marché, mais simplement possibles. Toute entreprise appliquant ces technologies doit procéder à une analyse coûts-avantages. Quand devrions-nous utiliser ces technologies nouvelles, cool et coûteuses, plutôt que des technologies informatiques moins chères, plus mécaniques et traditionnelles ?
Planifiez une démonstration dès maintenant !
Révolutionnez la manière dont les collaborateurs automatisent leurs processus, de la création et de la gestion des documents jusqu’à l'automatisation des workflows, en passant par la collaboration avec des interlocuteurs externes, la recherche d'information dans l’entreprise, la sécurité, la conformité et la piste d'audit.