Du moteur de recherche
Pendant près 30 ans, avocats et juristes ont eu pour habitude d’utiliser les moteurs de recherches des bases avec plusieurs techniques qui ont fait leurs preuves :
- dans un premier temps la recherche par mots-clés, principalement lexicale ;
- puis la recherche sémantique[1]. Il s’agit déjà d’un traitement du langage avec notamment la possibilité de faire de meilleures recherches en incluant la synonymie et la gestion de la polysémie ; alors que la recherche par mots-clés se contente de restituer des éléments correspondant aux termes recherchés, la recherche sémantique décrypte la véritable intention de la requête et établit des liens avec des concepts proches ;
- les opérateurs booléens et autres opérateurs de recherche : là aussi il y a beaucoup à dire sur la logique booléenne[2]; les opérateurs les plus connus sont ET, OU, SAUF (AND, OR, NOT) mais les moteurs de recherche contiennent d’autres opérateurs utiles comme les opérateurs de proximité, les parenthèses, les guillemets, la troncature, le caractère joker, etc..
- les filtres : permettent d’affiner les résultats par exemple en sélectionnant un type de source ou de contenu, une matière, une période précise, un auteur…
- bien sûr ce type de recherche s’est amélioré grâce à l’intelligence artificielle au fil des ans.
La recherche traditionnelle, si l’on peut l’appeler ainsi, combine donc une recherche par mots-clés, soit en mode simple (façon barre de recherche à la Google), soit en mode guidé, lorsqu’il s’agit de remplir un formulaire avec des suggestions d’opérateurs ou en mode expert avec un utilisateur qui peut alors rédiger des équations de recherche, en combinant les mots-clés entres eux et en les reliant par des opérateurs.
La réponse arrive sous forme de liste de résultats, classés par pertinence (ou par fraîcheur de l’information). Les sources citées pour une réponse peuvent être nombreuses; dans ce cas, pour les réduire, l’utilisateur utilise les filtres.[3]
Il faut souligner le rôle des documentalistes juridiques qui se sont toujours battus pour le maintien de la recherche experte chez les éditeurs (même avec un accès en tout petit un peu caché !) alors que la tentation était grande de ne conserver qu’une barre de recherche « à la Google ».
Vers le moteur de réponse
Depuis l’avènement de l’IAG, la recherche se trouve modifiée puisqu’il est désormais commun d’interroger la base en langage naturel. La réponse arrive rédigée, les sources utilisées pour construire cette réponse sont listées afin de les contrôler (et d’éviter les hallucinations). L’utilisateur dialogue avec la machine pour approfondir la recherche, la relancer ou explorer des thématiques auxquelles il/elle n’avait pas initialement pensé.
Il faut conserver les deux méthodes puisqu’elles n’ont pas le même usage. Elles se complètent et peuvent même se cumuler.
Le meilleur des deux mondes
La méthode de recherche traditionnelle permet de cibler un document précis, de retrouver une référence exacte, tandis que la méthode augmentée par l’IAG est une méthode pour rechercher faire un début de recherche panoramique sur un concept juridique ou pour challenger sa problématique.
En sommes nous voulons le meilleur des deux mondes !
Ce que nous attendons des éditeurs de bases de données juridiques ou des legaltechs c’est de trouver sur leur plateforme un bon équilibre entre recherche augmentée par l’IAG et recherche traditionnelle. Pouvoir faire une recherche en langage naturel sur un domaine juridique que l’on connaît mal pour une première idée des problématiques ou pour dégager des tendances (recherche de premier niveau), mais aussi pouvoir faire des recherches sur des références précises en jouant sur les opérateurs et les filtres ou avec des masques de saisie détaillés selon le type de source. Ainsi, si l’on possède des éléments d’information sur une jurisprudence, il est préférable d’utiliser un masque de recherche sur ce fonds plutôt que lancer une recherche thématique en espérant tomber dessus parmi les résultats.
De même, on peut avoir envie de déplier un sommaire ou un index alphabétique, de parcourir une arborescence de contenu encyclopédique, de parcourir une actualité juridique récente pas forcément dans son domaine d’intervention mais qui pourrait être utile dans un dossier (le principe de la sérendipité[4]).
Enfin nous attendons des éditeurs ou legaltechs qu’ils étudient les cas d’usage de leurs clients afin de concentrer leurs innovations vers ces cas d’usage.
Heureusement les documentalistes juridiques peuvent jouer utilement ce rôle de courroie de transmission entre les attentes des usagers et les projets de développements technologiques de l’éditeur.
Attention aussi aux risques d’erreurs dans la recherche ; auparavant l’utilisateur risquait de passer à côté d’une information faute d’employer les bons mots-clés, désormais il y a le risque de passer à côté d’une information à cause d’un prompt mal formulé et surtout les risques d’hallucination des plateformes, notamment sur les questions un peu trop complexes. Nous attendons avec impatience une IAG juridique entrainée pour savoir dire qu’elle ne sait pas lorsque c’est le cas. Toutes les questions juridiques n’ont pas forcément de réponse, le droit évolue très vite et tous les jours et enfin il n’existe pas une base miracle qui répond à tout sinon ça se saurait (consulter un maximum de sources reste la base de toute recherche sérieuse).
Des formations à prévoir
Pour s’approprier la nouvelle méthode de recherche augmentée par l’IAG, il faut également prévoir des formations dans l’art du prompt [5]car de la qualité du prompt dépendra la qualité de la réponse.
Plusieurs types de formation sont envisageables : des formations en externe, souvent elles sont prévues par l’éditeur au moment du déploiement de la solution ou des solutions en interne. Pour l’interne, les utilisateurs peuvent se réunir régulièrement pour partager leurs meilleurs prompts et leurs cas d’usage. Il est même possible d’envisager de mettre en place une bibliothèque de prompts[6].
Dans tous les cas, il convient de garder en tête qu’une même recherche peut connaître plusieurs phases et que les différentes méthodes de recherche sont complémentaires.
Quant aux résultats de la recherche, on peut espérer dans un futur proche une sorte de livrable composite composé de la règlementation, d’extraits de doctrine, de fiches pratiques et des jurisprudences utilisées dans le dossier, le tout compilé dans un document PDF avec un sommaire généré automatiquement, une cartographie de l’information si cela est utile à la compréhension, une synthèse juste et cohérente, le tout facilement partageable (dans le respect des droits d’auteurs bien sûr).
Enfin, gardons en tête que l’IAG évolue très vite, contrairement à la recherche traditionnelle qui est stable, il n’est donc pas exclu qu’un jour la première absorbe entièrement la deuxième. A moins que le changement majeur, vienne de l’intégration de mécanismes de raisonnement au cœur de l’IA pour une recherche autonome et contextualisée.
[1] Voir le principe de l’indexation sémantique sur Wikipédia https://fr.wikipedia.org/wiki/Analyse_s%C3%A9mantique_latente
[2] Voir le principe de l’algèbre de Bool sur Wikipédia https://fr.wikipedia.org/wiki/Alg%C3%A8bre_de_Boole_(logique)
[3] Sur l’évolution des méthodes de recherche voir : https://www.serendipidoc.fr/levolution-des-methodes-de-recherche/
[4] Sur le concept de sérendipité, voir https://www.serendipidoc.fr/le-concept-de-serendipite/
[5] Sur l’art du prompt : https://www.serendipidoc.fr/lart-du-prompt/
[6] Sur les bibliothèques de prompts : https://www.serendipidoc.fr/prompt-librairies-constituer-une-bibliotheque-de-prompts/