Cet article est une archive publiée à l'origine sur Medium, le
13.12.2023
Il est présenté ici à titre historique et peut ne pas refléter les dernières informations disponibles ou les pratiques actuelles.
13
·
12
·
2023

Ce que l'on retient de notre hackathon sur l'IA générative

Les 12 et 13 octobre dernier, une partie de l’équipe Contexte s’est enfermée dans la grande salle de réunion de nos bureaux parisiens, Athènes, pour manger des pizzas, faire des slides, du code, mais surtout pour trouver des applications concrètes de l’intelligence artificielle, utiles pour nous ou pour nos clients. Bref, on a organisé un hackathon. Retour sur cet évènement.

Démystifier l’IA en s’amusant

Quand, début 2023, nos oreilles bourdonnent du bruit de ChatGPT, qu’on lit partout que le métier de développeur ou de journaliste est mort, et que l’IA générative va bouleverser nos vies, on se dit qu’une bonne manière de démystifier ce sujet est d’y investir du temps collectivement. Et quoi de mieux que de se réunir pendant deux jours pour mettre les mains dans le cambouis et imaginer puis prototyper des solutions réelles, concrètes, loin de l’image d’Épinal de l’IA surpuissante, à la HAL 9000 dans « 2001 : l’Odyssée de l’espace ».

Il faut dire que ce sujet s’y prête particulièrement bien. Pour utiliser ChatGPT ou toute autre IA générative conversationnelle, nul besoin en théorie de connaître de langage de programmation ou d’avoir un diplôme d’ingénieur ; c’est là toute la force de cette technologie. Elle est accessible à tous, quel que soit son niveau de compétences techniques.

Aussi (surtout !), un hackathon est un excellent moment pour sortir la tête du guidon et faire du « team building ». Et chez Contexte, comme dans la plupart des entreprises dans ce contexte post-Covid, le télétravail est devenu omniprésent. Se retrouver simplement pendant deux jours sans avoir à lancer une visio, c’est exceptionnel, mais tellement agréable ! 

Bref, c’était une occasion en or de réunir nos équipes tech, produit, commerciale/marketing et la rédaction pour réfléchir à une problématique commune, sur un sujet stratégique de prospective.

Panorama des projets

De jeudi matin à vendredi soir, une quinzaine de collaborateurs de Contexte ont travaillé sur trois projets extrêmement différents, mais tous très pertinents pour l’entreprise et l’évolution de ses produits et services. En voici un aperçu.

Le Diff : afficher l’impact d’un amendement sur un texte de loi

Chez Contexte, nous avons développé Scan, une interface pour suivre l'élaboration de la loi française en temps réel, accessible à l’ensemble de nos abonnés. Celle-ci affiche, pour tous les projets de loi, les amendements en cours de discussion à l’Assemblée nationale et au Sénat. 

Depuis que nous avons développé ce service, il y a plusieurs années, pouvoir montrer l’article de loi tel que l’amendement propose de le modifier, et ce pour tous les amendements, semblait être une évolution évidente. Mais elle s’était jusqu’à présent heurtée à un mur technologique. Les amendements déposés par les députés et sénateurs sont écrits en langage naturel, sans respecter de schéma prédéfini, et bien souvent avec quelques imprécisions, rendant leur compréhension par des algorithmes « métier » (développés spécialement pour ce cas d’usage) quasi impossible.

Une équipe a donc ressorti ce vieux projet du placard pour le confronter aux capacités de ChatGPT, réputé très fort dans la compréhension du langage naturel. Et force est de constater qu’on a été impressionnés. En deux jours, l’équipe a réussi à obtenir des résultats plus convaincants que tout ce que l’on avait pu voir jusqu’à présent.

Ça nous ouvre une perspective pour industrialiser cette solution assez rapidement, mais ça pointe aussi certains défis qu’il reste à relever, notamment concernant le coût et le temps de traitement des requêtes.

Isaac+ : veille assistée par l’IA

Une partie importante du travail de journaliste chez Contexte consiste à lire des documents PDF ou des publications web institutionnelles pour y déceler des changements ou des informations cachées qui peuvent receler beaucoup de valeur journalistique. C’est un travail fastidieux et chronophage. 

L’équipe Isaac+ (en référence au nom d’un outil de veille que l’on utilise en interne) a développé un formulaire en ligne dans lequel un journaliste peut renseigner l’adresse web de son document et les informations qu’il souhaite en extraire sous forme de colonnes à remplir dans un tableau. Grâce à ça, l’IA travaille et transforme par exemple une liste textuelle en un tableau Excel avec toutes les informations demandées.

Cette première étape permet d’envisager le développement d’un robot qui pourra naviguer sur une page web et effectuer des recherches spécifiques. Par exemple, concernant les changements de poste dans un cabinet ministériel publiés au Journal officiel. En paramétrant l’outil pour surveiller cette publication et chercher cette information, il pourra identifier automatiquement tout changement de poste et notifier l’utilisateur en temps réel.

Les gains potentiels pour les journalistes, mais également pour nos lecteurs, sont énormes. Toutefois, là aussi le temps de traitement et le coût sont des challenges pour l’avenir, tout comme la généralisation de la solution à d’autres cas d’usage que celui qui a été prototypé par l’équipe.

Briefing Ristretto : le briefing personnalisé

Comment mettre en avant les informations les plus pertinentes pour chaque lecteur dans nos mails quotidiens (les fameux « briefings ») ? L’équipe a travaillé sur deux axes pour y répondre :

  • en proposant une interface innovante pour mettre en avant les informations les plus utiles à un abonné donné, et en retrait celles a priori moins pertinentes ;
  • et en cherchant à créer des « clusters » (soit des groupes homogènes d’abonnés partageant des caractéristiques communes) basés sur les données que nous collectons (avec consentement, naturellement).

Du côté technique, on a ici mis en œuvre des algorithmes de « machine learning », tels que K-means, pour identifier des groupes homogènes d’utilisateurs qui pourraient avoir des centres d’intérêt communs. En parallèle, ChatGPT nous a permis d’identifier les brèves similaires, qui peuvent être publiées dans plusieurs éditions, afin d’éviter les éventuelles redites.

Les idées en termes d’expérience utilisateur ont surpris tout le monde par leur simplicité, leur pertinence et leur nouveauté, et pourraient bien intégrer notre produit prochainement. Quant à la segmentation, force est de constater que deux jours c’est un peu court pour aller au bout de ce projet ambitieux, mais la démarche ouvre la voie à une personnalisation automatisée. Elle a notamment permis de mettre en évidence des points manquants dans notre collecte de données, qu’il nous faudra combler avant de pouvoir avancer efficacement sur ce chantier.

Le bilan

La dernière étape du hackathon était une présentation à l’ensemble de l’équipe et un vote ouvert à tous. Chacun a pu élire le projet le plus pertinent, innovant et facile d’utilisation à ses yeux :

Les résultats ont été incroyablement serrés ! 

  • 11 voix pour Le Diff
  • 10 pour Isaac+
  • 10 pour Briefing Ristretto

La preuve que tous les projets ont apporté un regard pertinent sur une problématique réelle.

Mais au-delà de la satisfaction d’avoir vu émerger trois beaux projets qui auront chacun une suite chez Contexte, on en retire des enseignements majeurs sur les technologies explorées.

Le premier, ce sont les limites des IA génératives actuelles. Ce sont des outils impressionnants, mais chaque projet a levé des réserves sur leur utilisation au quotidien dans notre activité. En fait, l’impression générale est qu'aujourd'hui ChatGPT peut être comparé à un stagiaire pas très futé mais plein de bonne volonté : il fera toujours son possible pour accomplir sa tâche, mais il est nécessaire de repasser derrière lui parce qu’il ne comprend pas toujours bien ce qu’on lui demande et qu’il fait souvent des erreurs.

On est donc loin du scénario dans lequel les métiers de journaliste ou de développeur seront remplacés dans un futur proche par des algorithmes. Les IA génératives peuvent permettre à ces métiers de gagner du temps, ou d’envisager de nouvelles fonctionnalités ou de nouveaux services. Mais le travail d’architecture, d’analyse, et surtout de validation de la qualité du rendu restera longtemps une fonction portée par des professionnels experts dans leur domaine.

Un deuxième enseignement, c’est que malgré l’apparente accessibilité de la technologie, ce sont les ingénieurs qui ont fini par prendre en main la partie « prompt engineering », c’est-à-dire l’élaboration des messages à envoyer à ChatGPT. Il semble donc toujours nécessaire, pour réellement industrialiser des solutions basées sur l’IA, d’avoir une approche scientifique et des équipes spécialisées.

Mais au-delà de ces aspects techniques, ce que l’on retient de ce hackathon, c’est surtout un super moment de convivialité entre collègues, où, dans un esprit très Contexte, on s’est amusés en se penchant avec rigueur sur des sujets complexes. Toujours dans une ambiance bienveillante et conviviale.

Bonus : le mode d’emploi

Si vous voulez vous aussi organiser un hackathon, j’ai fait un petit guide qui m’aurait fait gagner beaucoup de temps si je l’avais eu avant l’organisation. C’est cadeau et c’est ici !