Les institutions gouvernementales que ce soit pour la défense, les transports, les services publics, la sécurité, ou les soins de santé ont un défi et une opportunité à traiter : donner un sens à d'énormes volumes de textes non structurés qui ne font que croître. Plus de 80 % de la plupart des données organisationnelles ne sont pas structurées, tels que des textes libres provenant de rapports de terrain, des formulaires, des résumés, des notes, des commentaires, des courriers électroniques, des messages de forums ou de médias sociaux, des enquêtes clients, des fiches de centres d'appel, ….
L'analyse de données textuelles regroupe des méthodes d’intelligence artificielle, dont le Traitement en Langage Naturel (NLP), qui visent à découvrir l'information « essentielle » contenue dans un texte. Un traitement d’analyse d’un texte va permettre d'extraire de l'information à partir d'un ensemble hétérogène de textes peu structurés, afin de déterminer automatiquement les phrases clefs et les thèmes, d'identifier les synonymes et les parties du message, catégoriser les contenus, gérer les termes sémantiques, dévoiler les sentiments et mettre les éléments dans leur contexte.
Le traitement du langage naturel (NLP) effectue une analyse linguistique en utilisant une variété de méthodologies pour déchiffrer les ambiguïtés du langage humain, pour en extraire les faits et les relations clés, et permettre d’analyser des quantités illimitées de données textuelles. Pour fonctionner, il aura besoin d'une base de connaissances cohérente telle qu'un thésaurus détaillé, un lexique de mots, un ensemble de données pour les règles linguistiques et grammaticales, une ontologie et des entités actualisées.
La collecte et l'interprétation des données textuelles non structurées est essentielle pour de nombreux processus gouvernementaux. Elle permet de faire ressortir les éléments contextuels ou les idées cachées dans les documents numériques afin d’évaluer les ressentis des citoyens, d’identifier des attentes non satisfaites, d’influencer l'opinion, de façonner la politique, d’identifier des risques cachés, de détecter la fraude ou la criminalité.
Les citoyens attendent de leur gouvernement un engagement fort et personnalisé avec le numérique. Chaque jour, des milliers d'entre eux contactent les agences gouvernementales concernant leur déclaration d'impôts, posent des questions sur leur démarches administratives et commentent les règlementations de l’états. Les retours d'informations des citoyens peuvent prendre plusieurs formes : boîtes à suggestions, commentaires en ligne enquêtes, plaintes affichées sur le site web ou dans les médias.
Pour les administrations, il est difficile de répondre efficacement aux demandes, et les retards sont monnaie courante. Les personnels chargés de ces demandes sont accablés par leur volume et les traitements manuels.
Les challenges pour le gouvernement sont variés : mise en œuvre de politiques publiques, amélioration et simplification des procédures administratives pour le citoyen, évaluation du ressenti du public sur de nouvelles politiques ou règlementations.
Dans ce contexte l’automatisation des processus d'extraction, de transmission d'informations, d'écoutes et de compréhension des réactions des citoyens sont indispensables afin d'apporter les ajustements nécessaires aux nouveaux programmes et ainsi permettent de mieux servir et accroître la satisfaction des usagers.
Les besoins analytiques dans le secteur public sont divers, quelques exemples d’utilisations dans le service public.
Relation usager : Répondre rapidement et précisément aux demandes des citoyens en fournissant en temps réel des recommandations d'action basées sur une catégorisation rapide des transcriptions des centres d'appel, des conversations des médias sociaux ou des informations des chats. L’utilisation, par exemple, de « chatbot » pour déterminer et fournir un contexte quasi immédiat aux demandes des citoyens permet de résoudre automatiquement de nombreuses questions sans intervention du personnel.
Anti-terrorisme/renseignement : Les services de renseignements gouvernementaux ont besoin d'un retour d'information en temps réel sur les événements locaux et mondiaux pour les aider à déterminer quand et où ils devraient intervenir au nom de la sécurité publique. Pour ce faire, ils doivent identifier, évaluer et localiser les changements liés aux événements en cours en faisant ressortir le sentiment de la population. En analysant les données des médias sociaux en conjonction avec d'autres renseignements, les administrations peuvent prévoir des événements tels que manifestations ou attaques terroriste.
L'analyse de texte permet de passer au peigne fin des milliers de documents en quelques secondes, en mettant en évidence les tendances afin de pouvoir rapidement déterminer ce qui est important et ce qui est nécessaire à la poursuite d’enquêtes.
Cybersécurité : Toutes les cyber-menaces ne sont pas enregistrées sous forme de tableau. Lors d’attaques, les « logs » ou les rapports systèmes et réseaux peuvent être exploités afin d’analyser les adresses IP, les noms des fichiers exécutables, voir d'autres informations permettant d'identifier la nature d’attaques coordonnées dans le temps. Des tendances sont détectées dans les données pour aider les services en charge de la sécurité à anticiper et à se préparer.
Biosurveillance : Les agences gouvernementales doivent développer et coordonner correctement les réponses aux épidémies potentielles ou aux actes de bioterrorisme. En combinant les données des médias sociaux avec les données organisationnelles de sources telles que les appels au « 112 », les centres antipoison, les hôpitaux, et les agences de biosurveillance peuvent détecter les épidémies potentielles. La détection précoce permet aux agences gouvernementales de prendre des mesures proactives pour limiter la propagation des maladies, en fournissant des alertes et des recommandations aux citoyens et aux prestataires de santé.
Santé : Les agences de santé peuvent utiliser l'analyse de texte pour améliorer, comprendre et prévoir les événements indésirables tels que les réactions aux vaccins, ainsi que pour aider à l'évaluation des risques. Par exemple, elles peuvent analyser le retour d'informations des patients pour identifier et suivre des imprévus, et à plus long terme, les effets négatifs.
L’analyse de données textuelle est également utilisée dans la mise en place de services numériques : accès à des comptes rendus d’hospitalisation, des résultats d’examen, échanges avec les professionnels de santé, prises de RDV en ligne, prescriptions dématérialisées, préadmission médicale, paiement de frais médicaux. Dans la gestion du COVID, elle permet aux chercheurs d’accéder à une très grande masse d'informations disponible dans les articles scientifiques où il est souvent difficile de s'y retrouver.
Alertes précoces pour les crises économiques : L’analyse d’informations issues de médias sociaux permet de mettre en évidence les tendances économiques, telles que des réductions de dépenses dans les foyers. Les agences gouvernementales peuvent s’en servir comme un signal précoce de l'imminence de perte d'emploi ou de crises à venir.
Emploi : L'analyse de texte peut permettre d’évaluer les descriptions d’offres d’emplois, de compiler les compétences clés d’individus ainsi que leurs aspirations définies dans des CV et ainsi établir des propositions de postes intelligentes et plus efficaces.
Le déploiement de l'analyse de texte doit améliorer la communication bilatérale entre les gouvernements et les citoyens, mais doit aussi aider nos dirigeants à mieux comprendre l'opinion publique. En garantissant la véracité des informations et en favorisant le libre échange des idées, elle permet de diminuer la méfiance des citoyens envers leur gouvernement et promouvoir la cohésion sociale, qui conduit à un gouvernement plus résilient, mieux à même de répondre aux besoins changeants de ses citoyens.
Visitez le hub Do Great Things et découvrez d'autres contenus sur votre secteur d'activité.