Le rapport annuel sur la langue française remis le 24 mars 2025 rappelle que le français est la langue maternelle de 81 millions de personnes dans le monde. Le français est par ailleurs utilisé au quotidien par 255 millions de personnes. C'est ainsi la 5e langue la plus parlée au monde.
L'édition 2025, qui revient sur les 30 ans de la loi du 4 août 1994 relative à l'emploi de la langue française (dite loi Toubon), accorde une large place aux enjeux liés au développement de l'intelligence artificielle (IA).
Souveraineté numérique francophone et IA
Comme le souligne le rapport : "Les contenus en langue originale occupent une place aussi centrale que la puissance de calcul ou les algorithmes dans le développement de l’IA. La question des données disponibles (et accessibles), tant en termes de ressources que de langue, est primordiale : face à l’hégémonie des modèles anglo-saxons, d’autres modèles de collecte de données doivent impérativement être proposés pour entraîner les IA, et les alimenter de données qui reflètent le plus possible la langue française, comme la diversité des langues et des cultures, leurs références et leurs valeurs."
Un centre de référence des technologies des langues a été créé à la Cité internationale de la langue française de Villers-Cotterêts. C'est un consortium de 25 États membres de l'Union européenne financé par la Commission, dénommé Alliance pour les technologies des langues (ALT-EDIC). Son rôle est de développer des outils industriels et technologiques à partir de modèles de langues géants (grands modèles de langage), au bénéfice du plurilinguisme.
L'ALT-EDIC a une déclinaison francophone en projet dénommée LANGU:IA. Selon le rapport : "Il vise à réunir entreprises, institutions académiques et acteurs culturels dans l’exploitation des données pour une IA en français." Il s’agit de nourrir de contenus francophones des bases géantes de langage afin que l’IA "parle" aussi français.
Soutenir la production et la diffusion de contenus scientifiques francophones
D'après le rapport, 87% des publications de la communauté scientifique dans le monde sont rédigées en anglais.
Pour sortir de cette "impasse unilingue", un partenariat franco-québécois sur la "découvrabilité" des contenus scientifiques francophones a été mis en place.
Il s'agit de soutenir la disponibilité, l'accessibilité et la visibilité de ces contenus en favorisant l’émergence d’un "espace scientifique francophone virtuel" rassemblant des ressources spécialisées (plateforme de traduction semi-automatique, terminologies multilingues, outils d’aide à la rédaction scientifique, outils de recommandation…) pour faciliter la lecture et l’écriture des articles scientifiques, en anglais ou en français.
La diffusion dans une langue se prolongera par une mise en circulation de traductions et de synthèses automatiques en une autre langue [...] facilitées par les outils de l’IA générative et de la traduction automatique neuronale.