Description

La Chaire de recherche du Canada sur les transformations de la communication savante (Vincent Larivière et Maxime Sainte-Marie, Université de Montréal) développe une suite d’algorithmes de prétraitement, de segmentation texte/cadre/image, de reconnaissance optique de caractères et de post-traitement linguistique adaptés aux documents historiques de langue française et anglaise. Ces développements permettent de rendre le plein texte du corpus de revues et journaux québécois numérisés par Bibliothèque et Archives nationales du Québec exploitable à des fins d’analyse textuelle.

Des technologies de pointe en intelligence artificielle sont utilisées, notamment l’emploi de réseaux de neurones pour le nettoyage post-linguistique.