Linguistique, informatique et enseignement : retour aux sources

Je viens tout juste de passer quelques jours en Belgique et j’ai eu l’occasion de donner un cours à l’Université de Louvain-la-Neuve devant environ 200 étudiants, ainsi que devant un groupe d’enseignants de l’Université de Liège. C’était amusant et très agréable de retrouver les sensations que j’avais connues lorsque j’enseignais, il y a une dizaine d’années. En répondant à ces deux invitations, mon but était de tenter de montrer pourquoi une entreprise telle que Microsoft peut s’intéresser à des linguistes alors que son « core business », comme on dit ici, est le développement de logiciels. Les 200 étudiants que j’avais en face de moi étudient les langues, la linguistique et la littérature et provenaient des départements de français, d’espagnol, d’anglais, de néerlandais et d’allemand. C’est vrai que les utilisateurs de produits comme Office ont tendance à ne pas se poser trop de questions quand ils activent des fonctionnalités comme le correcteur orthographique ou le correcteur grammatical. Le correcteur orthographique, en particulier, est souvent perçu, à tort, comme une application très simple (on vérifie si un mot est dans le dictionnaire et on souligne le mot en rouge s’il ne l’est pas). J’ai tenté de leur montrer que c’est bien plus compliqué que cela (quid des apostrophes, fréquentes en français, et des traits d’union ? Comment les traiter ? Que mettre dans le dictionnaire ? Quand faut-il insérer une apostrophe lorsque l’utilisateur l’a oubliée (par exemple dans létudiant) ? Et je ne parle pas ici des langues qui permettent les composés dynamiques comme l’allemand ou le néerlandais…

C’était aussi l’occasion de montrer aux étudiants ce que nous avons fait en faveur de la reconnaissance des noms de métiers au féminin. Jean Véronis en parlait encore il y a une semaine sur son blog dans le cadre des élections présidentielles françaises (aurait-on dit Madame la Présidente si Ségolène Royal avait été élue ?). On voit que le sujet peut passionner les foules puisqu’un lecteur de son blog reprochait au correcteur de Word de ne pas reconnaitre le mot sénatrice, utilisé en Belgique depuis belle lurette). Cet utilisateur n’employait manifestement pas la version de Word 2003 ou de Word 2007, puisque toutes ces formes féminines sont bien reconnues (et proposées) par ce correcteur depuis maintenant plus de deux ans…

J’ai bien sûr abordé aussi le problème des rectifications orthographiques et des recommandations de l’Académie française, que notre correcteur reconnait et suggère également (voir un de mes billets précédents sur la question ou les développements très récents du côté de l’Education Nationale en France).

Pour les étudiants anglicistes (et tous ceux qui sont amenés à rédiger des textes en anglais, en fait), j’ai montré en quoi les dernières améliorations d’Office 2007 pouvaient les concerner, en faisant notamment une démonstration du nouveau correcteur contextuel. Il n’y a donc plus de raison de trouver dans les copies d’étudiants des coquilles telles que

Foe example, he spent his hole life in the United States.

Le cas de “foe” est assez fréquent. Le « e » et le « r » sont voisins sur nos claviers et taper « foe » au lieu de « for » dans « for example » est une erreur fréquente. Les anciennes versions ne voyaient pas le problème, bien sûr, puisque le mot foe existe en anglais (il signifie ennemi). Idem pour his hole life (hole existe – =trou) et beaucoup d’étudiants oublient le « w » de whole… Le joli trait ondulé bleu sous ces erreurs devrait leur faire prendre conscience des imperfections de leur prose et leur permettre d’éliminer ces coquilles avant de remettre leurs travaux. C’était aussi l’occasion d’introduire des concepts tels que celui des collocations, ces combinaisons privilégiées de deux ou plusieurs mots que l’on rencontre souvent dans le même contexte.

Bref, vous l’aurez compris, ces retrouvailles (oserais-je dire ce reditus ad fontes ?) avec le monde étudiant et l’univers des salles de cours des littéraires et des philologues m’ont procuré beaucoup de plaisir. Un étudiant m’a approché à la fin de mon exposé pour me demander s’il existait des possibilités d’approfondir ses connaissances dans ce domaine fascinant qu’est le traitement automatique du langage (puisque nous étions à Louvain-la-Neuve, je lui ai évidemment renseigné le programme de master en ingénierie linguistique de l'UCL, que cet étudiant de 1ère année ne connaissait pas encore). Le mariage de la linguistique et de l’informatique est effectivement une alliance passionnante. Qui sait ? Peut-être ai-je suscité une vocation chez cet étudiant ? Si tel est le cas, je n’aurai certainement pas perdu mon temps… Si d’autres que moi trouvent passionnante l’idée de tenter de repousser les frontières du savoir et de voir jusqu’où l’on peut aller en matière de modélisation de la langue tout en créant des outils utiles, j’aurai atteint mon but…

Thierry Fontenelle

Microsoft Natural Language Group