Mots répétés et correcteur orthographique

Il y a quelques jours, un utilisateur passionné de machines à vapeur demandait sur le forum de Word comment faire en sorte que le mot « pop » ne soit plus souligné en rouge lorsqu’il écrivait un texte parlant des « bateaux pop pop ». Question intéressante qui concerne une fonctionnalité du correcteur orthographique de Microsoft Office dont on parle très peu souvent : le correcteur souligne en fait la 2ème occurrence d’un mot lorsque celui-ci est répété. Cela part de la constatation que deux mots identiques qui se succèdent sont très vraisemblablement le signe d’une erreur et qu’on veut le signaler à l’utilisateur (libre à lui d’ignorer ce conseil, bien sûr). Un exemple :

Il lit le le livre que je lui ai acheté.

La deuxième occurrence de « le » est soulignée et l’utilisateur peut, en appuyant sur le bouton droit de la souris, supprimer celle-ci en un clin d’œil. Et hop, une erreur en moins!

Il existe un nombre très restreint de mots qui peuvent se succéder en français: « en », par exemple.

En en demandant deux, tu en obtiens trois.

Idem pour « vous » et « nous »:

Vous vous souvenez de moi et nous nous souvenons de vous.

Le programme du correcteur permet aux développeurs de spécifier la liste des mots qui peuvent se succéder. Nos utilisateurs, toujours exigeants, à juste titre, trouveraient irritante la présence d’un trait ondulé rouge sous « en », « nous » ou « vous » dans les exemples ci-dessus. En anglais, par exemple, on aura le mot « that » qui peut lui aussi être répété (He said that that book was interesting). Cette liste est assez courte pour le français. Le « bug » dont parlait notre utilisateur est que le mot « pop » n’est pas mentionné dans cette liste. « Pop-pop » avec trait d’union dans « un moteur pop-pop » est en fait beaucoup plus fréquent et ce terme n’est pas considéré comme une faute par le correcteur. « Pop pop » sans trait d’union est beaucoup moins fréquent dans les corpus de textes et nous n’avions pas trouvé suffisamment d’exemples pour justifier l’inclusion de « pop » dans la liste des répétitions admises.

La solution est bien sûr d’ignorer ce soulignement si l’on ne souhaite pas corriger cette construction. Personne ne force évidemment qui que ce soit à accepter cette suggestion. La raison d’être d’une telle fonction est d’aider l’utilisateur à améliorer ses textes et à identifier des fautes probables. Elle sera utile dans 99.99% des cas ; si on s’aperçoit que « pop pop » rentre dans le langage courant sans trait d’union, nous pourrons ajouter le mot « pop » à la liste (très courte, je le rappelle) des mots qui peuvent être répétés en français. C’est toutefois quelque chose qui se fait au niveau du moteur du correcteur ; l’utilisateur final n’a pas la possibilité de la modifier.

 

Thierry Fontenelle

Microsoft Natural Language Group [MSFT]