Mots répétés et correcteur orthographique


 


Il y a quelques jours, un utilisateur passionné de machines à vapeur demandait sur le forum de Word comment faire en sorte que le mot « pop » ne soit plus souligné en rouge lorsqu’il écrivait un texte parlant des « bateaux pop pop ». Question intéressante qui concerne une fonctionnalité du correcteur orthographique de Microsoft Office dont on parle très peu souvent : le correcteur souligne en fait la 2ème occurrence d’un mot lorsque celui-ci est répété. Cela part de la constatation que deux mots identiques qui se succèdent sont très vraisemblablement le signe d’une erreur et qu’on veut le signaler à l’utilisateur (libre à lui d’ignorer ce conseil, bien sûr). Un exemple :


Il lit le le livre que je lui ai acheté.


La deuxième occurrence de « le » est soulignée et l’utilisateur peut, en appuyant sur le bouton droit de la souris, supprimer celle-ci en un clin d’œil. Et hop, une erreur en moins!


Il existe un nombre très restreint de mots qui peuvent se succéder en français: « en », par exemple.


En en demandant deux, tu en obtiens trois.


Idem pour « vous » et « nous »:


Vous vous souvenez de moi et nous nous souvenons de vous.


Le programme du correcteur permet aux développeurs de spécifier la liste des mots qui peuvent se succéder. Nos utilisateurs, toujours exigeants, à juste titre, trouveraient irritante la présence d’un trait ondulé rouge sous « en », « nous » ou « vous » dans les exemples ci-dessus. En anglais, par exemple, on aura le mot « that » qui peut lui aussi être répété (He said that that book was interesting). Cette liste est assez courte pour le français. Le « bug » dont parlait notre utilisateur est que le mot « pop » n’est pas mentionné dans cette liste. « Pop-pop » avec trait d’union dans « un moteur pop-pop » est en fait beaucoup plus fréquent et ce terme n’est pas considéré comme une faute par le correcteur.  « Pop pop » sans trait d’union est beaucoup moins fréquent dans les corpus de textes et nous n’avions pas trouvé suffisamment d’exemples pour justifier l’inclusion de « pop » dans la liste des répétitions admises.


La solution est bien sûr d’ignorer ce soulignement si l’on ne souhaite pas corriger cette construction. Personne ne force évidemment qui que ce soit à accepter cette suggestion. La raison d’être d’une telle fonction est d’aider l’utilisateur à améliorer ses textes et à identifier des fautes probables. Elle sera utile dans 99.99% des cas ; si on s’aperçoit que « pop pop » rentre dans le langage courant sans trait d’union, nous pourrons ajouter le mot « pop » à la liste (très courte, je le rappelle) des mots qui peuvent être répétés en français. C’est toutefois quelque chose qui se fait au niveau du moteur du correcteur ; l’utilisateur final n’a pas la possibilité de la modifier.


 


Thierry Fontenelle


Microsoft Natural Language Group [MSFT]


Comments (4)

  1. bauer says:

    la solution est très facile ce me semble : il suffit de mettre un espace obligé "ctrl + shift + barre d’espacement" pour voir disparaître le soulignement

  2. natlanggroup@live.com says:

    C’est vrai, le blanc insécable avec CTRL+SHIFT+barre d’espacement fait disparaître le soulignement. Je pense qu’il est encore plus facile de cliquer sur la 2e occurrence de « pop » et de choisir « Ignorer ». Cela dit, la présence d’un soulignement rouge dans le texte n’a rien de problématique. Ce soulignement n’est pas imprimé et n’est là qu’à titre indicatif pour l’auteur du document.

    Thierry

  3. diane says:

    c est pour vous avisez qu’il reste seulement du v8.

    Pur la collation de Franceska

  4. diane says:

    c est pour vous avisez qu’il reste seulement du v8.

    Pur la collation de Franceska