Orthographe traditionnelle et orthographe rectifiée: le correcteur orthographique français d’Office 2007


[An English version of this post is available here, on the Microsoft Office Natural Language team blog]


Il y a quelques mois, nous avons sorti un nouveau correcteur orthographique français pour les utilisateurs d’Office 2003. Comme je l’ai signalé sur ce blog, ce nouvel outil a été intégré au Service Pack 2 en septembre 2005. Une des caractéristiques principales de ce nouveau correcteur est qu’il tient compte de la réforme de l’orthographe telle qu’elle est recommandée par les instances officielles comme l’Académie Française, le Conseil Supérieur de la langue française, etc. J’ai déjà abordé ici-même les différents changements ainsi que le label de qualité qui a été décerné à cet outil. Je n’y reviendrai donc plus ici, sinon peut-être pour souligner que tout bouge régulièrement dans ce domaine. Je signalais il y a quelques semaines que le nouveau Bescherelle inclut maintenant toutes les formes rectifiées dans ses tableaux de conjugaison et que le Nouveau Littré 2006 reconnait aussi explicitement les nouvelles graphies. Le Groupe québécois pour la modernisation de la norme du français m’informe maintenant que le Petit Larousse 2007 inclut à présent une page intitulée « Orthographe : les rectifications de 1990 » où toutes les règles de la nouvelle orthographe sont présentées.


Les textes officiels sont clairs : tant l’orthographe traditionnelle (les « anciennes » graphies) que la « nouvelle » orthographe sont considérées comme correctes. Ceci explique que, par défaut, le correcteur accepte donc les deux types de graphies. Nous avions toutefois fourni une boite (ou boîte) de dialogue distincte permettant à l’utilisateur de choisir le type de graphie qu’il souhaitait appliquer s’il désirait changer la configuration par défaut.


Si vous installez Office 2007, vous remarquerez qu’il n’est plus nécessaire de télécharger cette boite de dialogue distincte. Tout est désormais intégré aux options linguistiques de Word 2007 (accessibles via le gros bouton d’Office dans le coin supérieur gauche de la fenêtre de Word). Comme on peut le voir ci-dessous, le menu pour les Modes français vous permet de choisir l’une des trois options:


  



 Ces trois options vous permettent de:


(a)  considérer les anciennes graphies (orthographe traditionnelle) et les nouvelles graphies (orthographe rectifiée) comme correctes (option par défaut)


(b) n’appliquer que l’orthographe traditionnelle (les nouvelles graphies seront alors soulignées en rouge)


(c) n’appliquer que les graphies rectifiées (les anciennes graphies seront alors soulignées en rouge)


Le changement de paramètres est donc beaucoup plus simple qu’avec le Service Pack 2 d’Office 2003.


 


— Thierry Fontenelle (Program Manager)


 

Comments (28)

  1. NOUVEAU CORRECTEUR GRAMMATICAL WORD 2003 : ON A CONNU MIEUX… (OU L’AVERTISSEMENT POUR OFFICE 2007…)

    Depuis 2001, je travaillais avec Word 2000. Pas plus tard qu’il y a

    une semaine, en farfouillant dans les forums Usenet, je me suis rendu

    compte (bien tardivement, avouons-le) qu’Office 2003, depuis fin

    2004, était doté d’un nouveau correcteur grammatical et, depuis

    2005, d’un nouveau moteur orthographique prenant en charge les

    réformes de l’Académie française de 1990. Je me suis dit : « WMA

    Imperator, abandonne donc ton vieux Word 2000. Essaie donc Office 2003

    revu et corrigé ! »

    Un certain nombre de tests m’ont fait amèrement regretter ma

    décision…

    Je vous cite ci-dessous de manière très illustrative, quelques cas

    fautifs que Word 2000 détecte parfaitement, mais que Word 2003 ignore

    superbement.

    1.  Accord imparfait du participe passé

    Ex : Le chien a mangée son bol.

    2.  Support imparfait des traits d’union

    Ex1 : Un sous ensemble particulier.

    Ex2 : Michelle a trente deux ans.

    Ex3 : Les asticots eux mêmes seront écœurés.

    3.  Non-détection de certaines élisions fautives avec le h aspiré

    Ex : L’haricot aurait des vertus aphrodisiaques.

    4.  Ignorance totale de certaines expressions erronées

    Ex : Ces individus font parti du nombre des assassins.

    5.  Ignorance de certaines confusions lexicales

    Ex : La fille du Ministre est sensée avoir foiré au concours.

    6.  Emploi imparfait des modes et des temps

    Ex1 : Je doute qu’il viendra.

    Ex2 : Au cas où il appelait, faites-moi signe.

    7.  Accord imparfait des numéraux

    Ex1 : Les années quatre-vingt.

    Ex2 : Cette poterie semble avoir neuf mille ans !

    8.  Détection inexistante des auxiliaires erronés

    Ex1 : Le bébé a tombé de son berceau.

    Ex2 : Mon frère est dormi durant presque douze heures.

    Ex3 : Elle l’a faite partir.

    9.  Ignorance de certains cas invariables

    Ex1 : La rébellion a décimé quelques 2000 personnes

    Ex2 : Vue ses potentialités exceptionnelles, ce hacker a intéressé

    la CIA.

    10.                  Ignorance de certains accords

    Ex1 : Quel que soit sa bêtise, il restera toujours ton fils.

    Ex2 : Quel que soit les enjeux, fuyons cette affaire comme la peste.

    Et j’en passe…

    J’ose simplement croire que le futur Office 2007, version finale, tiendra compte de ces bugs pour le moins gênants…

  2. MSDNArchive says:

    Bonjour WMA Imperator,

    Merci pour ces commentaires très constructifs. Il est exact que le correcteur grammatical d’Office 2003 SP2 a un comportement différent de celui du correcteur qui était utilisé dans les versions de Word 2000. Le changement a été opéré sur la base des nombreuses réactions recueillies auprès de nos utilisateurs, qui indiquaient que le correcteur précédent (avant Office XP) considérait dans de trop nombreux cas des phrases exactes comme fautives, ce qui était gênant et peu utile. Nos recherches ont montré que la plupart des utilisateurs débranchaient ce correcteur grammatical à cause de ces « erreurs » qui n’en étaient pas.

    Notre but, en remplaçant ce produit, était de fournir un outil plus discret et plus fiable quant aux erreurs qu’il repère, et donc moins gênant tout en étant plus utile. Ce faisant, cet outil ne repère pas un certain nombre d’erreurs réelles, telles que celle que vous mentionnez. Le correcteur se concentre notamment sur une liste des fautes les plus fréquentes et ne tente donc pas de corriger toutes les fautes possibles qu’un utilisateur pourrait commettre. Tout est donc question de « design », si je puis m’exprimer ainsi : souhaite-t-on un correcteur qui donne l’impression de pouvoir tout corriger, mais se trompe 15 ou 20 fois plus souvent dans son diagnostic (au point d’encourager l’utilisateur à le débrancher), ou un outil plus précis dans son jugement, mais dont on sait qu’il ne pourra pas tout repérer ? Cruel dilemme pour les concepteurs d’outils aussi complexes à développer. On en avait parlé sur l’excellent blog de Jean Véronis il y a quelques mois, lorsqu’il avait écrit ceci (http://aixtal.blogspot.com/2005/10/ortograf-repart-chez-microsoft.html):

    « J’ai été particulièrement impressionné par les nouvelles fonctionnalités grammaticales. Il reste évidemment beaucoup de travail dans ce secteur. Il est difficile d’améliorer les choses sans déclencher de fausses alertes, qui sont généralement mal acceptées par les utilisateurs. »

    Une petite note concernant « eux-mêmes », qui est en fait bien corrigé par le mécanisme de correction automatique de Word. Ce mécanisme ne se déclenche toutefois pas lorsqu’on utilise la fonction « copier-coller » et vous ne verrez pas de soulignement sous « eux mêmes ». La correction s’effectue automatiquement et le trait d’union s’insère dès que vous appuyez sur la barre d’espacement après « mêmes ».

    S’agissant de la section relative aux numéraux, puis-je faire remarquer que les deux exemples que vous citez ne contiennent en fait pas de fautes ? « Les années quatre-vingt » est la forme correcte, comme le signale le Dictionnaire des difficultés de la langue française de Hanse-Blampain. Pour la phrase « Cette poterie semble avoir neuf mille ans », ici aussi, « mille » est invariable et le correcteur ne doit donc rien signaler non plus.

    Cela dit, encore merci pour cette liste très utile. Je vous encourage aussi à lire l’interview suivante, où j’ai essayé de parler de ces difficultés lorsque l’on tente d’augmenter la gamme des erreurs qu’on peut repérer tout en restant le plus précis possible : http://www.enseignons.be/actualites/pedagogique/index.php/2006/05/13/89-correcteurs-orthographiques

    Bien à vous,

    Thierry Fontenelle

    Microsoft Natural Language Goup [MSFT]

  3.  

    Romain Muller, membre du Groupe de modernisation de la langue et directeur de publication du…

  4. Bonjour Thierry,

    Apparemment, OpenOffice 2 a aussi son correcteur qui prend en compte la réforme de l’orthographe, depuis quelques semaines.

    A quand un test entre Antidote, Office 2007 et OOo

    Bien à toi,

    Benjamin

  5. Thierry Fontenelle says:

    Bonjour Benjamin,

    Oui, j’ai vu aussi qu’OO tient maintenant compte de la réforme de l’orthographe. Il faut apparemment deux dictionnaires différents et passer d’une option à l’autre ne semble pas être aisé. Il n’y a pas non plus la troisième option qu’on trouve par défaut dans le correcteur de Microsoft Office consistant à reconnaitre les deux orthographes (l’ancienne et la nouvelle), ce qui serait pourtant conforme aux recommandations de l’Académie française et des instances compétentes qui précisent que les deux orthographes sont considérées comme correctes.  Cela dit, on ne peut nier que la mise en application de ces rectifications orthographiques est un processus qui ne semble plus pouvoir être arrêté.

    Bien à toi,

    Thierry

  6. [Click here for an English version of this post on our team’s blog] Il y a quelques jours, une école

  7. Un utilisateur d’Office 2007 nous demandait il y a quelques jours si le correcteur orthographique français

  8. J’apprends par l’intermédiaire du GQMNF (Groupe québécois de modernisation de la norme du français) que

  9. Je viens tout juste de passer quelques jours en Belgique et j’ai eu l’occasion de donner un cours à l’Université

  10. emanu says:

    bonjour, je n’arrive pas à comprendre pourquoi le correcteur de word 2007 est moins efficace que celui de word 2000…

    exemple:

    Se perchoir est beau.

    Il vous avez communiqué ses coordonnées.

    PAS DETECTE !

  11. MSDNArchive says:

    Bonjour Emanu,

    La réponse que j’ai donnée à WMA Imperator ci-dessus est valable ici aussi:

    Le correcteur de Word 2007 n’est donc pas moins efficace, il est différent parce qu’il est plus précis. Il identifie moins de fautes, mais se trompe nettement moins souvent dans ses jugements. Voir ma réponse ci-dessus pour plus de détails :

    http://blogs.msdn.com/correcteurorthographiqueoffice/archive/2006/08/26/724662.aspx#769823

    Thierry

  12. emanu says:

    Merci pour votre réponse.

    Je note qu’un choix aurait donc été fait entre : éviter de détecter trop de fausses erreur, et admettre de laisser passer des fautes mais en moins grand nombre…

    Ce que je comprends mal, c’est que le correcteur de WORD 2000 en utilisation standart apportait un plus, même s’il n’était pas infaillible, alors que le correcteur de WORD 2007 est simplement inexpoitable au vu des erreurs basiques, énormes, et très courantes non détectées…

    Donc help me : un patch est-il prévu ? est-il possible de revenir à l’ancienne version ?

    Car ma secrétaire patauge et je vais être obligé d’acheter un soft de correction, ce qui m’embêterais un peu vu le prix d’office…

  13. MSDNArchive says:

    Bonjour Emanu,

    Il faut savoir qu’aucun correcteur grammatical ne détecte de toute façon toutes les fautes possibles. C’est dû à la complexité du traitement du langage naturel. Vous avez raison quant au choix qui a été fait. Ce choix est motivé par les très nombreux commentaires que nous recevions à l’époque d’utilisateurs qui débranchaient les anciennes versions sous Word 2000 parce que les « fausses alertes » étaient tellement fréquentes qu’elles perturbaient le travail normal, rendaient le correcteur peu utile parce que peu fiable. C’est ce que j’ai voulu dire en citant l’excellente analyse de Jean Véronis où il précisait, sur le blog cité ci-dessus (http://aixtal.blogspot.com/2005/10/ortograf-repart-chez-microsoft.html), qu’ «il est difficile d’améliorer les choses sans déclencher de fausses alertes, qui sont généralement mal acceptées par les utilisateurs ».  Il n’est pas possible  de revenir à cette ancienne version et il faut se souvenir qu’aucun produit linguistique de toute façon ne dispense d’une relecture attentive, bien sûr.

    Thierry

  14. J’ai évoqué à plusieurs reprises sur ce blog les réformes de l’orthographe promulguées par des instances

  15. J’ai évoqué à plusieurs reprises sur ce blog les réformes de l’orthographe promulguées par des instances

  16. Romain Muller, membre du Groupe de modernisation de la langue et directeur de publication du site http://www.orthographe-recommandee.info

  17. Pour les lecteurs de ce blog s’intéressant à la réforme de l’orthographe en français, deux articles publiés

  18. Pour les lecteurs de ce blog s’intéressant à la réforme de l’orthographe en français, deux articles publiés

  19. Le magazine Forum de l’Université de Montréal présente cette semaine un dossier sur le thème de la “nouvelle”

  20. lulu says:

    faire des fautes d’orthographes n’est pas forcément un handicap pour réussir dans le milieux

  21. Microsoft Office 2008 pour Mac vient d’être lancé il y a quelques jours. Les utilisateurs de Mac qui

  22. L’Equipe Education de Microsoft France présente depuis peu un site ( Office pour les enseignants ) permettant

  23. allo says:

    on n’est pas condamnés à l’échec

  24. Voici une nouvelle qui intéressera les enseignants. Les programmes scolaires 2008-2009 du Ministère français

  25. Encore une nouvelle qui intéressera les enseignants belges. J’apprends via la Liste de diffusion Orthographe

  26. Sxilderik says:

    La réforme de 1990 datant de … 1990, je suis surpris de n’en pas trouver de support sur Office 2000. Est-ce vraiment impossible ou bien y’a-t-il quelque part une version du correcteur adapté ?

  27. MSDNArchive says:

    Bonjour,

    La prise en compte des rectifications orthographiques a été mise en œuvre à partir d’Office 2003 (dans le service pack 2 de 2005), qui inclut notre nouveau correcteur développé en interne. Les versions précédentes d’Office (2000 et 2002) contiennent l’ancien correcteur qui ne tient pas compte de ces changements (la situation a beaucoup évolué depuis lors, avec des circulaires ministérielles très claires dans la plupart des pays francophones). Les nouvelles versions du correcteur intègrent beaucoup d’autres changements (féminisation des noms de métier, meilleure couverture lexicale, néologismes, meilleur traitement des traits d’union, etc).

    Bien à vous,

    Thierry Fontenelle

  28. Les habitués de ce blog savent que le correcteur orthographique français d’Office tient compte, depuis