Identifying tokens: Is word-breaking so easy?

What is a word? It’s basically a question we linguists have to answer when we develop spell-checkers, grammar checkers, when we do automatic dictionary look-up, when we try to interpret (and expand) queries for a search engine, etc… I recently wrote a paper to show that doing word-breaking and tokenization is not as easy as…

8

The Microsoft Office 2003 French spell-checker vs. the OpenOffice speller

  A few weeks ago, Professor Jean Véronis, from the French University of Aix-en-Provence, carried out a comparison of the new Microsoft Office French spell-checker and the French speller included in the Google Toolbar (see here for a summary in English). Last week, he carried out a similar experiment to compare our new MS French…

2

Correcteur orthographique français et listes de corrections automatiques

  La question posée récemment par Benjamin Nizet est peut-être passée inaperçue parce qu’elle apparaissait dans les commentaires. Je me permets de reprendre la réponse ici. Cette question concernait les listes de corrections automatiques (AutoCorrect). Comme la nouvelle version du correcteur orthographique français d’Office 2003 tient désormais compte de la « nouvelle » orthographe et des recommandations…

1

The MVP Global Summit

   [en français un peu plus bas] The MVP (Most Valuable Professionals) 2005 Global Summit took place on the Microsoft Campus in Redmond a few weeks ago. I had the opportunity to meet two French MVPs, Marina Mathias (a.k.a. Circé) and Jean-Louis Goubert (a.k.a. JièL), who do a fantastic job helping users on the French…

0

The Microsoft Office 2003 French spell-checker vs. the Google Toolbar

Prof Jean Véronis, who teaches computational linguistics at the French University of Aix-en-Provence, has a very interesting blog on natural language technologies. A few days ago, he posted a nice and well-balanced evaluation of our new French Office 2003 spell-checker, which he compared to the Google Toolbar (it’s in French, so I thought this brief summary…

1

Féminisation des noms de métiers dans le correcteur orthographique d’Office 2003

J’ai parlé il y a quelques jours de l’intégration de la réforme de l’orthographe dans le nouveau correcteur orthographique français de Microsoft Office 2003. La féminisation des appellations professionnelles est aussi entrée dans les mœurs françaises et des termes comme écrivaine, auteure, professeure, échevine, officière, chercheure, gouverneure… sont désormais reconnus par ce correcteur (de même…

7

Le nouveau correcteur orthographique français d’Office 2003 et la réforme de l’orthographe

[Click here for the English version of this post]   Certaines personnes nous ont demandé pourquoi le nouveau correcteur orthographique français inclus dans le Service Pack 2 d’Office 2003 ne souligne plus un certain nombre de formes qui étaient considérées comme fautives par le correcteur précédent. Il va de soi que la réforme de l’orthographe…

32

The new French spell-checker for Office 2003 and the spelling reform

[Cliquer ici pour la version française de ce billet]   Some people were asking us why the new French spell-checker which was made available to Office 2003 users with Service Pack 2 was no longer flagging a number of forms which were considered as mistakes in the previous speller. While it has to be made…

14

Label de qualité pour le nouveau correcteur orthographique français d’Office 2003 – Quality label for the new French spell-checker for Office 2003

Le nouveau correcteur orthographique français de Microsoft Office 2003 a reçu récemment un label de qualité de l’association Orthographe Recommandée. Ses linguistes ont testé ce correcteur (désormais intégré au Service Pack 2 d’Office 2003) et ont pu constater qu’il respecte entièrement les recommandations de l’Académie française et des diverses autorités linguistiques en matière de rectifications…

9

Office 2003 SP2 disponible avec les nouveaux outils linguistiques FR / available with the new French proofing tools

Microsoft Office 2003 Service Pack 2 is now available and includes the new French proofing tools: the new French grammar checker, the new spell-checker (which supports the French spelling reform) and the new French thesaurus. SP2 can be downloaded from (English version of Office 2003): http://www.microsoft.com/downloads/details.aspx?FamilyId=57E27A97-2DB6-4654-9DB6-EC7D5B4DD867&displaylang=en The various aspects of these new proofing tools were described…

5