Building Corpora with the Live Search API

I just read Building and Exploring Web Corpora, which includes the Proceedings of the 3rd Web as Corpus Workshop (WAC3-2007) held at the University of Louvain-la-Neuve in September 2007. A number of papers describe how computational linguists have been using Microsoft’s Live Search Application Programming Interface (API) to build and clean corpora to be used…

1

L’ABC du blog sur Channel 10

Laura Foy, une des animatrices du site Channel 10, a posté il y a quelques jours une vidéo consacrée aux blogueurs de Microsoft intitulée The ABC’s of Blogging. Elle a interviewé toute une série de passionnés du blog qui partagent avec leurs lecteurs leur amour des technologies qu’ils développent. J’y fais une furtive apparition (après…

0

Blog de Microsoft Research sur le système de traduction automatique de MSR

Mes collègues de Microsoft Research (MSR) ont récemment créé leur propre blog où ils présentent le système de traduction automatique basé sur les statistiques qu’ils sont en train de développer. En septembre, j’ai annoncé le lancement du Windows Live Translator, qui utilise le système MSR-MT pour une série de paires de langues et offre quelques…

0

Forum, the French spelling reform, the Office spell-checker and dictionaries

Forum, a weekly magazine published by the University of Montreal, published an interesting article about the « new » spelling in French last week. The original version of this article (in French) is accessible on the web site of the magazine. You can also access the (shorter) English version of the article, which is entitled “Microsoft interested…

0

Forum, la nouvelle orthographe, Word et les dictionnaires

Le magazine Forum de l’Université de Montréal présente cette semaine un dossier sur le thème de la “nouvelle” orthographe. On y parle de notre Microsoft Language Resources Center et j’y explique les raisons pour lesquelles le corpus de ce magazine, rédigé depuis plusieurs années selon les recommandations de l’Académie Française et de l’Office québécois de…

0

La réforme de l’orthographe française dans la presse québécoise

  Pour les lecteurs de ce blog s’intéressant à la réforme de l’orthographe en français, deux articles publiés récemment dans la presse québécoise traitent de la progression, lente mais constante et inéluctable, de l’orthographe rectifiée recommandée par l’Académie Française. Les deux articles dressent un panorama de l’adoption graduelle de ces formes nouvelles par les enseignants…

3

Correcteur grammatical, précision et fausses alertes

Les habitués des forums de discussions et autres newsgroups sont traditionnellement critiques vis-à-vis des outils informatiques. Les utilisateurs sont souvent très exigeants en matière d’outils de vérification linguistique et les plaintes sont souvent plus fréquentes que les compliments sur ces newsgroups (cela en dit peut-être aussi beaucoup sur la nature humaine). Cette constatation rend d’autant…

5

Le mariage de la linguistique et de l’informatique dans “Spirit of Management”

Lors de mon passage en Belgique il y a quelques mois, j’ai eu le plaisir de retrouver quelques enseignants et chercheurs de l’Université de Liège (ULg) et de leur parler de l’importance de la recherche en linguistique pour le développement d’outils de vérification linguistique tels que ceux que nous créons pour les utilisateurs d’Office. L’Ecole…

1

Lorsque les langues meurent…

Mon collègue James Lyle parlait récemment des langues en danger sur l’autre blog de notre équipe il y a quelques jours. Je viens de terminer la lecture du nouveau livre de David Harrison, intitulé “When Languages Die – The Extinction of the World’s Languages and the Erosion of Human Knowledge”, que j’ai découvert via le…

1

Un correcteur orthographique et grammatical breton pour Office 2007

Mon collègue Franck Halmaert relaie l’information sur son blog ce week-end: http://blogs.microsoft.fr/franckha/archive/2007/09/15/62532.aspx Les utilisateurs d’Office 2007 peuvent désormais télécharger gratuitement un correcteur orthographique et grammatical breton sur le site http://www.drouizig.org/. Avec un dictionnaire de 60.000 lemmes représentant 1,5 million de formes fléchies, ce correcteur, développé par l’association de bénévoles An Drouizig, qui promeut la langue bretonne,…

5