Catherine Recanati

Recherches

Autres domaines d'intérêt

Publications

Activités diverses


Projets

- Labex EFL, Empirical Foundations of Linguistics (ANR 2011-2021)
- IDEX USPC (2012-2016), Projet Informatique en ligne
 - groupe de recherche Kairos depuis 2010, projet exploratoire pluridisciplinaire Mathématiques-Informatique-Linguistique sur les expressions linguistiques associées aux séries calendaires déictiques et anaphoriques dans une perspective typologique.
- Projet PEPS "Relations", 2008
- Projet LIPN/Numsight "WebMining", 2001-2002.

Activités de recherches interrompues de 1996 à 2001 pour raisons de santé
- Projet CogniSeine CREA/LIPN/DASSAULT Aviation, "Modélisation cognitive de la représentation du temps et de l'espace dans la compréhension et la production du langage", 1993-96.
- Projet CNET/LIPN, "Utilisation de stratégies de reformulation pour accroître la convivialité des systèmes interactifs en langage naturel", 1993.
-
Projet européen Esprit STAPLE (directeur du Projet). Responsable pour NSL du développement d'un éditeur syntaxique textuel et graphique pour un langage fonctionnel typé dans un système muni d'une base de données persistantes et d'un format de données partagé par tous les outils du système (éditeur, compilateur, etc.) afin d'optimiser la mise en mémoire et les traductions internes de fichiers d'un format dans un autre, 1987-90.
- Projet européen Esprit CHAMELEON. Contribution à la modélisation d'un système permettant de faire migrer des processus Scheme sur un réseau de machines Unix, 1986-87.
- Participation à la définition ergonomique de Wish, un Shell iconique Unix développé à NSL (pour Atari), 1988-90.

Retour en haut de page


Encadrements d'étudiants

- Stage de Master 2 MICR de Adel ben Mertah (LIPN, 2009) "Langage pseudo naturel comportant des expressions spatiales (et/ou temporelles) pour un dialogue homme-machine multimodal".
- Stage de
Master 2 MICR de Nicoleta Rogovschi (LIPN, 2006), avec  Y. Bennani. Titre : "Apprentissage numérique non-supervisé pour la fouille de données textuelles : analyse de l'usage des temps dans le discours" (rapport.pdf).
- Stage de DEA de Jord Novion (LIPN, 1995) sur l'utilisation de représentations iconiques dans les systèmes inférentiels.
- Stage de DEA de Karim Benchabane (LIPN, 1995) sur le traitement de l'aspect dans la DRT, basé sur les travaux de C. Smith.
- Thèse de Yong-Hong Chen (LRI-NSL) sur l'édition de programmes dirigée par la syntaxe, de 1989 à 1991.
- Stage de DEA de Yong-Hong Chen (LRI, Université Paris 11) sur un éditeur graphique de syntaxe abstraite, en 1988.


Etude des Systèmes de Représentations Hétérogènes

Le champ naturel d'application des SRH recouvre de nombreuses branches de l'intelligence artificielle, allant de la physique qualitative et la robotique, à la modélisation cognitive du raisonnement, la recherche d'information et l'analyse du langage naturel. Nous souhaitons démontrer la pertinence de l'approche dans des domaines variés. 

Raisonner avec des diagrammes dans des Systèmes de Représentations Hétérogènes (SRH)

Bien que largement utilisés dans les raisonnements, que ce soit pour résoudre des problèmes en physique, en mathématiques ou en logique, les diagrammes et les représentations visuelles en général, ont souffert de la réputation de n'être qu'un outil heuristique dans la recherche de solutions, sorte de simple support pour l'intuition. Mais c'est oublier que les diagrammes peuvent aussi être vus comme des objets syntaxiques pouvant se prêter à des raisonnements logiques dans une perspective formelle. Si l'on adopte ce point de vue, le rejet des représentations diagrammatiques au profit des seules représentations linguistiques, apparaît comme un préjugé dont il convient de se défaire. Cette conviction, qu'une théorie générale des inférences valides peut-être développée indépendamment des modes de représentations, a été défendue  par Barwise et Etchemendy dans les années 90, pour aboutir à la démonstration (faite dans la thèse de Shin en 1994), qu'un système de représentations diagrammatiques, inspiré des diagrammes de Venn et Peirce, pouvait être démontré formellement valide et complet dans le cadre usuel de la logique, en utilisant des règles de manipulation de diagrammes elles-mêmes graphiques (effacement, union, etc.).

Le but à long terme de ce projet est de poursuivre les travaux qui ont contribué à désamorcer ce préjugé des logiciens contre les diagrammes, et de défendre l'intérêt des systèmes de représentations diagrammatiques (i.e. des systèmes comportant à la fois des représentations diagrammatiques et des représentations linguistiques) dans les modélisations cognitives, et dans le domaine de l'Informatique, en Intelligence Artificielle et en Informatique Fondamentale (=Programmation).

Dans le n°40 d'Intellectica, nous avons fait pour commencer un état de l'art sur l'opposition textes/diagrammes, et nous avons isolé plusieurs caractéristiques des représentations diagrammatiques. Notre analyse nous a conduit à défendre que certains types de représentations ont par certains aspects des propriétés antinomiques, et nous soutenons que seuls des systèmes de représentations hétérogènes (SRH), c'est-à-dire articulant des sous-systèmes manipulant des représentations possédant des aspects symboliques ou iconiques (c'est-à-dire grossièrement où la forme du symbole utilisé au sein de la représentation détermine le calcul) - que donc seul ce type de systèmes "hybrides" ou "hétérogènes" relativement aux  langages ou représentations utilisés, peuvent permettre de construire des modèles computationnellement et cognitivement plausibles.

Nous poursuivons aujourd'hui notre exploration de ce domaine de recherche, en particulier en sémantique des langages, naturels ou artificiels.

Retour en haut de page


Sémantique du langage naturel

Background

Parallèlement à mes études de mathématiques et d'informatique, j'ai suivi de nombreux cours et participé à des séminaires de recherche en sémantique, principalement ceux d'Oswald Ducrot (sur l'argumentation) et celui de Gilles Fauconnier (sémantique cognitive). J'ai aussi assisté à nombreuses conférences de philosophie du langage, de pragmatique et de sémantique. Je me suis  intéressée aux représentations spatiales (Vandeloise, Talmy) et j'ai complété ma formation initiale en suivant  divers cours de logique ou de linguistique (Mchombo en syntaxe, Fillmore pour Construction Grammar et la lexicographie, mais aussi Mel'cuk, Keenan, etc.). J'ai participé à de nombreux séminaires ou groupes de travaux (Fillmore, Jurafski, L-zero à ICSI) et suivi les cours de Master de certains collègues au LIPN (Vauzeilles en logique linéaire,  Y. Bennani en réseaux de neurones).

Recherches sur le temps et l'aspect

- De 1993 à 1996, j'ai travaillé sur les catégories verbales et l'analyse du temps et de l'aspect. Mon travail sur les verbes et les temps grammaticaux a donné lieu à un exposé sur les catégories de Vendler en mai 1996, à une Conférence à Bruxelles en 1997 et et à une publication en collaboration avec François Recanati dans les Cahiers Chronos en 1999. J'ai réinvesti depuis 2005 cette thématique en participant au groupe "Temps et aspect" du GDR Sémantique et Modélisation (semantique.free.fr), pour tenter de formuler mes propres intuitions (schémas divers) en les raccrochant aux termes ou aux problèmes qui avaient cours à cette époque en sémantique formelle.
- J'envisageais parallèlement (depuis 2006) la possibilité d'utiliser des techniques d'apprentissage numérique et de l'apprentissage non supervisé pour découvrir des motifs de structuration de textes ou de discours. Une première tentative concernant les suites de verbes (réduits à leur temps grammatical et à leur catégorie lexicale aspectuelle) a été menée avec succès, en utilisant le corpus de constats d'accidents de la MAIF qui avait souvent servi à l'équipe RCLN  (stage de Nicoleta Rogovschi, "Apprentissage numérique non-supervisé pour la fouille de données textuelles : analyse de l'usage des temps dans le discours"). Il y a là matière à d'autres expérimentations minimalistes pour la modélisation de dialogues.
- J'ai également été membre du groupe de recherche Kairos de 2010 à 2014. Il s'agissait d'un projet exploratoire pluridisciplinaire Mathématiques-Informatique-Linguistique sur les expressions linguistiques associées aux séries calendaires déictiques et anaphoriques dans une perspective typologique.

Je reprends aujourd'hui cette ancienne thématique dans le but de d'étudier des ontologies iconiques pour la définition de SRH.

Retour en haut de page

Sémantique des langages et Programmation

Mes premières recherches ont portées sur la Programmation et les langages de programmation. J'ai implémenté en Lisp (stage de DEA) un langage orienté objet que j'ai défini (MPL, construit comme extension de Mering), puis j'ai commencé ma thèse par une étude bibliographique de 6 mois sur les très nombreux langages orientés objets de l'époque. Pour des raisons contingentes, j'ai dû changer de direction et de sujet de thèse, et me suis alors penchée sur la correction et l'efficacité de l'implémentation des changements d'environnements en lisp, dans le but de définir un lisp correct sémantiquement et plus rapide que ses concurrents.

Dans ce travail de thèse, j'ai d'abord étudié le lambda-calcul et la sémantique des lambda interprètes, afin de définir un lisp "propre". Le résultat a été la définition et l'implantation en C d'un interprète paresseux nommé Lambdix, qui implantait l'appel par nécessité (call by need) de manière efficace. L'avantage de ce type d'appel est que l'on peut  manipuler des structures de données potentiellement infinies (définies récursivement) et faire de l'évaluation partielle contextualisée par les données. Lambdix est né en même temps que Scheme, que je n'ai découvert qu'au moment de la rédaction de ma thèse. Bien que ces deux langages soient très voisins dans l'esprit (but = éliminer les effets pervers des laisons dynamiques non contrôlées d'alors en cas d'argument de type fonction), l'originalité de Lambdix demeure car elle réside en réalité dans son modèle de gestion des environnements, qui est très efficace et qui lui est propre. En Lambdix, le coût de la restauration d'un environnement est indépendant de l'environnement d'appel, car borné (par la profondeur de sa définition lexicale).

Je m'intéresse toujours à la Programmation et à la sémantique des langages de programmation, mais aujourd'hui dans ses aspects de modélisation d'architecture, pour des programmes ou des modélisations ne s'appliquant pas nécessairement à la programmation.

Recherches à Non Standard Logics (1986-1990)

A mon arrivée à NSL en 1986, j'ai d'abord participé au projet Esprit CHAMELEON, en contribuant à la modélisation d'un système permettant de faire migrer des processus actifs sur un réseau de machines UNIX. L'implantation du système était fondée sur les compétences de Alain Deutsch, mais j'ai contribué à la rédaction des rapports techniques, en exprimant la sémantique dénotationnelle du système à l'aide de deux opérateurs réflexifs. Je tiens à rendre hommage ici à Alain qui est mort prématurément (41 ans!) en 2006, après une trajectoire qu'on pourra qualifier d'exemplaire à bien des égards et qui l'aura conduit à fonder sa propre entreprise Polyspace Technologies, aujourd'hui rachetée/hébergée par The MathWorks sous le sigle PolySpace.

A mon retour de congé maternité, j'ai été en charge du projet Esprit STAPLE. L'un des buts du projet était de montrer que la programmation fonctionnelle pouvait utilement être intégrée à un système de données persistantes pour améliorer la productivité du développement de programmes de taille industrielle. J'ai été d'abord responsable du projet pour NSL, puis nommée directeur du projet en 1988  -  suite à l'abandon du projet par l'un des partenaires industriels.

Dans ce projet, l'Université de StAndrews avait spécifié un langage fonctionnel typé voisin de Miranda dont l'implémentation (compilateur, etc.) devait s'intégrer à une base de données persistantes. Ce langage implantait des mécanismes de persistance (technologie développée à Edinbourg), et tous les éléments du système (programmes, données, compilateur, éditeur, etc.) étaient stockés dans la base et partageaient les mêmes types de données - objets structurés, et décrits par une même syntaxe "abstraite". J'ai été chargée de la spécification et de l'implantation d'un éditeur syntaxique graphique pour ce langage typé.  Cet éditeur permettait l'affichage des programmes comme textes, arbres (graphiques), ou dans un format de représentation mixte utilisant à la fois du texte et des arbres selon le désir de l'utilisateur, pour afficher des blocs de programme. Le méta-éditeur que j'ai développé, ABSYNTHE, permettait en fait la génération automatiquement d'un éditeur polymorphe, obtenu à partir de specifications de langages divers (donnés sous forme de syntaxe abstraite et de descriptions de syntaxes concrètes permettant d'en afficher une forme visualisable). ABSYNTHE était voisin  de Mentor (ou son successeur Centaur) développé à Sophia Antipolis.

A NSL, j'ai parallèlement participé à la conception graphique et ergonomique de deux logiciels d'avant garde : Wish, un Shell iconique développé pour Atari (sur une idée originale de M. Beaudouin Lafon) et XFaceMaker, tout premier éditeur graphique et interactif de programmes qui générait du code Motif pour la définition d'interface graphique. XFaceMaker était la version commerciale de Grafiti, prototype développé par S. Karsenti dans sa thèse, dirigée par M. Beaudouin Lafon. J'ai également acquis à cette époque des compétences de programmation avec X-Window en participant aux sessions de formation pour ingénieurs proposées par NSL.

Retour en haut de page
en constructionle reste est en cours de construction ...