Centre de Calcul et des Systèmes d'Information

La recherche

Les activité de recherche menées au CCSI s'articulent autour de trois thématiques :

1) Interfaces Homme-Machine et protocoles pour les outils de Calcul Symbolique

L'objectif est l'amélioration des interfaces utilisateurs et le développement de protocoles de communication et d'architectures distribuées optimisés pour le Calcul Symbolique.
En termes d'interfaces utilisateurs, les problèmes abordés concernent la visualisation et la manipulation de données structurées spécifiques (formules mathématiques, matrices, preuves, etc.) ; la gestion des sessions de calcul formel qui s'apparentent tantôt a un arbre de preuve, tantôt à une suite ordonnée de commandes ; le développement de techniques originales pour améliorer le trace de courbes et de surfaces (exactitude des images obtenues, possibilités d'interaction avec le dessin, minimisation des temps de calcul, de transfert et d'affichage).
Dans le domaine des protocoles de communication pour les outils de calcul symbolique, nous avons participé au développement de MP (précurseur des actuels MathML et OpenMath), puis du framework IAMC (Internet-Accessible Mathematical Computation) dont plusieurs briques logicielles sont à la base du projet WME (voir ci-dessous).

 

2) Technologies de l'Information et de la Communication pour l'Enseignement

Le CCSI participe au projet WME (Web-based Mathematics Education) mené par le Prof. Paul S. Wang (Kent State Univ., USA). Le but de ce projet est de faciliter le développement de contenus pédagogiques interactifs pour l'enseignement des Mathématiques élémentaires sur le modèle du web, c'est à dire en simplifiant au maximum les possibilités de création et de ré-utilisation de contenus par les enseignants, y compris de contenus fortement interactifs dont la réalisation est relativement coûteuse.
 

3) Filtres de messagerie (SPAM)

Dans les applications typiques de classement à l'aide des méthodes d'apprentissage automatique, la démarche habituelle débute par la constitution d'un ensemble d'exemples pour, ensuite, mettre au point des algorithmes de classement.
Dans le cas du filtrage de spam, il s'agit de constituer un corpus avec une quantité suffisante des messages récents, représentatifs de la boîte aux lettres de l'utilisateur. Dans des communautés importantes et/ou hétérogènes, l'utilisation de messages réels n'est pas envisageable surtout pour des raisons de confidentialité.
Notre démarche est l'inverse : concentrer nos efforts sur la modélisation des données (les messages) plutôt que sur l'optimisation du classificateur. L'objectif de notre recherche est la constitution d'un corpus synthétique de messages, pour l'apprentissage d'un filtre anti-spam, avec des caractéristiques statistiques, vues par les classificateurs, suffisamment proches de celles d'un corpus de messages réels, de façon à ce que l'efficacité du classificateur reste, dans ces conditions, encore satisfaisante.
 

Principales publications :

 

Les autres pages du CCSI sur   MINES ParisTech   Intranet   Wiki
Plan du site | Contact Webmaster | © Mines ParisTech - CCSI
2011 | © Mines ParisTech - CCSI