[CFP...]
C'est une évidence que de dire que nous sommes entrés dans une ère ou la donnée textuelle sous toute ses formes submerge
chacun de nous que ce soit dans son environnement personnel ou professionnel : l'augmentation croissante de documents
nécessaires aux entreprises ou aux administrations, la profusion de données textuelles disponibles via Internet,
le développement des données en libre accès (OpenData), les bibliothèques et archives en lignes,
les medias sociaux ne sont que quelques exemples illustrant l'évolution de la notion de texte, sa diversité et sa prolifération.
Face à cela les méthodes automatiques de fouille de données (data mining), et plus spécifiquement celles de fouille de textes (text mining) sont devenues incontournables.
Récemment, les méthodes de deep learning ont créées de nouvelles possibilités de recherche pour traiter des données massives et de grandes dimensions.
Cependant, de nombreuses questions restent en suspens, par exemple en ce qui concerne la gestion de gros corpus textuels multi-thématiques.
Pouvoir disposer d’outils d’analyse textuelle efficaces, capables de s’adapter à de gros volumes de données, souvent de nature hétérogène,
rarement structurés, dans des langues variées, des domaines très spécialisés ou au contraire de l'ordre du langage naturel reste un challenge.
La fouille de textes couvre de multiples domaines comme le traitement automatique des langues, l'intelligence artificielle, la linguistique,
les statistiques, l'informatique...et les applications sont très diversifiées, que ce soit la recherche d'information, le filtrage de spam,
le marketing, la veille scientifique ou économique, la lutte antiterroriste ...
En France, des conférences comme TALN, CORIA, JADT par exemple sont centrées sur l'analyse et le traitement des textes,
mais avec des approches plus ciblées soit TAL, soit RI, soit statistiques.
Cet atelier se veut plus fédérateur autour d'approches et d'applications aussi diverses que possibles.
Le but de cet atelier est de réunir des chercheurs sur la thématique large de la fouille de textes. Cet atelier vise
à offrir une occasion de rencontres pour les universitaires et les industriels, appartenant aux différentes communautés
de l'intelligence artificielle, l'apprentissage automatique, le traitement automatique des langues,
pour discuter des méthodes de fouille de texte au sens large et de leurs applications.
Format de l’atelier :
L'objectif de cet atelier est de favoriser des présentations et des discussions. Peuvent être soumis :
- des résumés étendus (4 pages)
- des articles longs (maximum 12 pages)
- des propositions de démonstration logicielles (4 pages)
Les contributions seront publiées sous forme d’actes en ligne (avec ISBN).
La soumission de prises de position bien articulées, d’expériences industrielles et de travaux en cours sont les bienvenus et privilégiés.
Des contributions portant sur l'intérêt pratique des travaux, qu'elles viennent de l'industrie ou du monde académique, ou présentant des collaborations entre les deux seraient appréciées.
Le but est le partage d’expérience et de savoir sur les problématiques liées à la fouille de textes.
Pour les démonstrations : une présentation orale aménagée devra être préparée (temps de présentation plus court, et temps pour effectuer
la démo sur projecteur en fin de présentation). Un temps sera aussi prévu dans le programme pour les démos.
* le format à utiliser est le même que pour EGC
Principaux thèmes (liste non limitative) :
- Méthodes de traitement automatique de la langue (TAL)
- Classifications statiques de textes
- Classifications dynamiques de textes
- Méthodes d'apprentissage
- Approches par graphes
- Recherche d'information
- Indexation
- Détection d'entités nommées
- Résumé automatique
- Détection de nouveautés
- Analyse de sentiments
...
Liste des domaines d'application (liste non limitative) :
- Fouille de documents scientifiques
- Données médicales
- Brevets
- Analyse d'opinions
- Media sociaux (Twitter…)
- Veille scientifiques
- Intelligence économique
- Appui au pilotage scientifique
- Bibliométrie
- Systèmes (à base) de dialogues
- ...
Proceedings:
à venir
Contacts:
Pascal Cuxac, - INIST - CNRS
2 allée du Parc de Brabois, CS 10310, 54519 Vandœuvre les Nancy Cedex
Email : pascal.cuxac[at]inist.fr,
ResearchGate: [...]
GoogleScholar: [...]
Homepage: [...]
Vincent Lemaire - Orange Labs
2 avenue Pierre Marzin, 2300 Lannion
Email: vincent.lemaire[at]orange.com,
Homepage: [...]
Jean-Charles Lamirel - LORIA – SYNALP Research Team
Campus Scientifique, BP. 239, 54506 Vandoeuvre les Nancy Cedex
Email : lamirel[at]loria.fr,
ResearchGate: [...]
Comité de programme (en cours d'élaboration, ordre alphabétique):
- Patrice Bellot LSIS Marseille
- Guillaume Cabanac IRIT Toulouse
- Martine Cadot Loria Nancy
- Mariane Clausel LJK Grenoble
- Vincent Claveau IRISA Rennes
- Guillaume Cleuziou LIFO Orléans
- Gaël Dias Greyc Caen
- Dominique Gay U. Réunion Saint Denis de la Réunion
- Natalia Grabar STL – Lille3 Lille
- Brigite Grau LIMSI Orsay
- Mustapha Lebbah LIPN Paris
- Denis Maurel LIT Tours
- Patrick Paroubeck LIMSI Orsay
- David Reymond i3N Toulon – Nice
- Mathieu Roche LIRMM Montpellier
- Jacques Savoy U. Neuchatel Neuchatel
- Isabelle Tellier Sorbonne Paris
- Julien Velcin ERIC Lyon
Tarifs d'inscription
La participation à l'atelier seul (avec repas du midi) ou avec la conférence principale est définie par EGC.