Fouille de Textes - Text Mine

New ! La préparation de l'atelier avance à grand pas. Pour l'atelier TextMine nous avons eu le plaisir d'accepter 5 soumissions. Chacune d'elle a fait l'objet de 2 ou 3 relectures grâce à nos gentils relecteurs. Nous aurons de plus un exposé invité. Le programme de l'atelier est à présent en ligne [ici ...]

[CFP...]

Résumé

Après le succès des ateliers TextMine en 2017 et 2018, nous proposons un troisième numéro TextMine'19 lors de la conférence EGC'19 qui se tiendra à Metz. Le but de cet atelier est de réunir des chercheurs sur la thématique large de la fouille de textes. Cet atelier vise à offrir une occasion de rencontres pour les universitaires et les industriels, appartenant aux différentes communautés de l'intelligence artificielle, l'apprentissage automatique, le traitement automatique des langues, afin de discuter des méthodes de fouille de texte au sens large et de leurs applications.

Descriptif : C'est une évidence que de dire que nous sommes entrés dans une ère ou la donnée textuelle sous toute ses formes submerge chacun de nous que ce soit dans son environnement personnel ou professionnel : l'augmentation croissante de documents nécessaires aux entreprises ou aux administrations, la profusion de données textuelles disponibles via Internet, le développement des données en libre accès (Open Data), les bibliothèques et archives en lignes, les media sociaux ne sont que quelques exemples illustrant l'évolution de la notion de texte, sa diversité et sa prolifération

Face à cela les méthodes automatiques de fouille de données (data mining), et plus spécifiquement celles de fouille de textes (text mining) sont devenues incontournables. Récemment, les méthodes de deep learning ont créées de nouvelles possibilités de recherche pour traiter des données massives et de grandes dimensions. Cependant, de nombreuses questions restent en suspens, par exemple en ce qui concerne la gestion de gros corpus textuels multi-thématiques. Pouvoir disposer d’outils d’analyse textuelle efficaces, capables de s’adapter à de gros volumes de données, souvent de nature hétérogène, rarement structurés, dans des langues variées, des domaines très spécialisés ou au contraire de l'ordre du langage naturel reste un challenge.

La fouille de textes couvre de multiples domaines comme le traitement automatique des langues, l'intelligence artificielle, la linguistique, les statistiques, l'informatique...et les applications sont très diversifiées, que ce soit la recherche d'information, le filtrage de spam, le marketing, la veille scientifique ou économique, la lutte antiterroriste … En France, des conférences comme TALN, CORIA, JADT par exemple sont centrées sur l'analyse et le traitement des textes, mais avec des approches plus ciblées soit TAL, soit RI, soit statistiques. Cet atelier se veut plus fédérateur autour d'approches et d'applications aussi diverses que possibles.

Format de l’atelier :

L'objectif de cet atelier est de favoriser des présentations et des discussions. Peuvent être soumis :

des résumés étendus (4 pages)
des articles longs (maximum 12 pages)
des propositions de démonstration logicielles (4 pages)

Les contributions seront publiées sous forme d’actes en ligne (avec ISBN). La soumission de prises de position bien articulées, d’expériences industrielles et de travaux en cours sont les bienvenus et privilégiés. Des contributions portant sur l'intérêt pratique des travaux, qu'elles viennent de l'industrie ou du monde académique, ou présentant des collaborations entre les deux seraient appréciées. Le but est le partage d’expérience et de savoir sur les problématiques liées à la fouille de textes. Pour les démonstrations : une présentation orale aménagée devra être préparée (temps de présentation plus court, et temps pour effectuer la démo sur projecteur en fin de présentation). Un temps sera aussi prévu dans le programme pour les démos.

* le format à utiliser est le même que pour EGC

Principaux thèmes (liste non limitative) :

Méthodes de traitement automatique de la langue (TAL)
Classifications statiques de textes
Classifications dynamiques de textes
Méthodes d'apprentissage
Approches par graphes
Recherche d'information
Indexation
Détection d'entités nommées
Résumé automatique
Détection de nouveautés
Analyse de sentiments

Liste des domaines d'application (liste non limitative) :

Fouille de documents scientifiques
Données médicales
Brevets
Analyse d'opinions
Media sociaux (Twitter…)
Veille scientifiques
Intelligence économique
Appui au pilotage scientifique
Bibliométrie
Systèmes (à base) de dialogues
...

Public cible : Tout public : universitaires, organismes de recherche, industriels,...

Proceedings: à venir

Contacts:

Pascal Cuxac

[...]

Vincent Lemaire

[...]

Comité de programme (en cours d'élaboration, ordre alphabétique):

Guillaume Cabanac IRIT Toulouse
Mariane Clausel LJK Grenoble
Vincent Claveau IRISA Rennes
Guillaume Cleuziou LIFO Orléans
Dominique Gay U. Réunion St Denis de la Réunion
Natalia Grabar STL – Lille3 Lille
Mustapha Lebbah LIPN Paris
Denis Maurel LIT Tours
Patrick Paroubeck LIMSI Orsay
David Reymond i3N Toulon – Nice
Julien Velcin ERIC Lyon

Tarifs d'inscription

La participation à l'atelier seul (avec repas du midi) ou avec la conférence principale est définie par EGC.