Une approche symbolique pour l'extraction d'informations dans un corpus restreint de textes médicaux
Nicolas Hiot  1@  
1 : Laboratoire dÍnformatique Fondamentale dÓrléans
Université d'Orléans : EA4022, Institut National des Sciences Appliquées - Centre Val de Loire : EA4022, Institut National des Sciences Appliquées

Le domaine médical représente un challenge important pour la tâche d'extraction d'informations. Il existe un grand nombre de documents textuels comme des contes rendu ou des description d'effets secondaire. Il est très difficile pour les membres du corps médicale et pour les chercheurs de trouver facilement l'information souhaitée. Nous travaillons sur l'extraction automatique des informations dans ces textes dans le but de construire des bases de connaissance plus facile a interroger et sur lesquels il sera possible de résonner.

Ces textes diffèrent des taches d'extraction habituelles par leur richesse en informations et leur langage technique et propre au domaine. À l'heure ou l'état de l'art se concentre sur l'apprentissage automatique et les réseaux de neurones, nous proposons une approche symbolique qui nous permet d'obtenir des résultats corrects pour un corpus restreint. En effet, il est très difficile de constituer un corpus de grande taille du domaine médical à cause de la diversité des textes et de leur disponibilité réduite causé par les données sensibles et personnelles qu'ils contiennent.


Personnes connectées : 2 Vie privée
Chargement...