Extraction Contextuelle de Concepts Ontologiques pour le Web Sémantique - IC 2007 : 18èmes Journées francophones d'Ingénierie des Connaissances
Communication Dans Un Congrès Année : 2007

Extraction Contextuelle de Concepts Ontologiques pour le Web Sémantique

Lobna Karoui
  • Fonction : Auteur
Nacéra Bennacer Seghouani

Résumé

De nombreux travaux de recherche, s'intéressant à l'annotation, l'intégration des données, les services web, etc. reposent sur les ontologies. Le développement de ces applications dépend de la richesse conceptuelle des ontologies. Dans cet article, nous présentons l'extraction des concepts ontologiques à partir de documents HTML. Afin d'améliorer ce processus, nous proposons un algorithme de clustering hiérarchique non supervisé intitulé " Extraction de Concepts Ontologiques " (ECO) ; celui-ci utilise d'une façon incrémentale l'algorithme de partitionnement Kmeans et est guidé par un contexte structurel. Ce dernier exploite la structure HTML ainsi que la position du mot afin d'optimiser la pondération de chaque terme ainsi que la sélection du co-occurrent le plus proche sémantiquement. Guidé par ce contexte, notre algorithme adopte un processus incrémental assurant un raffinement successif des contextes de chaque mot. Il offre, également, le choix entre une exécution entièrement automatique ou interactive. Nous avons expérimenté notre proposition sur un corpus du domaine du tourisme en français. Les résultats ont montré que notre algorithme améliore la qualité conceptuelle ainsi que la pertinence des concepts ontologiques extraits.
Fichier principal
Vignette du fichier
Karoui.pdf (259.44 Ko) Télécharger le fichier
Origine Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00218213 , version 1 (04-07-2014)

Identifiants

  • HAL Id : hal-00218213 , version 1

Citer

Lobna Karoui, Marie-Aude Aufaure, Nacéra Bennacer Seghouani. Extraction Contextuelle de Concepts Ontologiques pour le Web Sémantique. Ingénierie des connaissances - 2007, Jul 2007, France. pp.97-108. ⟨hal-00218213⟩
128 Consultations
165 Téléchargements

Partager

More