Extraction Contextuelle de Concepts Ontologiques pour le Web Sémantique

Lobna Karoui; Marie-Aude Aufaure; Nacéra Bennacer Seghouani

Communication Dans Un Congrès Année : 2007

Extraction Contextuelle de Concepts Ontologiques pour le Web Sémantique

(1) , (1) , (1)

Lobna Karoui

Fonction : Auteur

SUPELEC-Campus Gif

Marie-Aude Aufaure

Fonction : Auteur

SUPELEC-Campus Gif

Nacéra Bennacer Seghouani

Fonction : Auteur
PersonId : 5306
IdHAL : bennacer
ORCID : 0000-0002-7320-0316
IdRef : 140470409

SUPELEC-Campus Gif

Résumé

De nombreux travaux de recherche, s'intéressant à l'annotation, l'intégration des données, les services web, etc. reposent sur les ontologies. Le développement de ces applications dépend de la richesse conceptuelle des ontologies. Dans cet article, nous présentons l'extraction des concepts ontologiques à partir de documents HTML. Afin d'améliorer ce processus, nous proposons un algorithme de clustering hiérarchique non supervisé intitulé " Extraction de Concepts Ontologiques " (ECO) ; celui-ci utilise d'une façon incrémentale l'algorithme de partitionnement Kmeans et est guidé par un contexte structurel. Ce dernier exploite la structure HTML ainsi que la position du mot afin d'optimiser la pondération de chaque terme ainsi que la sélection du co-occurrent le plus proche sémantiquement. Guidé par ce contexte, notre algorithme adopte un processus incrémental assurant un raffinement successif des contextes de chaque mot. Il offre, également, le choix entre une exécution entièrement automatique ou interactive. Nous avons expérimenté notre proposition sur un corpus du domaine du tourisme en français. Les résultats ont montré que notre algorithme améliore la qualité conceptuelle ainsi que la pertinence des concepts ontologiques extraits.

Mots clés

Ingénierie des connaissances Ontologies Contexte

Domaines

Apprentissage [cs.LG] Intelligence artificielle [cs.AI] Traitement du texte et du document Web

Fichier principal

Karoui.pdf (259.44 Ko)

Origine	Fichiers produits par l'(les) auteur(s)

Evelyne Faivre : Connectez-vous pour contacter le contributeur

https://centralesupelec.hal.science/hal-00218213

Soumis le : vendredi 4 juillet 2014-10:32:02

Dernière modification le : mardi 14 février 2023-03:35:34

Archivage à long terme le : lundi 12 octobre 2015-11:32:49

Dates et versions

hal-00218213 , version 1 (04-07-2014)

Identifiants

HAL Id : hal-00218213 , version 1

Citer

Lobna Karoui, Marie-Aude Aufaure, Nacéra Bennacer Seghouani. Extraction Contextuelle de Concepts Ontologiques pour le Web Sémantique. Ingénierie des connaissances - 2007, Jul 2007, France. pp.97-108. ⟨hal-00218213⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

SUPELEC IC IC_2007 CENTRALESUPELEC

128 Consultations

165 Téléchargements

Extraction Contextuelle de Concepts Ontologiques pour le Web Sémantique

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager