English description of the project

apprentissage coopératif semi-Supervisé de concepts Multimédias pour l'Aide à la Catégorisation et la détection de Concepts


La recherche d'entités sur Internet est un problème qui a pris une dimension particulière avec l'augmentation rapide des volumes de contenus multimédia. Si les techniques d'identification sont relativement mures sur le texte, la diversité de forme des objets multimédia est bien plus difficile à modéliser. Cette difficulté de modélisation conduit généralement à augmenter considérablement la quantité de données nécessaires à l'estimation d'identifieurs robustes, et le coût de cette annotation limite très fortement l'usage des techniques statistiques dont l'efficacité est, pourtant, avérée sur ce type de problèmes. D'autre part, les concepts (ou entités) susceptibles d'être recherchés se projettent de façon très variable sur les différents supports audio, texte ou vidéo et la conception de méthodes génériques constitue un verrou scientifique majeure de l'identification multimédia. SuMACC propose d'explorer des stratégies d'apprentissage originales pour l'identification d'entités multimédias à partir de patrons d'identification. L'utilisation des patrons offre un cadre unifié dans lequel différentes règles de combinaison peuvent être formulées. Dans ce contexte, des approches faiblement supervisées seront proposées pour l'estimation de la signature du concept sur chacun des médias. Nous développerons les techniques d'apprentissage actif et de co-apprentissage inter-média, avec pour objectif une diminution considérable de l'effort de supervision de l'apprentissage. Ces techniques seront évaluées dans le cadre du portail Wikio, qui offre des possibilités de structuration initiale des données et d'évaluation en conditions réelles. Le projet SuMACC abordera toutes ces questions au sein d'un projet de Recherche Fondamentale de 36 mois mené par le Laboratoire Informatique d'Avignon (LIA - Université d'Avignon) en partenariat avec EURECOM et les sociétés Syllabs et Wikio.