Vous êtes ici : Accueil > Recherche : Thèmes > VIF : Visualisation, ...

VIF : Visualisation, Indexation & Fouille de données

Visualisation, Indexation & fouille de données

Positionnement général

L'axe de recherche "Visualisation,Indexation & Fouille de données" crée, développe et évalue conjointement des outils semi supervisés de description, de segmentation, de classification, d'analyse et de visualisation de données adaptées à de très grands corpus multimédia, afin d'en faciliter l'accès, la consultation et le contrôle.

L'originalité de ce thème de recherche réside dans la prise en compte de deux contraintes données par le contexte d'usage de l'Ina. L'Ina compte 150 documentalistes experts. Notre ambition est d'assister ces experts proposant des IHM basées sur la visualisation interactive et les systèmes d'apprentissage. Cette approche est validée par une politique d'évaluation systématique des prototypes développés auprès des experts. Le volume des collections de l'Ina et de l'Inathèque comprend des centaines de milliers d'heures déjà archivées, et quelques 100 chaînes en flux entrant. La prise en compte de l'échelle des données à traiter est au centre de nos travaux.

Les activités de recherche couvrent la conception de descripteurs multimodaux et de mesures de similarité, les technologies de recherche dans de très grandes bases de descripteurs, la conception de méthodes d'active learning, la visualisation et l'IHM. Les modules développés sont intégrés dans des prototypes expérimentaux internes et/ou projets nationaux ou européens et permettent de réaliser de nombreuses applications telles que l'analyse de corpus de JT, la structuration de flux télévisuels, de programmes ou de collections, la classification d'images, ou le moteur de recherche multimodale.

 

Activités et Résultats en images

Indexer, fouiller et visualiser, Pourquoi faire ?

L’art de Trouver ce que l’on cherche…

dans des bases numériques immenses de contenus multimodaux et multi support
de manière directe, itérative, progressive, suggérée…
avec des points de vue spécifiques & variables

 

 

La sérendipité ou l’art de Trouver ce que l’on ne cherche pas…

« La notion de bibliothèque est fondée sur un malentendu, à savoir qu’on irait à la bibliothèque pour chercher un livre dont on connaît le titre. C’est vrai que cela arrive souvent, mais la fonction essentielle de la bibliothèque, de la mienne et de celle des amis à qui je rends visite, c’est de découvrir des livres dont on ne soupçonnait pas l’existence et dont on découvre qu’ils ont pour nous la plus grande importance…»   U.Eco, de bibliotheca

 

Projet ANR 2010: L’Observatoire Transmedia
Etude de la diversité et de la circulation de l’information sur les différents Media par l’analyse des flux d’évènements médiatiques (Radio, TV, Web, presse, dépêches AFP, twitter)

Objets de Recherche :

  • Description des contenus,
  • moteurs de recherche,
  • classification aggrégation,
  • visualisation dynamique de données temporelles,
  • Évaluations

 


Résultats : des outils pour l'accès et l'Analyse de très gros volumes de données multimedia

Des outils de description des contenus média

Descripteurs globaux (couleur, texture, directions principales…) 


       
Descripteurs locaux (points saillants, symétries…) (1000/image)



Des outils numériques d’organisation des descriptions

Les moteurs de recherche vectoriels permettent de retrouver des éléments proches dans des organisations de milliards de descripteurs

Application : Recherche de Logos
100 000 images (Belga property; projet VITALAS) 20 millions de descripteurs
Similarité visuelle de partie d’images


Des Outils de Visualisation de corpus & collection

Carte de L’offre grand public INA: 60000 documents
Recherche textuelle « cinéma » &  marquage des résultats


Des outils d’analyse automatique et de visualisation de programmes

carte du JT, FR2


Des outils d’analyse automatique  et  de visualisation du flux audiovisuel



 

 

 

 

 

 

Les sites de l'ina
Accéder aux sites de l'Ina
OK