X

La technologie ‘speech-to-text for video’ de Google

Exemple d’interface speech-to-text for video de Google

Je recherche des chaussures rouges dans une vidéo !

Lors du ParisWeb 2007, Jean-Louis Carvès nous avait présenté les solutions en cours concernant la retranscription des vidéos ainsi que celles pour le sous-titrage vidéo, dont une belle solution IBM déjà en place.

Google annonce également - et étonnamment ? - plancher sur le sujet, sous la forme 'communicante' de modeste contribution aux élections présidentielles américaines...

L'annonce des prémices concrets du projet a été faite sur le blog officiel. Et l'application concrète est disponible en ligne à cette adresse d'où est extraite la capture du visuel : http://speech.clients.google.com/elections2008videosearch/gadget

La reconnaissance vocale pour la retranscription et le sous-titrage vidéo
Google, via Youtube (imaginez le panel !) est capable d’utiliser ce genre de technologie dans le domaine de la recherche d’informations sur le net ! On peut alors parler d’accessibilité numérique de la vidéo en ligne car le service est capable de faire une recherche sur un mot, sur une citation, sur le sous-titrage ou sur la retranscription textuelle de la vidéo.

Les techniciens sont en train de mettre au point la recherche de texte au sein des vidéos...
Mais la démonstration en ligne indique dorénavant :

  • que l'on ne peut faire de recherche que sur des vidéos politiques made in USA :)
  • que le pointeur jaune précise dans la timeline chaque fois que le mot recherché est prononcé dans la vidéo (parfois un petit peu décalé)
  • que cette fonctionnalité n’est disponible pour l’instant qu’avec le widget iGoogle (inscription) et que vous êtes invités à y déposer votre avis !

Alors ? Bientôt la recherche de "chaussures rouges" offrira des réponses vidéo pointant sur le time-code ?

Merci à Aurélien Denis pour cette veille

3 commentaires sur cet article De “La technologie ‘speech-to-text for video’ de Google”

  1. goetsu 21 juillet 2008 à 17 h 01 min

    Pour info ce genre de choses est déjà en place sur les cours en ligne du MIT
    http://web.sls.csail.mit.edu/lectures/

  2. Christophe 21 juillet 2008 à 17 h 22 min

    Je regarde Real et je recommence :)

Laisser un commentaire

Votre nom *
Votre mail *
Site internet
Message

Nous contacter

Pour nous (re)joindre

captcha

Coordonnées

NEOMA interactive by Linagora
100 Terrasse Boieldieu
Tour Franklin
92042 Paris - La Défense Cedex
France
(+33) 1 46 96 63 63