IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

JavaScript Discussion :

Synchronisation audio-vidéo dans une application de traduction vidéo


Sujet :

JavaScript

  1. #1
    Candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Mai 2025
    Messages
    3
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 23
    Localisation : Cameroun

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2025
    Messages : 3
    Par défaut Synchronisation audio-vidéo dans une application de traduction vidéo
    Bonjour tout le monde, je suis nouveau dans la communauté et je me permet de vous soumettre un problème que j'ai rencontré en travaillant sur un projet.

    Contexte :
    Je développe une application Node.js (Express) qui traduit des vidéos YouTube en convertissant l'audio original en une autre langue. Le processus fonctionne comme suit :

    Extraction de l'audio de la vidéo YouTube
    Transcription du texte avec Whisper API
    Traduction du texte vers la langue cible avec OpenAI
    Synthèse vocale du texte traduit
    Fusion de l'audio traduit avec la vidéo originale via FFmpeg

    Problème :

    L'audio traduit et la vidéo originale ne sont pas correctement synchronisés. La durée de l'audio traduit est souvent différente de celle de la vidéo originale, ce qui cause un décalage progressif entre le son et l'image.

    Détails techniques :

    J'utilise FFmpeg pour la fusion avec la commande : ffmpeg -i "video.mp4" -i "audio.mp3" -c:v copy -map 0:v:0 -map 1:a:0 "output.mp4"
    J'ai précédemment essayé d'ajuster automatiquement la vitesse de l'audio traduit pour correspondre à la durée de la vidéo, mais cette approche a été abandonnée
    Le paramètre -shortest a été supprimé pour éviter que la vidéo ne soit tronquée

    Solutions déjà tentées :

    Ajustement automatique de la vitesse de l'audio (abandonné)
    Modification des paramètres FFmpeg
    Suppression du paramètre -shortest

    Question :

    Quelle serait la meilleure approche pour synchroniser l'audio traduit avec la vidéo originale sans déformer la voix ni tronquer la vidéo ? Y a-t-il des techniques FFmpeg spécifiques ou d'autres outils que je devrais considérer ?

    Cordialement

  2. #2
    Expert confirmé
    Avatar de mathieu
    Profil pro
    Inscrit en
    Juin 2003
    Messages
    10 644
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2003
    Messages : 10 644
    Par défaut
    si j'ai bien compris, l'audio traduit est juste une suite de phrases collées les unes après les autres. et donc ces phrases sont parfois en retard sur la vidéo et parfois en avance ?

    une première étape serait qu'au moment d'extraire les phrases, il faudrait associer à chaque phrase la position dans la vidéo.
    et à la fin, il faut générer un son où chaque phrase traduite sera à la même position que la phrase d'origine.

  3. #3
    Candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Mai 2025
    Messages
    3
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 23
    Localisation : Cameroun

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2025
    Messages : 3
    Par défaut
    Citation Envoyé par mathieu Voir le message
    si j'ai bien compris, l'audio traduit est juste une suite de phrases collées les unes après les autres. et donc ces phrases sont parfois en retard sur la vidéo et parfois en avance ?

    une première étape serait qu'au moment d'extraire les phrases, il faudrait associer à chaque phrase la position dans la vidéo.
    et à la fin, il faut générer un son où chaque phrase traduite sera à la même position que la phrase d'origine.
    Oui oui c'est exactement cela, l'audio traduit est juste une suite de phrases collées les unes après les autres. D'accord merci beaucoup pour votre aide, j'essaye cette méthode et je vous reviendrai.
    Merci.

  4. #4
    Candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Mai 2025
    Messages
    3
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 23
    Localisation : Cameroun

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2025
    Messages : 3
    Par défaut Retour
    Citation Envoyé par mathieu Voir le message
    si j'ai bien compris, l'audio traduit est juste une suite de phrases collées les unes après les autres. et donc ces phrases sont parfois en retard sur la vidéo et parfois en avance ?

    une première étape serait qu'au moment d'extraire les phrases, il faudrait associer à chaque phrase la position dans la vidéo.
    et à la fin, il faut générer un son où chaque phrase traduite sera à la même position que la phrase d'origine.
    Bonjour ou Bonsoir Mr Mathieu, comme promis je vous fait mon retour après application de votre proposition. J'ai une bonne nouvelle car cette méthode a fonctionné, le rendu final est désormais bien mieux qu'au paravent. Néanmoins il arrive souvent que l'audio se désynchronise à un moment donné de la vidéo( soit plus lent, soit plus rapide que par rapport à l'audio original ).

    J'estime le rendu de synchronisation actuel à 80%. j'essaierai de l'améliorer davantage. Si vous avez d'autres suggestions et conseils je serais ravi de les écouter.

    Encore une fois merci beaucoup de votre aide.

Discussions similaires

  1. [AUDIO]Integrer son dans une application
    Par guxou dans le forum Multimédia
    Réponses: 0
    Dernier message: 14/04/2009, 19h00
  2. Traduction anglais-français dans une application
    Par shirya dans le forum VB.NET
    Réponses: 3
    Dernier message: 21/11/2008, 10h21
  3. Réponses: 8
    Dernier message: 17/03/2004, 14h40
  4. Licence MySql en tant que BD dans une application web
    Par Volta dans le forum SQL Procédural
    Réponses: 3
    Dernier message: 26/02/2004, 14h38
  5. fenetre dos dans une application
    Par jfb53 dans le forum C++Builder
    Réponses: 3
    Dernier message: 19/10/2003, 18h06

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo