IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Multimédia Java Discussion :

fichier .srt sous-titrage video


Sujet :

Multimédia Java

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Inactif
    Profil pro
    Inscrit en
    Avril 2012
    Messages
    96
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2012
    Messages : 96
    Par défaut fichier .srt sous-titrage video
    Bonjour,
    est ce que vous connaissez des moyens (methodes, algorithmes) pour la segmentation de texte pour les genres de fichier .srt (transcription de la bade sonore d'une video) ?
    L'objectif est d'avoir des segments de texte coherents et "continu" par rapport au contenu:
    par exemple, sur le fichier de depart, si on considere chaque partie comme etant un segment, on aura, le segment 1 qui fini dans le deux, ...

    Je veux un moyen de re-structurer le fichier en segment et en ayant pour chaque segement, l'heure de debut et celle de la fin.

    Exemple fichier
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
     
    1
    00:00:00,000 --> 00:00:04,052
    Now that we know about the one-time pad,
    let's talk about making the one-time pad
     
    2
    00:00:04,052 --> 00:00:08,088
    more practical using something called the
    stream cypher. But before we do that,
     
    3
    00:00:08,088 --> 00:00:13,057
    let's do a quick review of where we were.
    So let me just remind you that a cypher is
     
    4
    00:00:13,057 --> 00:00:18,020
    defined over a triple of sets called a key
    space, a message space, and a cypher text
     
    5
    00:00:18,020 --> 00:00:22,039
    bare space. And a cypher is a pair of
    efficient algorithms called E and D; E
     
    6
    00:00:22,039 --> 00:00:27,008
    stands for encryption and D stands for
    decryption. And the only property. That we

  2. #2
    Modérateur

    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    12 582
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 12 582
    Par défaut
    Ben, ton fichier est déjà comme ça, non ?

    (Par ailleurs, l'idée n'est pas forcément bonne. Parfois un sous-titre est trop long pour qu'on puisse raisonnablement l'enlever avant d'afficher le suivant.)
    N'oubliez pas de consulter les FAQ Java et les cours et tutoriels Java

  3. #3
    Inactif
    Profil pro
    Inscrit en
    Avril 2012
    Messages
    96
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2012
    Messages : 96
    Par défaut
    En fait, j'ai un algorithme pour resumer une video, il selectionne les segments (selon des scores).
    Si je considere cette segmentation, l'algorithme peut par exemple selectionner les segments 1 et 4 mais pas 2,ni 3 ... ainsi de suite, et dans ce cas j'aurais des trous par ce que j'aurais des phrases inachées.

    Pour la longueur des sous-titres dans mon cas, ils ne depasse pas 8 seconde.
    PJ: fichier .srt
    Fichiers attachés Fichiers attachés

  4. #4
    Modérateur

    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    12 582
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 12 582
    Par défaut
    Ça suffit pas de donner juste un fichier.
    - Quel genre de fichier as-tu au départ
    - Qu'est-ce qui ne te convient pas
    - Quel genre de fichier cherches-tu à avoir à la place ?

    Enfin quoi, tu te doutes bien qu'on va pas le deviner.
    N'oubliez pas de consulter les FAQ Java et les cours et tutoriels Java

  5. #5
    Inactif
    Profil pro
    Inscrit en
    Avril 2012
    Messages
    96
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2012
    Messages : 96
    Par défaut
    Citation Envoyé par thelvin Voir le message
    Ça suffit pas de donner juste un fichier.
    - Quel genre de fichier as-tu au départ
    - Qu'est-ce qui ne te convient pas
    - Quel genre de fichier cherches-tu à avoir à la place ?

    Enfin quoi, tu te doutes bien qu'on va pas le deviner.
    Je ne joue pas au devinette ici, depuis le debut je parle de segmentation.

    Le fichier de depart est le fichier joint en post3.
    Ce qui ne me convient pas, c'est ce que j'ai cité plus haut, à savoir ne pas avoir des segments contenants des phrases interrompues.

  6. #6
    Modérateur

    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    12 582
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 12 582
    Par défaut
    Autant que possible, je voudrais ne pas épiloguer, mais tu devrais te rendre compte que "phrase" est un mot-clé important qui a à peine été abordé, alors que "segmentation" est secondaire.
    Ton problème, c'est que des "phrases" sont "coupées" en cela qu'elles sont "réparties" dans plusieurs "trucs." Alors qu'il faudrait qu'elles soient "entières" dans un seul "truc."

    Bon, et puis tu ne nous as pas parlé de ce que tu cherches à produire comme "version corrigée" :
    - un autre fichier .srt qui est pile comme tu veux ?
    - une correction en ligne pendant que tu lis le fichier ?
    - Comment tu détermines le début et la fin d'une phrase, au juste ? Il suffit d'un point qui manque et tout tombe par terre ?
    - Une fois qu'une phrase a été reconstituée en un seul endroit, qu'est-ce qui décide de l'heure où elle a commencé et où elle a fini ? Peut-être que ce n'est pas important pour ton fameux algorithme ?

    Pour t'aider à parser un fichier .srt, tu peux t'inspirer de google-video-subtitles-parser vu que Google utilise les .srt.
    Ou alors emprunter la classe SrtParser de la bibli mp4parser, en respectant sa license quand même.
    N'oubliez pas de consulter les FAQ Java et les cours et tutoriels Java

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Éditeur de sous-titres (fichier .srt).
    Par Batman90 dans le forum Développement Web en Java
    Réponses: 2
    Dernier message: 26/10/2017, 20h57
  2. Modification d'un sous-titrage video en live
    Par levit dans le forum Flash
    Réponses: 15
    Dernier message: 29/03/2007, 21h03
  3. Réponses: 5
    Dernier message: 06/03/2003, 13h27

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo