IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Statistiques, Data Mining et Data Science Discussion :

textmining pour des images ?!


Sujet :

Statistiques, Data Mining et Data Science

  1. #1
    Membre à l'essai
    Homme Profil pro
    Inscrit en
    Octobre 2011
    Messages
    47
    Détails du profil
    Informations personnelles :
    Sexe : Homme

    Informations forums :
    Inscription : Octobre 2011
    Messages : 47
    Points : 24
    Points
    24
    Par défaut textmining pour des images ?!
    bonsoir à tous

    je ne sais pas si ma question fait rire mais en fait j'ai des pdfs contenant des textes je veux savoir si un certain mot ou des mots se répètent dans tous les pdfs via le textmning ( si cela est permi ou logique bien sûr je suis nouveau dans ce domaine) mais le problème est que je ne peux pas chercher ni copier du texte dans les pdfs si je copie le collage est une image je crois donc que les ifchiers sources sont des images que faire dans ce cas pour savoir si un mot se répète dans tous les documents ?
    merci d'avance pour toute réponse

  2. #2
    Expert éminent sénior
    Avatar de Jipété
    Profil pro
    Inscrit en
    Juillet 2006
    Messages
    10 725
    Détails du profil
    Informations personnelles :
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations forums :
    Inscription : Juillet 2006
    Messages : 10 725
    Points : 15 126
    Points
    15 126
    Par défaut
    Salut,

    Citation Envoyé par prince 1990 Voir le message
    mais le problème est que je ne peux pas chercher ni copier du texte dans les pdfs, si je copie le collage est une image ; je crois donc que les fichiers sources sont des images. Que faire dans ce cas pour savoir si un mot se répète dans tous les documents ?
    Hé bien déjà tu pourrais te documenter un peu plus sur les pdfs, parce qu'ils ne sont pas tous comme ceux dont tu parles ci-dessus.

    Par exemple, j'ai récupéré ce qui suit à la va-vite dans un pdf parlant des... pdfs, lol !, simplement en sélectionnant tout à la souris puis "clic droit / copier"
    En janvier 2005, l’associa-
    tion PDFX-ready fut créée à
    l'aide d’un large soutien de
    l’industrie graphique (voir
    encadré). Cette initiative
    suisse a pour but d’aider
    la norme ISO 15930, plus
    connue sous PDF/X, à percer
    dans l’échange de docu-
    ments PDF. La norme ISO
    PDF/X promet de rendre les
    processus de production
    dans l’industrie graphique
    plus sûrs et plus efficaces.
    Comme tu peux le voir, il s'agit de texte tout simple.

    Maintenant, si tu n'as que des images (et c'est peut-être lié aux pdfs qu'on te fournit pour faire le travail), hé bien il te restera la solution d'extraire les images et de les transformer en texte avec un logiciel d'OCR, texte que tu pourras alors analyser.

    Attention, selon la qualité des images, ça fonctionnera bien ou mal : les logiciels d'OCR sont chatouilleux sur la qualité des images à traiter.
    Il a à vivre sa vie comme ça et il est mûr sur ce mur se creusant la tête : peutêtre qu'il peut être sûr, etc.
    Oui, je milite pour l'orthographe et le respect du trait d'union à l'impératif.
    Après avoir posté, relisez-vous ! Et en cas d'erreur ou d'oubli, il existe un bouton « Modifier », à utiliser sans modération
    On a des lois pour protéger les remboursements aux faiseurs d’argent. On n’en a pas pour empêcher un être humain de mourir de misère.
    Mes 2 cts,
    --
    jp

Discussions similaires

  1. Propriété CSS pour des images liens
    Par Imp rusg dans le forum Mise en page CSS
    Réponses: 8
    Dernier message: 07/02/2009, 11h22
  2. Chemin relatif pour des images dans formulaire
    Par Marcopololo dans le forum IHM
    Réponses: 3
    Dernier message: 23/07/2008, 04h50
  3. [Upload] Script PHP pour des images
    Par bodysplash007 dans le forum Langage
    Réponses: 4
    Dernier message: 21/05/2007, 20h39
  4. Un composant pour des Images
    Par ChPr dans le forum NetBeans
    Réponses: 3
    Dernier message: 10/04/2007, 13h18
  5. Réponses: 8
    Dernier message: 19/04/2005, 12h04

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo