IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Api pour identifer le type d'un contenu


Sujet :

Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre éclairé
    Inscrit en
    Juin 2007
    Messages
    453
    Détails du profil
    Informations forums :
    Inscription : Juin 2007
    Messages : 453
    Par défaut Api pour identifer le type d'un contenu
    Bonjour,

    Je cherche un api python qui permet d'identifier le type d'un texte donné en entrée. En d'autre termes, une fonction permettant de dire par exemple si le contenu d'un texte donnée en entrée est de type email, page html ou autre.

    Toute information sera le bienvenue.

    Une alternative est de chercher un api me permettant de dire, en lui donnant un texte comme entrée, s'il s'agit d'un email ou non... ou passer par les regex comme dernière solution.


    Merci beaucoup d'avance.

  2. #2
    Membre chevronné
    Homme Profil pro
    Développeur banc de test
    Inscrit en
    Mai 2014
    Messages
    199
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Développeur banc de test
    Secteur : High Tech - Électronique et micro-électronique

    Informations forums :
    Inscription : Mai 2014
    Messages : 199
    Par défaut
    Bonjour,

    pour détecter le format d'un fichier/contenu il existe la librairie "magic" qui en analysant l'en-tête normalisé d'un format sera capable de déterminer son type.


    https://pypi.python.org/pypi/python-magic/

    This module uses ctypes to access the libmagic file type identification library. It makes use of the local magic database and supports both textual and MIME-type output.
    https://github.com/ahupp/python-magic

    python-magic is a python interface to the libmagic file type identification library. libmagic identifies file types by checking their headers according to a predefined list of file types. This functionality is exposed to the command line by the Unix command file.
    Voici un sujet sur StackOverflow qui en parle : https://stackoverflow.com/questions/...file-in-python

  3. #3
    Membre éclairé
    Inscrit en
    Juin 2007
    Messages
    453
    Détails du profil
    Informations forums :
    Inscription : Juin 2007
    Messages : 453
    Par défaut
    Je vous remercie pour votre réponse rapide. L'api magic est apparemment fonctionnel et pratique pour surtout les contenus HTTP alors que mon entrée est un contenu textuel extrait d'un fichier texte.

    Si vous avez une autre idée sur d'autres api, je serai vraiement reconnaissant. Merci beaucoup d'avance.

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo