IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Analyse textuelle sous R


Sujet :

R

  1. #1
    Membre à l'essai
    Homme Profil pro
    IUT de Metz
    Inscrit en
    Juin 2014
    Messages
    22
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 33
    Localisation : France, Moselle (Lorraine)

    Informations professionnelles :
    Activité : IUT de Metz
    Secteur : Distribution

    Informations forums :
    Inscription : Juin 2014
    Messages : 22
    Points : 15
    Points
    15
    Par défaut Analyse textuelle sous R
    Bonjour,

    Je travaille en ce moment pour une entreprise qui souhaite réaliser de l'analyse textuelle sous R, j'ai commencé à travailler avec le package tm et effectué de la lémmatisation (racine des mots uniquement d'un corpus), des nuages de mots, un tableau avec le nombre d’occurrences de chaque mot dans un corpus... Mais je n'ai pas connaissance des autres analyses. Si quelqu'un connaît bien ce package de R je serais très intéressé de pouvoir faire encore plus d'analyses.
    Merci de votre aide.

    Jérémie

  2. #2
    Membre éprouvé

    Homme Profil pro
    Cyber Security & AI
    Inscrit en
    Février 2009
    Messages
    506
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Cyber Security & AI

    Informations forums :
    Inscription : Février 2009
    Messages : 506
    Points : 1 189
    Points
    1 189
    Billets dans le blog
    2
    Par défaut
    Bonjour,

    Tu peux faire d'autre type d'analyse textuelle, mais R n'est pas toujours l'outil le plus adapté pour l'analyse textuelle. À mes yeux, tu poses deux questions. La première concernant le package tm. Pour cela tu as la documentation. La seconde est de façon générale. Que peut-on faire ou ne pas faire avec R ? Selon la langue avec laquelle tu travailles la réponse ne sera pas la même. Si tu travailles sur de l'anglais, tu auras beaucoup plus de possibilités que si tu travailles avec du français. Concernant les statistiques et les textes, tu peux faire des nuages de mots, mais aussi du clustering sur les textes pour déterminer les thèmes ou plus simplement si tu as des spams. Tu peux faire aussi du résumer automatiques. Mais, ces dernières méthodes peuvent faire appelle à des techniques du discourt ou plus généralement du Traiment Automatiques du langage qui dépasse le cadre des statistiques.

    Je réponds de façon générale à ta question et cela ne répond peut-être pas bien à ta demande alors n'hésite pas à préciser ta question.

    Cordialement.

  3. #3
    Membre à l'essai
    Homme Profil pro
    IUT de Metz
    Inscrit en
    Juin 2014
    Messages
    22
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 33
    Localisation : France, Moselle (Lorraine)

    Informations professionnelles :
    Activité : IUT de Metz
    Secteur : Distribution

    Informations forums :
    Inscription : Juin 2014
    Messages : 22
    Points : 15
    Points
    15
    Par défaut
    Bonjour,

    Pour être plus précis, tout mon travail statistique se déroule sur R. Et il m'est demandé maintenant de m'entraîner sur de l'analyse textuelle toujours sur R. Donc je voulais savoir si quelqu'un avait déjà utilisé le package tm pour savoir comment produire tout ce dont il est capable comme analyse statistique car les tutoriels en anglais ne sont pas toujours facile à comprendre. J'ai déjà effectué de la lemmatisation (garder la racine des mots), des nuages de mots mais j'ai vu d'autres possibilités, notamment choisir un mot et voir avec quels autres mots il est corrélé, comparaison du nombre d’occurrences des mots entre les textes, ...

    Tout mon travail de statistique doit être automatisé et dans plusieurs langues, c'est pour cela que je travaille avec R.

    Jérémie

  4. #4
    Membre éprouvé

    Homme Profil pro
    Cyber Security & AI
    Inscrit en
    Février 2009
    Messages
    506
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Cyber Security & AI

    Informations forums :
    Inscription : Février 2009
    Messages : 506
    Points : 1 189
    Points
    1 189
    Billets dans le blog
    2
    Par défaut
    Jérémie,

    Wordnet est présent sur R avec tu peux faire de l'analyse grammaticale.
    RTextureMetrics, je ne connais pas.
    RTextTools peut aussi permettre de la clusterisation de texte avec R.
    Tu as un module Rcmdr pour tm.

    Concernant tm je pense que tu as énuméré ses possibilités.

    Tu as aussi rtemis et txm que je découvre avec toi.

    Cordialement.

  5. #5
    Membre à l'essai
    Homme Profil pro
    IUT de Metz
    Inscrit en
    Juin 2014
    Messages
    22
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 33
    Localisation : France, Moselle (Lorraine)

    Informations professionnelles :
    Activité : IUT de Metz
    Secteur : Distribution

    Informations forums :
    Inscription : Juin 2014
    Messages : 22
    Points : 15
    Points
    15
    Par défaut
    Bonjour,

    Oui j'ai déjà aperçu ses noms. J'y jetterai un œil si jamais les analyses avec tm me paraissent insuffisantes.

    Jérémie

Discussions similaires

  1. Réponses: 6
    Dernier message: 17/01/2007, 12h30
  2. Requête analyse croisée sous SQL SERVER
    Par motus_z dans le forum MS SQL Server
    Réponses: 2
    Dernier message: 23/02/2006, 16h54
  3. Comment faire une analyse croisée sous MySQL ?
    Par jcachico dans le forum Requêtes
    Réponses: 1
    Dernier message: 05/12/2005, 18h32
  4. Requêtes analyses croisées sous SQL Server 2000
    Par callo dans le forum MS SQL Server
    Réponses: 3
    Dernier message: 24/09/2005, 19h27

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo