IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Algorithmes et structures de données Discussion :

Retrouvez des personnes qui se "connaissent"


Sujet :

Algorithmes et structures de données

  1. #1
    Membre éprouvé
    Inscrit en
    Avril 2005
    Messages
    1 110
    Détails du profil
    Informations forums :
    Inscription : Avril 2005
    Messages : 1 110
    Points : 937
    Points
    937
    Par défaut Retrouvez des personnes qui se "connaissent"
    Imaginons une base de données avec des personnes et leur curiculum vitae. J'aimerais trouver les personnes qui se "connaissent" entre elles.

    Je m'explique.

    Imaginons que deux personnes aient faites leur études dans la même fac. Il y a des chances qu'elles se connaissent. Bon, évidemment, si une y a été dans les années 60 et l'autre dans les années 80, il y a peu de chance. Mais si elles y ont été en même temps, on a plus de chances.
    Autre exemple, les boites dans lesquelles elles auraient travaillé. Des personnes ont peut-être travaillé dans la même boîte à un moment donné. Elles ont donc des chances de se connaitre. Si de plus on sait qu'elles ont travaillé dans le même département de cette même boîte, on a plus de chances encore.

    Idéalement il faudrait que cela soit précalculé afin d'avoir des réponses rapides. Ainsi, pour une personne, je pourrais obtenir une liste de personnes par ordre décroissant de probabilité qui auraient pu la rencontrer à un moment donné de leur vie.

    Merci.

  2. #2
    Rédacteur

    Avatar de khayyam90
    Homme Profil pro
    Architecte de système d’information
    Inscrit en
    Janvier 2004
    Messages
    10 369
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 39
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Architecte de système d’information

    Informations forums :
    Inscription : Janvier 2004
    Messages : 10 369
    Points : 40 164
    Points
    40 164
    Par défaut Re: Retrouvez des personnes qui se "connaissent"
    Citation Envoyé par camboui
    Imaginons une base de données avec des personnes et leur curiculum vitae. J'aimerais trouver les personnes qui se "connaissent" entre elles.

    Je m'explique.

    Imaginons que deux personnes aient faites leur études dans la même fac. Il y a des chances qu'elles se connaissent. Bon, évidemment, si une y a été dans les années 60 et l'autre dans les années 80, il y a peu de chance. Mais si elles y ont été en même temps, on a plus de chances.
    Autre exemple, les boites dans lesquelles elles auraient travaillé. Des personnes ont peut-être travaillé dans la même boîte à un moment donné. Elles ont donc des chances de se connaitre. Si de plus on sait qu'elles ont travaillé dans le même département de cette même boîte, on a plus de chances encore.

    Idéalement il faudrait que cela soit précalculé afin d'avoir des réponses rapides. Ainsi, pour une personne, je pourrais obtenir une liste de personnes par ordre décroissant de probabilité qui auraient pu la rencontrer à un moment donné de leur vie.

    Merci.
    et tu cherches a realiser ce genre d'application ?
    tu cherches un site qui propose ce genre de services ?

  3. #3
    Membre expert Avatar de KiLVaiDeN
    Profil pro
    Inscrit en
    Octobre 2003
    Messages
    2 851
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2003
    Messages : 2 851
    Points : 3 481
    Points
    3 481
    Par défaut
    Tu pourrais aussi aller plus loin : deux personnes qui ont le même loisir ( ping pong par exemple ) on des chances de se connaitre. Mais en plus, si elles vivent dans le même quartier, elles auraient pu fréquenter le même club !

    Plus sérieusement, c'est à mon avis une information "interessante", mais absolument pas fiable. Il y aura des cas ou ton algorithme te retournera une correspondance alors qu'il n'y en a aucune, et d'autres cas où ce sera l'inverse, comme tu dis, il s'agit d'un "pourcentage de chance", mais dans ce cas, un algorithme est-il necessaire ? Tu peux tout aussi bien implémenter un programme qui produira des correspondances aléatoirement

    Bon... Mais si tu insistes dans ton projet ! Ce que je ferais à ta place, c'est la chose suivante : une table "lieu_de_rencontre", qui contiendrait tous les lieux propices à une rencontre et un pourcentage de chance de se rencontrer, puis une table "presence_dans_lieu" ou tu aurais l"id du lieu de rencontre, l"id de la personne, et la date debut date fin. ainsi, tu pourrais faire une requete faisant correspondre les dates pour un même lieu qui te retournerait la liste des personnes qui ont une chance de se rencontrer.
    K

  4. #4
    Membre averti Avatar de xxiemeciel
    Inscrit en
    Juin 2005
    Messages
    371
    Détails du profil
    Informations forums :
    Inscription : Juin 2005
    Messages : 371
    Points : 352
    Points
    352
    Par défaut
    Salut,

    Il faudrait que tout tes CVs soit concu sur le meme modele pour pouvoir retrouver les information spécifiques dont tu parles et les comparer. Malheureusement dans la realite il n'y a pas un CV qui se ressemble. Comment vas tu comparer par exemple celui qui marque UNSA a celui qui a marqué Université de Nice Sophia Antipolis.

    Sinon je rejoins ce qu'a dit KiLVaiDeN l'informatition risque de ne pas etre fiable, tu peux toujours offrir des statisitques ou utiliser de la logique floue pour savoir si de personnes ont des chances de se connaitre.

    XXiemeciel
    XXiemeciel

  5. #5
    Membre expert Avatar de KiLVaiDeN
    Profil pro
    Inscrit en
    Octobre 2003
    Messages
    2 851
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2003
    Messages : 2 851
    Points : 3 481
    Points
    3 481
    Par défaut
    Oui de toutes manières tu ne pourras pas faire un traitement automatique d'une base de CV sans qu'ils soient normalisés dans leur format, comme le dit xxiemciel. Je n'ai même pas parlé de la chose, car ça me parraissait évident, un traitement informatique ne peut s'appliquer que sur des éléments formatté de manière homogène, à moins de faire des mécanismes complexes et à tolérance d'erreur qui ne sont plus de l'informatique pure, mais de l'intelligence artificielle.

    Ce qu'il faut faire ( si tu veux venir à bout de ce projet ) c'est à partir de l'ébauche de modèle que je t'ai donné ( ou avec un modèle ressemblant, plus fins ) tu pourrais proposer une interface de saisie qui permettrait de choisir un "lieu de rencontre" parmi la liste des lieux existants ( tu peux aussi les catégoriser pour mieux les retrouver ) ou permettre d'en rajouter un nouveau, si le lieu n'existe pas, et de préciser la date debut date fin du lieu, avec une chance estimé de rencontre entre deux personnes ayant été dans le même lieu pour la même durée... c'est quand même assez tordu et subjectif, mais ça devrait répondre à ce que tu cherches comme fonctionnement, j'imagine que ça peut quand même être une application interessante au final, surtout lorsque la base de CV est importante et que le travail de saisie a été fait convenablement
    K

  6. #6
    Membre éprouvé
    Inscrit en
    Avril 2005
    Messages
    1 110
    Détails du profil
    Informations forums :
    Inscription : Avril 2005
    Messages : 1 110
    Points : 937
    Points
    937
    Par défaut
    Alors oui, je cherche à réaliser ce genre d'application.

    Je dispose d'une DB existante que d'autres ont pris la peine d'encoder. Je peux en extraire tous les critères qu'on croira utile pour établir des relations entre personnes. "UNSA" ou "Université de Nice Sophia Antipolis" ne pose donc aucun problème, les encodeurs ayant en principe fait leur boulot correctement.
    Ce n'est pas à moi à juger de la qualité du résultat, mais à l'utilisateur.

    L'exemple du club est même bien plus significatif que celui des études ou des boîtes fréquentées. Si je disposais de ce genre d'info dans ma DB, croyez-moi, il y en a qui sont prêts à payer des fortunes pour les obtenir.

    Bref, j'ai un ensemble de critères qui peuvent servir à établir la probabilité que deux personnes se "connaissent" (affiliation à un parti politique, membre honoraire d'une ONG, etc). Les critères ne sont donc pas uniquement géographiques ou temporels. Une pondération pourra être attribuée à chacun de ces critères afin d'obtenir une "probabilité globale".

  7. #7
    Expert confirmé

    Profil pro
    Inscrit en
    Mai 2005
    Messages
    3 419
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2005
    Messages : 3 419
    Points : 4 297
    Points
    4 297
    Par défaut
    deux questions de méthode vont se poser

    la transitivité pierre connait paul qui ne connait pas pierre
    exemple dans une tentreprise de plus de 1000 personnes
    pierre connait paul pdg avec lequel il a parlé au cocktail de la campagne
    supervendeur, paul ne connait pas pierre pour autant
    par contre pierre connait nathalie la pulpeuse hotesse d'accueil de l'hotel x
    où il descend chaque semaine, nathale ne le connait pas, mais connait
    partick bruel à côté de qui elle a voyagé en train en 2001

    l'oubli pierre reconnait paul qui a scalpé la prof d'allemand en première
    paul ne reconnait pas pierre qui a obtenu une moyenne de 19 en allemand cette année là
    quand à antoine et claude assis côte à côte cette année là ils se sont
    entr'oubliés
    Elle est pas belle la vie ?

  8. #8
    Membre expert Avatar de KiLVaiDeN
    Profil pro
    Inscrit en
    Octobre 2003
    Messages
    2 851
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2003
    Messages : 2 851
    Points : 3 481
    Points
    3 481
    Par défaut
    En fait, plus que les problèmes de cohérences des données, et de tous les problèmes évoqués, ce qui me gène c'est de ne pas trouver de réponse à la question : "pourquoi faire?"

    En gros, le but c'est de mettre des relations pondérées entre les gens; pour les placer ensemble dans des mêmes missions ? pour ne PAS les placer ensembles dans des mêmes missions ? Dans le but d'obtenir de meilleurs résultats par rapport aux équipes ? Pour faire semblant d'avoir des relations, en citant des noms/prénoms de gens que la personne serait succeptible de connaitre ? Pour "tracer" les gens ? Obtenir des informations transverses ?

    Je ne pige pas trop, mais en tout cas, je pense qu'on est en plein dans l'invention d'une application à but purement subjectif !
    K

  9. #9
    Membre éprouvé
    Inscrit en
    Avril 2005
    Messages
    1 110
    Détails du profil
    Informations forums :
    Inscription : Avril 2005
    Messages : 1 110
    Points : 937
    Points
    937
    Par défaut
    "Pourquoi"?
    Simple... On me paye pour.

    Plus intélectuellement parlant, le projet semble intéressant et pourrait être étendu à d'autres types de données.
    En fait ici, je dispose d'une DB objective de laquelle je dois extraire des relations entre enregistrements.
    On pourrait par exemple avoir une DB de recettes de cuisine et se demander pour une recette donnée celles qui lui "ressemblent", soit par ses ingrédients, son temps de préparation, son coût, ses origines culturelles, que sais-je quoi d'autre.

    L'utilisation finale sera sans doute très subjective. Peu importe pour moi.
    De mon coté, les critères sont objectifs. Deux personnes qui ont fréquenté la même université, y ont fait les mêmes études, et obtenu le même diplome, doivent être mises en relation. Si, de plus, elles sont toutes les deux socialistes et supporters du PSG, alors la relation est encore plus "forte". Et si, de plus, chacune a épousé une femme, les deux femmes étant soeurs jumelles, alors je vous dis pas si la relation est vraiment très forte

    Vous voyez le topo?
    Bref, it faut faire abstraction du type de donnée et de leur finalité commerciale.
    Moi, je suis juste le maître d'oeuvre qui va triturer une DB "objective".

    Pour tout vous avouer, je ne sais pas trop ce que le client va en faire exactement. C'est un service supplémentaire qu'il va proposer à ses propres clients. Il pourra dire: "vous voyez, notre produit permet aussi de faire ça, ça et ça". C'est finalement peut-être une fonctionalité inutile à usage marketing. Qui sait?

  10. #10
    Membre expert Avatar de KiLVaiDeN
    Profil pro
    Inscrit en
    Octobre 2003
    Messages
    2 851
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2003
    Messages : 2 851
    Points : 3 481
    Points
    3 481
    Par défaut
    Salut

    Et des frères jumeaux siamois, tu y as pensé ?? eux ils vont avoir une relation 100% concrète !

    Blague à part, je comprend ton point de vue. Pour un informaticien, il est difficile de contester le travail qui nous est donné, même si "éthiquement" il ne nous interesse pas.

    Cependant; c'est quand même dangereux de faire des choses sans avoir d'opinion. Quand tu dis que tu t'en moques, ça me fait peur, car toi en tant que citoyen sur lequel ce "jugement de relation" pourrait être porté tu t'en moques, imagines les petits informaticiens brésiliens ou indiens, ils s'en moquent triplement; pourtant faire des applications en gardant son intégrité, bien que difficile, est vers quoi nous devrions nous orienter, je trouve
    K

  11. #11
    Membre expert
    Avatar de 2Eurocents
    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    2 177
    Détails du profil
    Informations personnelles :
    Âge : 54
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 2 177
    Points : 3 166
    Points
    3 166
    Par défaut
    Ce que tu veux faire ressemble à de "l'analyse par grappe", ou "cluster analysis", non ?

    Dans ce cas, la principale difficulté va peut être provenir du (très) grand nombre de critères de rapprochement utilisable.

    L'autre principale difficulté sera peut être effectivement d'ordre légal, en fonction de la nature des informations stockées dans la base, de celles qui seront croisées, et de l'exploitation qui en sera faite. Les traitements automatisés de données nominatives sont quand même très sévèrement encadrés par la loi "Informatique et Liberté". Il me semble même me souvenir qu'une lecture extensive de la loi interdisait toute gestion d'informations nominatives par "profil".
    La FAQ Perl est par ici
    : La fonction "Rechercher", on aurait dû la nommer "Retrouver" - essayez et vous verrez pourquoi !

  12. #12
    Membre éprouvé
    Inscrit en
    Avril 2005
    Messages
    1 110
    Détails du profil
    Informations forums :
    Inscription : Avril 2005
    Messages : 1 110
    Points : 937
    Points
    937
    Par défaut
    Citation Envoyé par KiLVaiDeN
    Salut

    Et des frères jumeaux siamois, tu y as pensé ?? eux ils vont avoir une relation 100% concrète !

    Blague à part, je comprend ton point de vue. Pour un informaticien, il est difficile de contester le travail qui nous est donné, même si "éthiquement" il ne nous interesse pas.

    Cependant; c'est quand même dangereux de faire des choses sans avoir d'opinion. Quand tu dis que tu t'en moques, ça me fait peur, car toi en tant que citoyen sur lequel ce "jugement de relation" pourrait être porté tu t'en moques, imagines les petits informaticiens brésiliens ou indiens, ils s'en moquent triplement; pourtant faire des applications en gardant son intégrité, bien que difficile, est vers quoi nous devrions nous orienter, je trouve
    Je comprend ta réaction.

    Je suis informaticien, en effet, et je manipule des données confidentielles à longueur de journée. Et c'est vrai pour tous les métiers du monde: que se soit dans l'industrie de l'armement, de la chimie, de la médecine, des produits de beauté/parfum, dans le monde boursier/financier/bancaire, le monde judiciaire, les assurances, etc.
    Qui n'a pas dû passer une visite médicale à l'embauche, pour obtenir un prêt hypothécaire, une assurance, etc, avec des doutes, des soupçons?
    Il me suffit d'ouvrir mes boîtes aux lettres (physique et électronique) tous les jours pour être assez surpris parfois du ciblage publicitaire pertinent dont je fais l'objet. Je peux même parfois deviner d'où vient la "fuite".
    Les Pages Blanches, dispo sur le net pour pratiquement n'importe quel pays du monde, sont accessibles publiquement et gratuitement. Il suffirait que je te dise mon nom pour que tu retrouves en 3 clics mon adresse et mon numéro de téléphone. Je trouve ça très douteux. Et pourtant les pages blanches existent depuis qu'on a inventé le téléphone. Autant les opérateurs téléphoniques que de nos gouvernants n'y trouvent rien à redire...
    Bref, on peut aller loin dans ce débat.

    Dans ce cas concret, et afin de soulager un peu tes appréhensions éthiques, les données sont collectées auprès des intéressés eux-même. Il mettent un point d'honneur à fournir des données précises. Ils ne fournissent que des données à caractère public et professionnel (pas d'adresse/téléphone du domicile, pas de hobby, etc).

  13. #13
    Membre averti Avatar de xxiemeciel
    Inscrit en
    Juin 2005
    Messages
    371
    Détails du profil
    Informations forums :
    Inscription : Juin 2005
    Messages : 371
    Points : 352
    Points
    352
    Par défaut
    Salut,

    Maintenant que tu as ta base de données et si celle si est fiable tu pourrais t'en servir pour creer un reseau de neurone a ponderation sur une certaine quantité de requetes SQL prédéfini. Tu initialises ton reseau avec une certaine quantité de personnes dont tu connais les relations (intel connait intel etc ...)

    Par contre ca va etre un sacré boulot y'en a pour un moment avant de faire fonctionner un truc comme ca.

    Sinon tu peux aussi faire des recherches sur le data mining, les treillis de Galois et les regles de decisions qui en decoule. Le laboratoire LARIM de l'université du Quebec en Outaouais fais de la recherche de pointe dans ce domaine et cherche justement a extraire des informations de ce genre dans des tres grosses bases de données. Je suis pas sur que ce soit accessible sur le web mais ils developpenet une application nommé Galicia qui genere les treillis de Galois et les regles associative.

    XXiemeciel
    XXiemeciel

  14. #14
    Membre éprouvé
    Inscrit en
    Avril 2005
    Messages
    1 110
    Détails du profil
    Informations forums :
    Inscription : Avril 2005
    Messages : 1 110
    Points : 937
    Points
    937
    Par défaut
    J'ai déjà implémenté un réseau de neurones avec succès. Il est basé sur les cartes auto-organisatrices. Et je suis bien sûr en train de voir dans quelle mesure il pourrait être appliqué ici.
    Entre parenthèse, j'exclus les réseaux avec supervision, c'est trop contraignant.

    Le problème que je vois avec les neurones c'est que je dois donner une pondération à chaque critère à l'avance, sans compter l'impossiblité de remonter directement à la source pour justifier le résultat.
    Par exemple, si deux personnes se "connaissent" avec une probabilité X, je voudrais savoir pourquoi. Parce qu'elles ont été collègues, ou parce qu'elles ont fait les mêmes études?

  15. #15
    Membre averti Avatar de xxiemeciel
    Inscrit en
    Juin 2005
    Messages
    371
    Détails du profil
    Informations forums :
    Inscription : Juin 2005
    Messages : 371
    Points : 352
    Points
    352
    Par défaut
    Dans ce cas les treillis de Galois et les regles associatives de Galicia correpsondent a ce que tu cherches je pense. L'université du Quebec en Outaouais a peut etre des these ou des memoires fais par des anciens etudiant sur le sujet (mots clefs Data mining, treillis de Galois, regles de decision, regles associatives)

    Galicia permet de faire des choses dans ce style la, bon c'est un exemple simpliste mais le principe est le meme.

    - Une femme
    - De 40 ans
    - Elle fais son epicerie
    - Elle achete du pain

    Galicia va te donner la probabilité qu'elle achete aussi des oeufs et lait.

    XXiemeciel
    XXiemeciel

  16. #16
    Membre expert
    Avatar de 2Eurocents
    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    2 177
    Détails du profil
    Informations personnelles :
    Âge : 54
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 2 177
    Points : 3 166
    Points
    3 166
    Par défaut
    Citation Envoyé par camboui
    Le problème que je vois avec les neurones c'est que je dois donner une pondération à chaque critère à l'avance, sans compter l'impossiblité de remonter directement à la source pour justifier le résultat.
    Par exemple, si deux personnes se "connaissent" avec une probabilité X, je voudrais savoir pourquoi. Parce qu'elles ont été collègues, ou parce qu'elles ont fait les mêmes études?
    Si l'on ajoute la nécessité de justifier les décisions, est-ce que ça ne rentre pas dans les capacités d'un système expert d'ordre 0+ ?

    A voir ensuite s'il faut créer un nouveau moteur d'inférences, ou bien si la base de donnée peut être machée pour être fournie en entrée d'un produit déjà tout fait ...
    La FAQ Perl est par ici
    : La fonction "Rechercher", on aurait dû la nommer "Retrouver" - essayez et vous verrez pourquoi !

  17. #17
    Expert confirmé

    Profil pro
    Inscrit en
    Mai 2005
    Messages
    3 419
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2005
    Messages : 3 419
    Points : 4 297
    Points
    4 297
    Par défaut
    on pourrait établir une table des faits

    qui quoi quand ou avecqui comment
    pierre naissance 12/68 montreuil
    paul métier 12/83 ingénieur
    jesus religion 00/00-04 33 palestine apôtre catholique
    jeanne parenté pierrette cousine
    fred séjour 12/98-6-01 boston maria étudiant
    antoine employeur etc...
    il y a un gros travail de sémantique
    on peut créer ensuite créer une table des proximités décroissantes
    si on considére que cousine est plus lointaine que soeur, et que médecin est plus proche d'ingénieur que juriste

    on peut ensuite peser les quoi(on pourrait sans doute trouver d'autres
    propriétés)
    on écrit ensuite des règles de pondération des relations et distances
    et on fait les calculs
    évidemment l'idéal serait de partir de situations connues (x est ami de y)
    et de chercher les facteurs discriminants

    par contre même si c'est intellectuellement excitant je crains qu'on retrouve au bout du compte (malgè Bourdieux) ce que disait Montaigne
    de la Boétie ("parceque c'était moi, parceque c'était lui")
    Elle est pas belle la vie ?

  18. #18
    Expert confirmé

    Profil pro
    Inscrit en
    Mai 2005
    Messages
    3 419
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2005
    Messages : 3 419
    Points : 4 297
    Points
    4 297
    Par défaut
    de + les spécialistes du marketing ont des outils de calcul de
    corrélations (non évidentes, ni redondantes)
    par contre ces méthodes reposent sur des facteurs calculables
    en ce qui te concerne le critère n'est pas calculable puisque non
    vérifiable (sinon au sens tautologique (un frère connaît son frère)
    tu devrais arriver à une table des affinités du genre de celles des officines matrimoniales et augmenter très fortement les probabilités de "connaissance" mais ton modèle gagnerait beaucoup en probabilité

    il y a une étude sur la proximité des personnes qui mesure la proximité
    des personnes dans une chaine de connaissance par exemple en combien de personnes peux tu joindre le président ?
    1 si tu es ministre ou apparenté
    2 pour un maire de petite ville
    3 pour le frère de ce maire
    4 pour le coapin du frère

    l'étude met en valeur une distance maximale entre deux individus de la planète très faible (moins de 8 ) je crois de mémoire

    ceci n'est pas si loin du sujet
    Elle est pas belle la vie ?

  19. #19
    Membre éprouvé
    Inscrit en
    Avril 2005
    Messages
    1 110
    Détails du profil
    Informations forums :
    Inscription : Avril 2005
    Messages : 1 110
    Points : 937
    Points
    937
    Par défaut
    Citation Envoyé par xxiemeciel
    Dans ce cas les treillis de Galois et les regles associatives de Galicia correpsondent a ce que tu cherches je pense. L'université du Quebec en Outaouais a peut etre des these ou des memoires fais par des anciens etudiant sur le sujet (mots clefs Data mining, treillis de Galois, regles de decision, regles associatives)

    Galicia permet de faire des choses dans ce style la, bon c'est un exemple simpliste mais le principe est le meme.

    - Une femme
    - De 40 ans
    - Elle fais son epicerie
    - Elle achete du pain

    Galicia va te donner la probabilité qu'elle achete aussi des oeufs et lait.

    XXiemeciel
    Hmmm.
    Oui et non.

    En fait je dispose de "données exactes" qui permettent de déterminer des "liens précis" entre elles.
    Par exemple:
    "John Smith" ayant un diplome de "Harvard 1980"
    "Jack Smith" ayant un diplome de "Harvard 1989"
    Le lien précis que j'en retire c'est "Harvard", et aussi "Smith". A moi de donner une pondération à chacun des liens pour déterminer le lien global entre les deux données.
    J'ai parlé de probabilité au début, c'est sans doute une erreur car j'y introduis une notion subjective qui pourrait impliquer une analyse sémantique alors qu'elle est inutile.

    La probabilité que deux personnes se connaissent dans ce contexte est en définitive l'interprétation que l'on donnera à la valeur du "lien précis".
    En gros, ce "lien précis" sont les valeurs communes entre mes données, simplement.

    Dans ce cadre, "la femme de 40 ans qui achète du pain dans son épicerie aura une probabilité X d'acheter aussi des oeufs et du lait" n'ajoute aucune valeur à la donnée de départ (à savoir "la femme de 40 ans qui achète du pain dans son épicerie").

    Ceci dit, merci pour les infos. Il y a peut-être moyen d'extrapoler pour mon projet.

  20. #20
    Membre éprouvé
    Inscrit en
    Avril 2005
    Messages
    1 110
    Détails du profil
    Informations forums :
    Inscription : Avril 2005
    Messages : 1 110
    Points : 937
    Points
    937
    Par défaut
    Citation Envoyé par random
    de + les spécialistes du marketing ont des outils de calcul de
    corrélations (non évidentes, ni redondantes)
    par contre ces méthodes reposent sur des facteurs calculables
    en ce qui te concerne le critère n'est pas calculable puisque non
    vérifiable (sinon au sens tautologique (un frère connaît son frère)
    tu devrais arriver à une table des affinités du genre de celles des officines matrimoniales et augmenter très fortement les probabilités de "connaissance" mais ton modèle gagnerait beaucoup en probabilité

    il y a une étude sur la proximité des personnes qui mesure la proximité
    des personnes dans une chaine de connaissance par exemple en combien de personnes peux tu joindre le président ?
    1 si tu es ministre ou apparenté
    2 pour un maire de petite ville
    3 pour le frère de ce maire
    4 pour le coapin du frère

    l'étude met en valeur une distance maximale entre deux individus de la planète très faible (moins de 8 ) je crois de mémoire

    ceci n'est pas si loin du sujet
    En fait, Random, c'est exactement ça qu'il me faut, tu as trouvé
    A terme on va me demander de calculer la proximité entre les personnes.

    Les facteurs sont calculables, c'est l'interprétation du calcul résultant qui sera laissé à l'appréciation de l'utilisateur.
    L'utilisateur va savoir que deux personnes ont fait leur études en même temps à Harvard. Il a juste besoin de connaître ce fait, pas d'avoir la valeur de la probabilité qu'elles se connaissent par ce fait (même si on peut la lui donner à titre indicatif, bien que cette valeur serait basée sur des résultats statistiques dont je ne dispose pas).

    Comme tu le dis, on a une table de faits. Chaque personne englobe un ensemble de faits. La possibilité que 2 personnes puissent se connaitre est constituée par leurs faits communs, c'est à dire l'intersection de leur faits. En toute simplicité, on va dire que plus cette intersection est grande plus il y a de chances que ces personnes se connaissent.

Discussions similaires

  1. Réponses: 2
    Dernier message: 14/03/2018, 21h14
  2. Réponses: 2
    Dernier message: 11/12/2006, 15h06

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo