Algorithme de recommandation d'ami basé sur les données mobiles

Version imprimable

Voir 40 message(s) de cette discussion en une page

21/10/2017, 08h12
suzy91

Algorithme de recommandation d'ami basé sur les données mobiles

bonjour a tous je m appelle suzy etudiante en master computer science. je travaille presentement sur le theme intitule:CONTEXT-AWARE FRIEND RECOMMENDATION ALGORITHM BASED ON MOBILE DATA.et j ai un peu du mal.
quelqu'un aurait-il une idee par rapport a mon theme. toutes suggestions seraient la bienvenue.

merci
21/10/2017, 10h23
valentin03

Bah c'est de la comparaison par thèmes affectée de coeffs de pertinence (facultatif)
Total des compatibilité; et des incompatibilités
Ex:
Jojo: Aime la musique, le sport, les enfants et n'aime pas les animaux ni les sodas
Lili: Aime les animaux, le sport et n'aime pas la musique
c'est à toi de fixer les règles du jeu (les coeffs de pertinence).
Sans coeffs, c'est un simple bilan de compatibilité (total des "=" et des "-")
Comme avec des données "mobiles" tu n'a que les choix "positifs (sites et thèmes consultés) tu ne peux pas présumer que les sites et thèmes non consultés (visités) ne sont pas aimés, cela divise le problème par deux
Il te suffit de comparer le nombre d"égalités de choix par couples de noms de personne
21/10/2017, 11h54
suzy91

Merci pour ta repone. Je cherche a developper un algorithme pour cela, mais jusqu ici je ne sais pas trop comment proceder
21/10/2017, 12h32
valentin03

Citation:

Envoyé par suzy91

Merci pour ta repone. Je cherche a developper un algorithme pour cela, mais jusqu ici je ne sais pas trop comment proceder

Je ne sais avec quel langage tu code, mais perso et en Basic , je ferais avec deux tableaux de chaînes
Et du découpage de chaînes; mais bon, on ne va pas encombrer le forum avec un langage datant des mérovingiens
21/10/2017, 21h33
valentin03

Avec les couples, il faut refaire des comparaisons
En fixant un seuil minimum de compatibilité ce qui fait un peu d'élagage ce qui n'est pas plus mal et il serait même pertinent de faire abstraction totale du taux de compatibilité en partant du principe que si Toto s'entend avec Lili et que Lili s'entend avec Gugus; Toto s'entendra aussi avec Gugus
22/10/2017, 02h28
suzy91

Salut, du coup quel serait le language approprié pour ce genre d'algorithme?
22/10/2017, 08h41
valentin03

Citation:

Envoyé par suzy91

Salut, du coup quel serait le langage approprié pour ce genre d'algorithme?

N'importe quel langage ferait l'affaire Le Basic est le plus facile mais tu n'ira pas sur le net avec
Les C, C++ et C# c'est pas de la rigolade
Les Python, Ruby, Delphy et LUA sont très puissants mais pas faciles
Avec Java et ses compères, on fait tout et le reste
Pour faire du web only c'est CSS+JS+HTML(pour la mise en page)
Tout dépend de tes objectifs, si tu veux faire de la programmation pour t'amuser et sans prétention fais du Basic (mais tu prendra de mauvaises habitudes qui t'handicaperont si tu veux passer à du plus hard)
Si tu veux aller loin je classerais comme suit: Python, Java, C++ (ou l'inverse)
D'autres classeront différemment
Il y a des centaines de langages

Mais les mots ont un sens, je t'invite donc à consulter la définition du mot: "Algorithme".
22/10/2017, 09h34
tbc92

Tu es étudiante. J'imagine que ces questions sont dans le cadre de tes études. Si tu dis rend ton 'devoir' en proposant une solution en Basic, ton prof va être assez surpris, et probablement déçu.
Si tu es dans une filière orientée analyse de données, tu peux utiliser un outil comme R.
Et si tu es dans une filière plutôt orientée Informatique pure, tu peux utiliser du Python. C, C++, C# peuvent aussi être envisagés, ainsi que d'autres langages. J'aurais envie de dire tous les langages sauf le Basic. La Basic est très bien, mais il est très connoté : langage du 20ème siècle.

Sur l'autre aspect: Si A est ami avec B et B ami avec C, alors A est ami avec C, ce n'est pas applicable. Si tu procèdes ainsi, par effet 'tache d'huile', tout le monde est ami avec tout le monde.
22/10/2017, 10h00
suzy91

C est dans le cadre de mon memoire de master, il me faut vraiment une bonne approche et non juste du basic.
22/10/2017, 11h30
valentin03

@ tbc92: Je vois que toi aussi tu t'es laissé embarqué par notre jeune amie
Je te conseille donc à toi aussi de revoir la définition du mot: "Algorithme"
L'algorithmique est un cheminement de pensée, le code, par le langage en est une transcription.
On demande à Susy de décrire le fonctionnement d'une voiture, pas de la fabriquer.

Citation:

Envoyé par tbc92

Sur l'autre aspect: Si A est ami avec B et B ami avec C, alors A est ami avec C, ce n'est pas applicable. Si tu procèdes ainsi, par effet 'tache d'huile', tout le monde est ami avec tout le monde.

Une affirmation qu'il sera difficile de prouver.
28/10/2017, 11h12
wiwaxia

Les amis de nos amis sont-ils vraiment nos amis ?
Bonjour, :D

La remarque de tbc92 est tout à fait pertinente:

Citation:

... Si A est ami avec B et B ami avec C, alors A est ami avec C, ce n'est pas applicable ...

A et C peuvent présenter suffisamment d'affinités avec B pour se déclarer "amis" de celui-ci, et se trouver mutuellement éloignés l'un de l'autre, au point de n'avoir aucune raison d'établir une relation.

Supposons les 3 personnes caractérisées par les listes de réponses ordonnées:
Code:

1 2 3 4 La = ( + , 0 , + , 0 , - , 0 , - , 0 ) Lb = ( + , + , + , + , - , - , - , - ) Lc = ( 0 , + , 0 , + , 0 , - , 0 , - )
A et B, de même que B et C, présentent 4 compatibilités et aucune incompatibilité: ils peuvent donc nouer un lien.
Par contre A et C s'emmerderont royalement ensemble, faute de goût commun.

La relation d'amitié, telle qu'elle est définie ici, n'est donc pas transitive:
les propositions (A ami de B) et (B ami de C) n'impliquent pas (A ami de C);
elle est seulement réflexive (A ami de A) et symétrique: (A ami de B) entraîne (B ami de A).

Une déclaration d'amitié entre X et Y (comme c'est romantique ! :aie: Où sont mes kleenex ?) peut être algorithmiquement initiée à partir d'un "produit scalaire" de deux "vecteurs de personnalité": p = Lx * Ly
vérifiant la condition: (p > Seuil) ;
toutefois les conditions ((La*Lb) > Seuil) et ((Lb*Lc) > Seuil) n'entraîneront pas ((La*Lc) > Seuil) .

Rien à voir évidemment avec une amitié réellement vécue, qui peut unir durablement (et même toute une vie) deux personnes à priori très éloignées par leur milieu, leurs opinions ou leur activité professionnelle. Cela ne se réduit pas à une simple convergence de goût ou de centres d'intérêts.
28/10/2017, 11h34
suzy91

Pour un memoire de master, serait ik judicieux pour moi de prendre comme exemple la reciproque l ami de mon ami c est mon ami???
28/10/2017, 12h04
tbc92

La question que tu poses, c'est : Peut-on dire l'ami de mon ami est mon ami ?
Mais la vraie question, c'est : Peut-on dire l'ami de mon ami est mon ami ? et surtout, peut-on boucler en appliquant cette règle aux nouveaux amis ainsi générés.
Si tu ne boucle pas, si tu dis : l'ami de mon ami est un quasi-ami (donc avec un statut moindre que le statut d'ami), alors ok.
Et tu peux pousser plus loin : A a 10 amis , B a 15 amis, C a 20 amis, A et B ont 8 amis en commun, c'est énorme, ils sont donc quasiment amis. A et C ont 1 ami en commun, ils sont moyennement voire pas du tout amis.
Mais tu peux aussi analyser la chose différemment : A et B ont 8 amis en communs, mais ils ne sont pas amis ? C'est qu'ils font partis tous les 2 de la même bande, du même groupe de collègues, mais ils se détestent.
28/10/2017, 12h09
suzy91

C est vrai que dans cette logique la, ce n est pas une verite generale:(:(:(.
28/10/2017, 13h23
valentin03

@: wiwaxia:
Revenons à l'énoncé qui stipule "basé sur les Données Mobile"
Les données Mobile, ce sont les sites et thèmes visités (présumés appréciés (affinités))
Il n'y a pas de "-" car les sites et thèmes non visités ne peuvent pas êtres présumés "Détestés" ("-").
28/10/2017, 14h46
wiwaxia

Algorithme de recommandation d'ami basé sur les données mobiles

@valentin03
Ta remarque est exacte, mais la restriction des réponses à deux options (0 / +) ne change rien à l'affaire: si l'on inverse dans l'exemple donné tous les signes (-), on vérifie que:
1°) A et B d'une part, B et C d'autre part présentent toujours 4 réponses identiques;
2°) A et C n'en ont aucune, et je crains qu'ils ne se morfondent tout autant au cours d'une soirée à deux ... à moins qu'ils ne se découvrent des affinités inattendues, non codées sur les réseaux sociaux. :D
28/10/2017, 16h23
wiwaxia

Roucoulades
Sur les contreforts de l'Himalaya vit une espèce d'oiseau dont je n'ai pas retenu le nom, caractérisée en cinq variétés (A, B ... E) dont les aires géographiques se succèdent tout le long de la chaîne, sur plusieurs milliers de kilomètres, d'est en ouest.
On observe l'interfécondité entre représentants de variétés voisines (A et B, B et C, etc), mais pas entre ceux des variétés les plus éloignées (A et E): c'est l'un des rares cas où l'on peut voir l'évolution à l'oeuvre, et la scission progressive d'une espèce par éloignement géographique; faute d'échange génétique, les différences entre individus des domaines extrêmes sont devenues telles qu'elles interdisent l'apparition de descendants.

Autrement dit, les relations d'interfécondité observées entre groupes proches:
F(A, B) , F(B, C) ... F(D, E) n'impliquent pas celle entre les groupes les plus éloignés F(A, E): il n'y a pas de transitivité dans le cas envisagé, ou du moins elle n'est pas complètement vérifiée.

C'est exactement le problème soulevé:

Citation:

Envoyé par tbc92

... Mais la vraie question, c'est : Peut-on dire l'ami de mon ami est mon ami ? et surtout, peut-on boucler en appliquant cette règle aux nouveaux amis ainsi générés ...

... avec, en plus, l'évocation d'une gradation dans la proximité, qui amène la notion de distance entre deux profils:

Citation:

Envoyé par tbc92

... Si tu ne boucle pas, si tu dis : l'ami de mon ami est un quasi-ami (donc avec un statut moindre que le statut d'ami), alors ok ...

La séquence les listes suivantes (non dépourvue de parenté avec la notion de patrimoine génétique):
Code:

1 2 3 4 5 6 7 8 9 La = (++++0000) Lb = (++++000+) Lc = (+++0000+) Ld = (+++000++) Le = (++0000++) Lf = (++000+++) Lg = (+0000+++) Lh = (+000++++) Li = (0000++++)
définit une suite de profils, dont chacun présente 4 réponses communes avec le précédent ou le suivant, et n'en diffère que par une seule - alors que le premier et le dernier (A et I) n'ont plus rien de commun !
Autrement dit: la modification progressive d'une liste de réponses, bien qu'elle engendre un nouveau terme très proche du précédent, peut finalement conduire à un profil totalement étranger au profil initial.

D'où la nécessité de mesurer l'écart séparant deux listes quelconques, en recourant par exemple à la distance de Manhattan⁽¹⁾:
D_XY = S_k=1^NAbs(x_k - y_k) .
On vérifie facilement que deux listes consécutives sont équidistantes:
D_AB = D_BC = D_CD = ... = D_HI = 1
tandis que l'écart séparant le premier terme de celui de rang (k) augmente progressivement:
D_AC = 2 , D_AD = 3 , D_AE = 4 ... D_AI = 8 = D_max .

Il faut renoncer à la notion de transitivité, et définir la relation d'amitié sur les réseaux sociaux par un critère de distance, par exemple:
# (x ami de Y) si et seulement si (D_XY < 0.2 * D_max)
# (X quasi-ami de Y) si et seulement si (0.2 * D_max < D_XY < 0.4 * D_max) .

(1) Voir aussi
# Notion de distance
# Métrique en analyse des données
28/10/2017, 18h20
valentin03

@: wiwaxia:
On peut effectivement introduire un taux de compatibilité (distance) qui complexifiera le problème; mais je crains que la pauvre Susy qui a déjà du mal à appréhender le problème de base n'y soit carrément noyée.

@: Susy: Où en es-tu rendue ?
29/10/2017, 02h30
suzy91

C est vrai que c est un peu compliqué, mais ce sujet m interesse beaucoup. Puisse avoir plus de details sur le taux de compatibilité. Est ce que grace a cela on pourrait determiner avec certitude un une relation entre A et C. D apres la logique A avec B ; B avec C alors A avec C?
29/10/2017, 09h13
wiwaxia

1 pièce(s) jointe(s)

Algorithme de recommandation d'ami basé sur les données mobiles

Citation:

Envoyé par valentin03

@: wiwaxia: On peut effectivement introduire un taux de compatibilité (distance) qui complexifiera le problème ...

Je n'ai fait que formaliser - d'une manière peut-être un peu abrupte, il est vrai - ce que tu as proposé dès le début (#2):

Citation:

Envoyé par valentin03

... Il te suffit de comparer le nombre d"égalités de choix par couples de noms de personne

en considérant les listes de réponses comme des vecteurs d'un espace de dimension (n) - 8, dans le cas des exemples cités - dont les composantes sont entières et ne peuvent prendre que les valeurs (0) ou (1).

La distance de Manhattan alors introduite s'identifie au nombre de réponses différentes: D_XY = N_rd
et sa valeur maximale au nombre total de réponses, donc à la dimension de l'espace envisagé: D_max = N_tot = n ;
tu t'es de ton côté intéressé au nombre de réponses identiques: N_ri = N_tot - N_rd = n - D_XY ,
qui n'est autre que le complément de la distance à sa valeur maximale.

Les taux de compatibilité (ou de proximité) et d'éloignement sont des rapports eux aussi complémentaires, compris entre zéro et l'unité:
T_e = (D_XY / D_max) = (N_rd / N_tot) ;
T_c = (N_ri / N_tot) = (N_tot - N_rd) / N_tot , soit finalement: T_c = 1 - T_e .

Les relations d'amitié proposées, qui faisaient intervenir deux seuils du taux d'éloignement (0.2 te 0.4)

Citation:

# (x ami de Y) si et seulement si (D_XY < 0.2 * D_max)
# (X quasi-ami de Y) si et seulement si (0.2 * D_max < D_XY < 0.4 * D_max) .

s'expriment tout aussi bien à l'aide des taux de compatibilité:

# (x ami de Y) si et seulement si ((D_XY / D_max) = (1 - T_c) < 0.2 * ) , soit : (T_c > 0.8) ;
# (X quasi-ami de Y) si et seulement si (0.2 < (D_XY / D_max) = (1 - T_c) < 0.4) , soit ici: (0.6 < T_c < 0.8) .
Nous parlons donc bien de la même chose, à l'aide de paramètres complémentaires.

# Remarque: il est possible d'envisager une somme coefficientée, si l'on estime les diverses réponses d'importance inégale;
ainsi la distance deviendra: D_XY = S_k=1^N(C_k*Abs(x_k - y_k)) ,
et sa valeur maximale: D_max = S_k=1^N(C_k) ;
résultats dont se déduiront sans changement les taux d'éloignement et de compatibilité:
T_e = (D_XY / D_max) et T_c = 1 - T_e .

@Susy: J'espère sincèrement que tu n'as pas été découragée par l'exposé précédent; le paragraphe ci-dessus résume ce qu'il faut tester pour s'assurer d'une relation d'amitié (ou de quasi-amitié, si l'on y tient).

Citation:

Envoyé par suzy91

... D'après la logique A avec B ; B avec C alors A avec C ?

Non, justement: c'est bien l'erreur à éviter.
(A ami de B) et (B ami de C) n'impliquent pas (A ami de C), mais seulement (A ami de A) et (B ami de A).
Un moyen simple de s'en rappeler est de penser à un triangle:Pièce jointe 323121
Ici AB = BC , mais AC = 1.98 * AB ;
bien que (A) soit proche de (B), et (B) proche de (C), (A) est nettement plus éloigné de (C) !

Voir 40 message(s) de cette discussion en une page