Bonjour,
Je fais une étude en sociologie sur les pratiques culturelles à partir des données d'un réseau social culturel. J'ai pu récupérer toutes les données, dont une des tables comportant très simplement :
- l'id des utilisateurs
- l'id des produits culturels (film, livre etc.)
- la note attribuée par l'utilisateur au produit en question
Sur une ligne ça donne :
Id_user // Id produit culturel // La note
De par l'importance de ce réseau social, il y a près de 29 millions de notes. Ce qui est bien trop pour être géré par d'autres logiciels, sauf SAS. Mais mes connaissances en SAS sont assez limitées. Mon objectif serait de parvenir à faire un tableau croisé qui permettrait de redescendre en dessous de la limite fixée par Excel d'1 million 48 mille et quelques lignes.
C'est à dire avoir par exemple l'id des utilisateurs en ligne, l'id des produits culturels en colonne, et les notes au croisement des deux. Il y a 150 000 utilisateurs uniques du réseau étudié, et le nombre de produits culturels ne devrait pas non plus dépasser le million. Ce qui permettrait un traitement sous Excel ou SPSS.
Comment effectuer ce passage d'un document linéaire à une sorte de tableau croisé ?
[Je me permets par ailleurs de formuler mon objectif réel et final : je veux créer une cartographie des utilisateurs selon leurs pratiques culturelles. Selon qu'ils aient consommé un produit, qu'ils lui aient mis a peu près ou exactement la même note, ils seraient plus ou moins clusterisés de manière à créer des typologies à partir des pratiques. J'ai d'autres tables permettant d'avoir plus de détails sur les utilisateurs, sur les produits culturels et une troisième sur les liens "abonnés/abonnement" entre utilisateurs. Si vous savez par ailleurs comment je pourrais obtenir cette cartographie, cela serait super =) !]
Merci à tous pour votre aide !
Partager