J'aimerai réduire des vecteurs de très grande taille. Il sont creux (taux de remplissage inférieur à 1%).
Après réduction, il faudrait que les propriétés des vecteurs réduits soient conservées, en particulier leur produit scalaire, leur distance.
Dans une première approche, je me propose de choisir aléatoirement 1% de valeurs en les additionnant pour faire la première coordonnée du vecteur réduit, puis un deuxième pourcent pour la 2ème coordonnée, etc, jusqu'à avoir pris chacune des coordonnées du vecteur d'entrée 1 fois et 1 seule. Le vecteur ainsi réduit aurait une dimension de 100 et serait le résultat d'une projection "additive". Vu que le vecteur d'entrée est creux, les propriétés devrait être conservées avec une probabilité élevée.
Qu'en pensez-vous?
Merci.
Partager