bonjour,
je veux extraire l'index des pages web en java comment je peux le faire ??
Quelqu'un saurait-il me guider un peu ?
Merci d'avance pour votre aide.
bonjour,
je veux extraire l'index des pages web en java comment je peux le faire ??
Quelqu'un saurait-il me guider un peu ?
Merci d'avance pour votre aide.
Le célèbre index des pages web. On est tous passés par là.
Aucune idée de quoi tu parles. Mon premier conseil serait de faire que ce que tu veux devienne clair dans ta tête. Puis t'arranger pour que ça le devienne dans la nôtre.
je veux lire l'index d'une page, et les mots clés de cette page
Bonjour,
Je ne comprends pas ce qu'est pour toi "l'index d'une page".
Est-ce que tu es en train de construire un moteur de recherche ?
Est-ce que tu pourrais nous préciser le contexte de ton développement ?
Mathieu
L'index : c'est lorsqu'on fait une recherche par un moteur de recherche "GOOGLE " il va nous retourné un ensembles des pages web qui repend a notre requête. ces pages retournées contiennent des indexes où ces index repend à notre requête.
ces indexe peuvent être : "mots clés..."
En informatique, un index est une liste ordonnée qui permet un accès rapide à un enregistrement spécifique d'une base de données à partir de la valeur de l'un des éléments de cet enregistrement.
Mon objectif est d'extraire ces index
Pas à ma connaissance, non.
Nous sommes au courant, mais on a pas entendu parler d'index universel des pages webs. Tout ce qui fait ça a sa petite procédure rien qu'à lui, qu'il ne partage pas.
Seulement ceux de Google, ou tu as une liste des moteurs de recherche qui t'intéressent ?
De toute façon, Google ou un autre je ne suis pas sûr que ce soit possible. C'est leurs données, pourquoi est-ce qu'ils les donneraient à tout le monde ?
(Les "ça ne marche pas", même écrits sans faute(s), vous porteront discrédit ad vitam æternam et malheur pendant 7 ans)
N'oubliez pas de consulter les FAQ Java et les cours et tutoriels Java
A mon avis c'est impossible à faire à moins que ce ne soit toi qui indexe les pages. Ce qui semble faisable, c'est, par exemple, lancer une requête sur un moteur de recherche et récupérer les x premiers liens, les indexer et donner un indice plus élevé aux premières pages. Par contre, tu ne pourras pas indexer le web en entier...
Ben... C'est les premiers -_-°
oui, les premiers mais je veux lire leur indices ( index)
Ce que je voulais dire c'est que le lien qui est le premier de la liste a été considéré comme plus important que le deuxième, etc... Avec cette information tu peux recréer le poids de chaque page en fonction des mots que tu as recherché. Par contre, il te faudra faire ton propre moteur d'indexation. Tu ne peux pas obtenir l'index de Google par exemple.
Partager