récupérer code source page HTML
Bonjour,
voilà je plante sur un problème, je dois créer une application qui me renvoie le code source de page web (dont les liens). J'ai essayé avec un JeditorPane mais j'ai laissé tomber car j'avais aussi des erreurs alors que ce sont des source que j'ai trouvé toute faite.
Dans le code qui suit j'ai uniquement changé le site web (google), le programme compile mais il me renvoie un message d'erreur. Je ne comprend pas du tout l'erreur peut etre quelqu'un peux m'aider ?
merci
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33
| try
{
// Ouverture du fichier contenu dans l'argument 0
//URL fileURL = new URL (args [0]);
URL fileURL = new URL ("http://www.google.fr");
Reader urlReader = new BufferedReader (
new InputStreamReader (fileURL.openStream ()));
// Creation d'une instance de parser
HTMLDocumentLinks doc = new HTMLDocumentLinks (fileURL);
// Parsing du fichier HTML avec Swing
new HTMLEditorKit ().read (urlReader, doc, 0);
urlReader.close ();
// Listing des ancres et des URLs trouvees dans le fichier
System.out.println ("Liste des ancres :");
for (Enumeration e = doc.getAnchors ().elements ();
e.hasMoreElements (); )
System.out.println (e.nextElement ());
System.out.println ("\nListe des URLs :");
for (Enumeration e = doc.getURLs ().elements ();
e.hasMoreElements (); )
System.out.println (e.nextElement ());
}
catch (IOException e)
{
System.out.println ("Probleme d'acces a l'URL : "+e );
// problème renvoyé :
// Problème d'acces à l'URL : javax.swing.text.ChangedCharSetException
} |
le message d'erreur que je reçois est :
javax.swing.text.ChangedCharSetException