Bonjour
Ayant eu un besoin pour un audit de site Internet, je viens de développer en VB6 un outil destiné à importer l'intégralité d'un site (tout au moins, ce qui est référencé et importable).
Cette application, dénommée Pompanette (ce qui devrait rappeler quelque chose aux lecteurs de Pagnol) est cependant un peu délicate à finaliser. En effet, comme elle reçoit l'intégralité des objets du site cible, images comprises, on atteint de gros volumes de données à transférer. Ma bande passante étant le minimum admissible en ADSL, cela me prend beaucoup de temps pour tester l'appli sur différents sites.
Je cherche donc des volontaires pour m'aider dans cette tâche. Ils devront satisfaire aux conditions suivantes :
- Bien connaître VB6 afin de diagnostiquer les bugs et de m'aider à trouver les problèmes dans le code des routines
- Savoir gérer l'accès aux données et aux structures d'une base de données Access sous ADODB
- Bien connaître HTML afin de comprendre les données obtenues et les interpréter pour trouver les causes d'un dysfonctionnement
- Savoir gérer un site Web et écrire des pages HTML afin de m'aider à rédiger l'aide en ligne au format CHM.
- Savoir utiliser Html Help Compiler afin de m'aider à générer les listes de mots clés de l'aide en ligne
- Avoir une expérience de développeur suffisamment complète pour distinguer parmi les extensions proposées celles utiles à tous, des caprices personnels de certains.
Si l'un de ces critères vous rebute, abstenez-vous !
- Savoir et avoir la patience de rédiger en détail les problèmes observés afin que les autres contributeurs comprennent bien de quoi il s'agit.
Si vous ne vous sentez pas compétent dans un des domaines mais que vous en maîtrisez parfaitement un autre, lancez-vous !
Si vous êtes un Yaka, un Yakapa ou un YfautQue, changez tout de suite de discussion.
L'application terminée sera un freeware disponible sur mon site. Je garde la maîtrise du code, mais certaines routines seront fournies sur le forum lorsqu'un besoin de déboguage se fera sentir.
Je ne tiens pas en effet à fournir aux nombreux stagiaires qui fréquentent ce forum un projet "clé en main" dont ils pourraient être tentés de faire leur projet de stage...
Par contre je n'ai rien contre la diffusion de morceaux de code qui peuvent servir d'exemple.
Les sources complètes seront transmises en fin de développement aux beta-testeurs ayant fait la preuve de leurs compétences ou apporté leur pierre à l'édifice.
Jusqu'à présent, ce job était réalisé par les collaborateurs de ma société, chacun jouant le rôle de beta-testeur pour les applications des autres. Les beta-testeurs de niveau 2 étaient généralement les clients, qui ne sont pas les moins redoutables (d'autant qu'ils ont toujours raison).
Maintenant que je suis à la retraite, je n'ai plus ni client ni collaborateur (mais je produis toujours !). J'ai donc besoin d'un peu d'aide.
Les principaux sujets abordés dans le projet VB sont les suivants :
- Utilisation du contrôle Inet pour ouvrir et importer les objets Internet
- Utilisation d'une base de données Access 2000-2003 et le modèle ADODB pour stocker les données
- Utilisation d'une fenêtre MDI avec barre d'outils et barre d'état
- Volet d'exploration du site avec un treeview, largeur de volet ajustable par l'utilisateur
- Insertion et extraction de données binaires (images, pdf, etc) dans la base de données
- Création dynamique de tables dans la base de données - Compactage de la base
Pour les besoins d'évaluation, un package d'installation de l'application est disponible à l'adresse ci-dessous.
- Exportation des données dans le presse-papiers ou des fichiers (texte ou binaires)
Cette version est opérationnelle mais n'a encore pas d'aide en ligne, et demande à vieillir un peu. Donc si le coeur vous en dit...
http://mgd.software.free.fr/Downloads/Pompanette
Pour l'instant, le cahier des charges que je me suis fixé impose que :
- Les pages HTML référencées sont importées intégralement
- Les images référencées sont importées intégralement
- Les liens externes (du types http://...) sont enregistrés mais non suivis
- Les liens avec paramètres (javascript, php, asp, ...) sont enregistrés et suivis, mais sans paramètres. En général, cela ne ramène que des données non exploitables (pages vides, non trouvées, etc.)
- Les liens vers un niveau supérieur à celui de départ sont suivis. Comme presque toujours les pages référencient la page d'accueil du site, cela revient à analyser toujours l'intégralité du site.
- Les liens brisés sont enregistrés et suivis. En général, cela ramène une page HTML "404 Not Found". Ils sont repérés par une icône spécifique dans l'arborescence de l'explorateur de site.
- Les données Texte sont affichées à l'écran, ainsi que les images (jpg, bmp et gif). Elles sont copiables dans le presse-papiers et exportables dans un fichier.
Ce cahier des charges pourra évoluer en fonctions de vos suggestions. Je me réserve cependant le rôle de modérateur dans leur intégration.
- Les données autres (fichiers d'application : PDF par exemple) sont affichées en tant que texte sans conversion Unicode. En général, c'est inexploitable, mais cela dépend fortement du type d'application
Y'a des volontaires ?
Partager