Bonjour à tous,
Je suis développeur de métier, mais développeur applicatif et non web.
J'ai besoin pour un projet perso de développer un genre de "bot", de "script" qui irait rechercher sur une liste de sites pré-définies ( 4 ou 5 environ) des URL directes vers des vidéos.
Le but de ce script serait d'itérer sur ces 4 ou 5 sites et de récupérer les URL des vidéos disponibles, les keywords associés, les descriptions et éventuellement les vignettes, puis, tout stocker dans une Db (probablement mySQL).
Attention, je ne souhaite pas "grabber" ( télécharger) les vidéos, je veux juste récupérer le liens direct et les mots clé, descriptions et les stocker dans ma db.
Ce script serait a exécuter périodiquement, peux etre 3 à 4 fois par semaine environ afin de mettre à jour la base.
Ce qui est important de noter est que les "sources" à aller voir seraient au nombre de 4 ou 5, ainsi je pourrais coder "manuellement" la méthode à suivre pour aller chercher les URLS de ces sites. Je ne cherche pas à construire un bot "universel" capable de trouver des liens de vidéos automatiquement. Non, je cherche a automatiser cette tache.
Le but serait qu'ensuite un site web derrière traite et présente ces infos, c'est donc un développement web.
Au début je pensais a faire ce script en php ou js, seulement, je suis vraiment à la ramasse sur les technos web. Je cherche le moyen le plus simple pour faire cela...je suis développeur donc pourrait m'en tirer avec toutes les technos, mais je tiens à éviter de perdre bcp de temps.
Que conseillez vous entre php ou javascript ? Une librairie particulière et simple pour analyse de l'http ( je pense que je vais devoir coder un genre de client http non ?).
Grossièrement, je pensais regarder comment mes sites "construisent" leurs URL vers leurs vidéos...Les générer automatiquement par programmation et vérifier si l'url était valide...quelque chose comme cela.
Avec quoi pourrait-je simplement faire cela ?
Sinon, il reste la méthode de bucheron du développeur applicatif...coder ça en C#, en faire un EXE et lancer depuis mon PC via une tâche planifiée afin de mettre à jour la Db, mais ce n'est pas très smart...
Voila, messieurs les web devs, j'aurai bien aimé vos avis la dessus
Qu'en pensez vous ?
Je vous remercie par avance :=
Partager