Bonjour à tous,
Je suis développeur mais sur d'autres langages que Python.
J'ai choisit Python pour me former d'une part, et d'autre part car je pense que ça va plus vite qu'avec d'autres langages.
Je voudrais réaliser un projet assez simple dans l'idée.
Le but est de faire appelle à pleins d'API (tweeter, FB, insta, ...), alimenter une DB puis l'afficher sur une page.
Comme ça je pense qu'il y a plusieurs points à réaliser :
- Une page d'authentification
- Création de la BDD
- Une page pour présenter les données aux utilisateurs.
Assez simple donc.
Mon problème c'est surtout l'alimentation des données en DB.
Mes questions sont les suivante :
1)
Pour la récupération des données depuis les différents API, cela s'effectuera de manière batch la nuit.
Les API ayant des limitations, cela prends plusieurs heures et le faire entre 00H00 et 6H00 de matin me semble logique.
Je pense utiliser quelque chose comme django-crontab.
Est ce que dans un même projet django on peut avoir l'application en temps réel et des batch qui tournent le soir sans problème ?
2)
Parfois il y a des données que je ne peux pas récupérer via API car tout simplement certains sites n'ont pas d'API.
Pour ça je voulais utiliser CasperJS (+nodeJS) qui permet se simuler un utiliser web.
Là je ne sais pas trop comment m'y prendre. Existe-il un équivalent de capserJs en Python ?
Si ça n'existe pas, peut-on lancer l'exécution d'un programme js depuis django ? (en batch)
Enfin, est ce que le programme nodeJS peut se connecter et alimenter les DB de python ?
3)
Si vous avez des idées autres, sur la mise en place de tout ça je serais ravi d'entendre vos suggestions.
Merci d'avance pour votre aide.
Partager