Précédent   Forum des professionnels en informatique > PHP > Langage > Débuter
Débuter Forum d'entraide pour débuter en PHP. Avant de poster -> Cours PHP, FAQ PHP, Outils PHP, etc.
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 18/07/2011, 10h29   #1
Invité de passage
 
Inscription : novembre 2010
Messages : 15
Détails du profil
Informations forums :
Inscription : novembre 2010
Messages : 15
Points : 1
Points : 1
Par défaut advanced parsing ?

Bonjour à tous,

J'espère ne pas me tromper dans la section à défaut oups !

Je suis complètement novice dans l'écriture en Php et j'ai besoin de votre aide afin de réaliser un outil "marketing".

Je m'explique, régulièrement je vais sur le un site d'identification de société grâce à leur numéro de siren afin de récupérer leur NAF, Chiffre d'affaire et d'autres éléments...

Mon fichier initial est sous xls (il provient d'une BDD access) et contient l'ensemble des Numéro de siren à aller chercher. (parfois jusqu'à 1000..)

Ensuite je vais sur ce fameux site et je me suis aperçu que le lien peut être requêter de la façon suivante :

Lien initial : http://www.site.com/societe/sarl-hainault-emballage-logistique-service-500942453.html

peut être remplacé par :

http://www.site.com/societe/*-"numéro Siren".html ou http://www.site.com/societe/*-000000001.html

Résultat comment dois-je m'y prendre pour :

1: Aller récupérer les données de mon fichier xls ou csv (je crois que c'est plus simple en csv) et les injecter sur le site en question en prenant le lien ci-dessus.

2: Récupérer (parser je crois) les éléments de la page complète sous forme d'un tableau et stockage dans un fichier

3: créer une boucle pour que cette requête aille relancer pour chaque ligne du fichier xls (ou chaque nouveau SIREN) le programme du début et me sorte un fichier final avec mes éléments.

En gros je crois que j'ai cerné comment faire fonctionner le script mais je ne sais pas trop de quel façon le rédiger... mon défaut et d'écrire un prog comme je pense ce qui n'est pas toujours compatible....

Je ne cherche pas à ce que l'on m'écrive le script mais plutôt à ce que l'on m'aide sur le choix des fonctions à utiliser (eregi ou autre), et que l'on m'aiguille que la façon de s'y prendre afin d'arriver à mon résultat.

Un grand merci pour votre aide.

PS: j'ai bien utiliser la fonction recherche mais je n'arrive pas à "compiler" l'ensemble des infos pour obtenir un script opérationnel.

PS2: Ou alors je créer une formule sous excel pour créer les lignes des urls et je n'ai plus qu'à lui faire ouvrir l'ensemble des liens et parser chaque page?
DkA59 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 18/07/2011, 11h33   #2
Modérateur
 
Inscription : septembre 2010
Messages : 7 107
Détails du profil
Informations forums :
Inscription : septembre 2010
Messages : 7 107
Points : 8 455
Points : 8 455
regarde si le site propose un API pour le faire, sinon tu dois leur demandé une autorisation pour pouvoir récupérer leur contenu, + déclarer tout ça la CNIL
__________________
http://blog.stealth35.com/
stealth35 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 18/07/2011, 15h06   #3
Membre éprouvé
 
Homme romain escudier
Développeur informatique
Inscription : juin 2011
Messages : 300
Détails du profil
Informations personnelles :
Nom : Homme romain escudier
Âge : 22
Localisation : France, Ille et Vilaine (Bretagne)

Informations professionnelles :
Activité : Développeur informatique
Secteur : High Tech - Éditeur de logiciels

Informations forums :
Inscription : juin 2011
Messages : 300
Points : 471
Points : 471
Citation:
Envoyé par stealth35 Voir le message
regarde si le site propose un API pour le faire, sinon tu dois leur demandé une autorisation pour pouvoir récupérer leur contenu, + déclarer tout ça la CNIL
Ou alors faire ça de manière completement pirate

Pour une utilisation personnelle je suis pas sur que tu doive demander a la cnil du moment que c'est des donnée accessible de manière publique.
__________________
Pas de solution, pas de probleme

Une réponse utile (ou +1) le pouce vert
Une réponse à votre question

skeud est déconnecté   Envoyer un message privé Réponse avec citation 01
Vieux 18/07/2011, 22h15   #4
Invité de passage
 
Inscription : novembre 2010
Messages : 15
Détails du profil
Informations forums :
Inscription : novembre 2010
Messages : 15
Points : 1
Points : 1
effectivement c'est bien un site public je ne le cite pas mais leur fond de commerce est justement de mettre à dispo ces infos gratuitement.
DkA59 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 19/07/2011, 00h26   #5
Membre Expert
 
Avatar de gene69
 
Inscription : janvier 2006
Messages : 951
Détails du profil
Informations personnelles :
Localisation : France

Informations professionnelles :
Secteur : High Tech - Produits et services télécom et Internet

Informations forums :
Inscription : janvier 2006
Messages : 951
Points : 1 063
Points : 1 063
Citation:
Envoyé par DkA59 Voir le message
effectivement c'est bien un site public je ne le cite pas mais leur fond de commerce est justement de mettre à dispo ces infos gratuitement.
négatif! Meme diffusée gratuitement sur le web, le droit d'auteur appliqué aux bases de données est extrêmement protecteur (en france). En plus "fond de commerce" sous entend qu'ils en retirent de l'argent... via de la pub, si tu dupliques leurs données > moins de visites > moins de revenus publicitaire > préjudice >procès > indemnisation.

Je suis sur qu'il y a des jurisprudences sur le sujet et l'usage que tu vas faire de la base de donnée du site tier n'est pas forcement du fair use (si tu utilises des infos d'un site pour faire concurrence à celui-ci c'est déloyal), ou peut-être tout simplement explicitement prohibé par les conditions d'utilisation du site. Demande une autorisation, tu te couvriras. Et si on te refuse l'autorisation, tu sais que tu viens d'eviter un procès..

apres... pas vu pas pris. mais un aspirateur de site ne passe jamais inaperçu dans les logs d'un serveur web.

La cnil ça s'applique uniquement aux info personnelle, donc à part pour les entreprises individuelles... j'ai pas trop de soucis. Pareil ici...

http://www.feral-avocats.com/fr/nos-...20071/374.html

techniquement ...
si tu es à l'aise en POO regarde phpexcel. c'est le top pour gerer les fichiers excel. Si tu es débutant ou peu à l'aise avec php oublie.
cURL si c'est supporté par ton hébergeur.
__________________
PHP fait nativement la validation d'adresse électronique Vous êtes perdu en PHP? rassurez-vous ici (en)
Utilisez le bouton résolu!
gene69 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 19/07/2011, 15h53   #6
Invité de passage
 
Inscription : novembre 2010
Messages : 15
Détails du profil
Informations forums :
Inscription : novembre 2010
Messages : 15
Points : 1
Points : 1
c'est super intéressant comme discussion mais cela ne m'aide pas beaucoup ^^

de toute façon je ne compte pas leur faire de concurrence je ne suis pas sur le même secteur d'activité pour ne pas dire à des années lumières, et les infos sont sur le domaine public. Juste je veux éviter de retaper chaque adresse à chaque fois.

humm m'enfin merci quand même pour votre aide.
DkA59 est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 13h05.


 
 
 
 
Partenaires

Hébergement Web