salut,
j'essaye de réaliser un prog en c qui simule google.
avec ce code j'eassaye d'afficher les 700 premier résultat trouvés, mais il affiche que quelques résultats puis il s'arrête, je sais pas pourquoi ?.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
 
#define _GNU_SOURCE
 
#include <assert.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <netdb.h>
#include <netinet/in.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <fcntl.h>
#include <regex.h>
 
 
#define LG_BUFFER 1024
 
char **VerifierExpressionReguliere(char *Expression,char *Chaine);
struct hostent* InformationHote(const char *Serveur);
int CreationSocket(void);
int  Connexion(int So,int Port,struct hostent *Hote);
void FermerConnexion(int So,const char *NomOuAdresseIpServeur);
 
int main(int argc, char *argv[1]) {
  struct sockaddr_in AdresseServeur;
  int NotreSocket;
  char *NomOuAdresseIpServeur = NULL ;
  char 	*Tampon = NULL;
  char 	*Tampon1 = NULL;
  char *Requete = NULL;
 
  char *Fin,*StartChaine = NULL;
  int NbreLus;
 
 
 
   char **TableauSousExpressions = NULL;
   int NombreLiens = 0;
   int Start = 0;
 
 
  struct hostent* NomHote = NULL;
 
 
 if (argc != 2) {
   fprintf(stderr,"%s <Google Request\n\n",argv[0]);
   exit(1);
 }
 
  NomOuAdresseIpServeur = strdupa("www.google.com");
 
  if ( (NomHote = InformationHote(NomOuAdresseIpServeur)) == NULL) {
    fprintf(stderr,"Can not have information from host %s\n",NomOuAdresseIpServeur);
    exit(1);
  }
 
 
 
 
   NotreSocket = socket(AF_INET,SOCK_STREAM,0);
   if ( (NotreSocket=CreationSocket()) == -1 ) {
     fprintf(stderr,"Can't create socket.\n");
     exit(1);
   }
 
 
 if (Connexion(NotreSocket,80,NomHote) < 0)  {
     fprintf(stderr,"Can't to be connected to %s.\n",NomOuAdresseIpServeur);
     exit(1);
   } 
   fprintf(stdout,"\nConnected to %s on %u :)\n\n",inet_ntoa(AdresseServeur.sin_addr),80);
 
  Tampon = (char*)alloca(LG_BUFFER);
  Tampon1 = (char*)alloca(LG_BUFFER);
  Requete = (char*)alloca(100);
  memset(Tampon,'\0',LG_BUFFER);
  memset(Tampon1,'\0',LG_BUFFER);
  memset(Requete,'\0',100);
  StartChaine = (char*)alloca(5);
  memset(StartChaine,'\0',100);
 
  do {
    sprintf(StartChaine,"%d",Start);
    strcpy(Requete,"GET ");
    strcat(Requete,"/search?num=100&hl=en&safe=active&q=");
    strcat(Requete,argv[1]);
    strcat(Requete,"&start=");
    strcat(Requete,StartChaine);
    strcat(Requete," HTTP/1.1\r\nHost: www.google.fr\r\n\r\n");
    fprintf(stdout,"%s",Requete);
    write(NotreSocket,Requete,strlen(Requete));
 
    while (1) {
 
      if ((NbreLus = read(NotreSocket,Tampon,LG_BUFFER)) >0) {
	/*write(STDOUT_FILENO,Tampon,NbreLus);*/
	if ( (TableauSousExpressions = VerifierExpressionReguliere("<h3 class=\"r\"><a href=\"(.*)\">(.*)</a>" , Tampon)) != NULL) {
	  if ( (Fin = strstr(TableauSousExpressions[1],"onmousedown")) != NULL) 
	    Fin[0] = '\0';
	  if( (Fin = strchr(TableauSousExpressions[1],'"')) != NULL)
	    Fin[0] = '\0';
	  NombreLiens++;
	  if (NombreLiens % 100 == 0)
	    break;
	  fprintf(stdout,"%s %d\n",TableauSousExpressions[1],NombreLiens);
	}
 
      }
      else
	break;
  }
    Start+=100;
  }while(Start <= 700 );
 
  FermerConnexion(NotreSocket,NomOuAdresseIpServeur);
  return 0;
}
 
 
struct hostent* InformationHote(const char *Serveur) {
  struct in_addr AdresseIPV4;
  struct hostent *Hote = NULL;
 
  if (inet_aton(Serveur,&AdresseIPV4) != 0) {
    if ( (Hote = gethostbyaddr( (char*) &AdresseIPV4,sizeof(struct in_addr),AF_INET)) == NULL)
      Hote = NULL;
  }
  else {
    if ( (Hote = gethostbyname(Serveur)) == NULL)
      Hote = NULL;
  }
  return(Hote);
}
 
 
 
int CreationSocket(void) {
  int LaSocket;
  LaSocket = socket(AF_INET,SOCK_STREAM,0);
  return(LaSocket);
}
 
 
 
int  Connexion(int So,int Port,struct hostent *Hote) {
  struct sockaddr_in Adresse;
  socklen_t Longeur;
  int Retour;
 
 
  Longeur = sizeof(struct sockaddr_in);
 
   /*
   *Mettre à zéro le contenu de l'adresse*
  */
  memset(&Adresse,0,sizeof(struct sockaddr_in));
 
 
 
  /*
  *remplir le champ sin_addr.s_adde par l'adresse IP à de laquelle le serveur va accepter des connexions, ici INADDR_ANY car on veut*
  *accepter de toutes les adresses*
  *ici on modifie l'adresse, qui est un entier long, en format réseau par l'appel de htonl (Host TO Network Long) *
  */
  Adresse.sin_addr.s_addr = ((struct in_addr *) (Hote->h_addr))->s_addr; 
 
  /*
  *remplir le champ sin_port par le numéro du port qu'on veut ouvrir sur le serveur*
  *ici on modifie le numéro du port, qui est un entier court, en format réseau par l'appel de htons (Host TO Network Short) *
  */
  Adresse.sin_port = htons(Port);
 
  /*
  *remplir le champ sin_family par AF_INET*
  */
  Adresse.sin_family = AF_INET;
 
 
 
 
  Retour = connect(So,(struct sockaddr*) &Adresse,Longeur);
 
 return (Retour);
 
}
 
 
void FermerConnexion(int So,const char *NomOuAdresseIpServeur) {
  if (close(So) ==0) 
    fprintf(stderr,"Connection to %s closed.\n",NomOuAdresseIpServeur);
  else {
    fprintf(stderr,"Can't close connection to %s.\n",NomOuAdresseIpServeur);
    exit(1);
  }
}
 
 
char **VerifierExpressionReguliere(char *Expression,char *Chaine) {
  int ErreurRegex;
  char *MessageErreurRegex = NULL;
  regex_t Motif_Compile;
  size_t LongeurMessage;
  size_t NombresSousChaines = 0;
  regmatch_t *SousChaines = NULL;
 
  size_t LongueurSousChaine;
  int Compteur;
 
  char **SousExpressions = NULL;
 
  ErreurRegex = regcomp(&Motif_Compile,Expression,REG_EXTENDED);
  if (ErreurRegex != 0) {
    LongeurMessage = regerror(ErreurRegex,&Motif_Compile,NULL,0);
    MessageErreurRegex = (char*)alloca(LongeurMessage);
    regerror(ErreurRegex,&Motif_Compile,MessageErreurRegex,LongeurMessage);
    fprintf(stderr,"%s\n",MessageErreurRegex);
 
    return(NULL);
  }
 
  NombresSousChaines = Motif_Compile.re_nsub + 1;
  SousChaines = (regmatch_t *) calloc (NombresSousChaines,sizeof(regmatch_t));
  if (SousChaines == NULL) {
    perror("calloc");
    exit(1);
  }
  ErreurRegex = regexec(&Motif_Compile,Chaine,NombresSousChaines,SousChaines,REG_NOTBOL);
  if (ErreurRegex == REG_ESPACE) {
    fprintf(stderr,"Fatal error !! No avialble space !\n");
    return(NULL);
 
  }
 
  if (ErreurRegex != REG_NOMATCH) {
    assert(SousExpressions == NULL);
    SousExpressions = (char**)malloc(NombresSousChaines);
    if (SousExpressions == NULL) {
      perror("malloc");
      exit(1);
    }
    for (Compteur  = 0; Compteur < NombresSousChaines; Compteur++) {
      LongueurSousChaine = SousChaines[Compteur].rm_eo - SousChaines[Compteur].rm_so;
      SousExpressions [Compteur] = strdup(Chaine+SousChaines[Compteur].rm_so);
      SousExpressions [Compteur][LongueurSousChaine] = '\0';
    }
    return(SousExpressions);
 
 
    for (Compteur  = 0; Compteur < NombresSousChaines; Compteur++) 
      free(SousExpressions[Compteur]);
 
    assert(SousExpressions != NULL);
    free(SousExpressions);
 
    assert(SousChaines != NULL);
    free(SousChaines);
 
    NombresSousChaines = 0;
    regfree(&Motif_Compile);
  }
  else 
    return(NULL);
 
}

exécution :
./nom_programme <requete google>

exemple :
./google facebook

il affiche que 75 liens !!!!!!!!!!!:
merci