Précédent   Forum des professionnels en informatique > Bases de données > MySQL > Installation
Installation Forum d'entraide sur les problèmes liés à l'installation de MySQL
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 11/01/2007, 11h30   #1
Futur Membre du Club
 
Inscription : janvier 2007
Messages : 29
Détails du profil
Informations forums :
Inscription : janvier 2007
Messages : 29
Points : 16
Points : 16
Par défaut Gros problème de réplication

Bonjour,

J'ai un énorme soucis et je ne trouve aucune réponse à mon problème de réplication...

J'ai 2 serveurs sous Debian : un maître et un esclave. La réplication marchait très bien jusqu'à ce que la base de données mysql plante.

Maintenant, l'esclave ne veut plus du tout se connecter au maître...

J'ai tout vérifié :

- j'ai testé le ping du nom de machine du maitre (du cote esclave), il trouve son adresse IP mais le ping ne marche pas.
- J'ai pingué le nom de machine de l'esclave (du cote maitre) et là tout marche.

J'ai vérifié les fichiers de configuration :
Sur le maitre :
- server_id = 1
- port = 3306
Sur l'esclave :
- server_id = 2
- port_master = 3306

L'utilisateur qui a été paramétré à les droits suivant sur le maître : Select_priv, Reload_priv, Super_priv, Repl_slave_priv.
max_questions est à 0
max_updates = 0
max_connections = 0

Mes messages d'erreurs n'apparaissent que sur l'esclave, et les voici :
Citation:
Jan 10 12:12:04 esclave mysqld[1527]: 070110 12:12:04 [ERROR] Slave I/O thread: error connecting to master 'repl@maitre:3306': Error: 'Lost connection to MySQL server during query' errno: 2013 retry-time: 60 retries: 86400

Jan 10 15:11:04 esclave mysqld[1527]: 070110 15:11:04 [ERROR] Slave I/O thread killed while connecting to master

Jan 10 15:11:04 esclave mysqld[1527]: 070110 15:11:04 [ERROR] Slave I/O thread exiting, read up to log 'maitre-bin.000036', position 57669

Jan 10 15:11:04 esclave mysqld[1527]: 070110 15:11:04 [ERROR] Error reading relay log event: slave SQL thread was killed

Jan 10 15:11:29 esclave mysqld[1527]: 070110 15:11:29 [Note] Slave SQL thread initialized, starting replication in log 'FIRST' at position 0, relay log './esclave-relay-bin.000001' position: 4

Jan 10 15:14:38 esclave mysqld[1527]: 070110 15:14:38 [ERROR] Slave I/O thread: error connecting to master 'repl@maitre:3306': Error: 'Lost connection to MySQL server during query' errno: 2013 retry-time: 60 retries: 86400

Jan 10 15:22:58 esclave mysqld[1527]: 070110 15:22:58 [ERROR] Slave I/O thread killed while connecting to master

Jan 10 15:22:58 esclave mysqld[1527]: 070110 15:22:58 [ERROR] Slave I/O thread exiting, read up to log 'FIRST', position 4

Jan 10 15:22:58 esclave mysqld[1527]: 070110 15:22:58 [ERROR] Error reading relay log event: slave SQL thread was killed

Jan 10 15:32:42 esclave mysqld[1527]: 070110 15:32:42 [Note] Slave SQL thread initialized, starting replication in log 'FIRST' at position 0, relay log './esclave-relay-bin.000001' position: 4

Jan 10 15:35:51 esclave mysqld[1527]: 070110 15:35:51 [ERROR] Slave I/O thread: error connecting to master 'repl@maitre:3306': Error: 'Lost connection to MySQL server during query' errno: 2013 retry-time: 60 retries: 86400
Quand je fais un PROCESSLIST sur l'esclave :

Citation:
mysql> SHOW PROCESSLIST;
+-----+-------------+-------------------+----------+---------+------+-----------------------------------------------------------------------+------------------+
| Id | User | Host | db | Command | Time | State | Info |
+-----+-------------+-------------------+----------+---------+------+-----------------------------------------------------------------------+------------------+
| 566 | system user | | NULL | Connect | 5803 | Connecting to master | NULL |
| 567 | system user | | NULL | Connect | 5803 | Has read all relay log; waiting for the slave I/O thread to update it | NULL |
+-----+-------------+-------------------+----------+---------+------+-----------------------------------------------------------------------+------------------+
4 rows in set (0.00 sec)
Quand je fais PROCESSLIST sur le maitre, je ne vois rien en rapport avec la replication.

J'ai même regardé les ports :
Sur l'esclave :
Citation:
esclave:# netstat -laputen | grep 3306
tcp 0 0 0.0.0.0:3306 0.0.0.0:* LISTEN 0 2014 1526/mysqld
tcp 0 1 192.168.1.3:32849 192.168.1.1:3306 SYN_SENT 103 32423 1526/mysqld
Sur le maitre
Citation:
maitre:/var/log# netstat -laputen | grep 3306
tcp 0 0 0.0.0.0:3306 0.0.0.0:* LISTEN 0 32860729 836/mysqld
Après, j'ai testé les services mysql de 2 façons :
La première : j'ai fait un ps -e
Citation:
  • Sur l'esclave :
esclave:/var/log# ps -e | grep mysql
1489 ? 00:00:00 mysqld_safe
1526 ? 00:00:00 mysqld
1528 ? 00:00:00 mysqld
1529 ? 00:00:00 mysqld
1530 ? 00:00:00 mysqld
1531 ? 00:00:00 mysqld
1532 ? 00:00:00 mysqld
1533 ? 00:00:00 mysqld
1534 ? 00:00:00 mysqld
1535 ? 00:00:00 mysqld
1536 ? 00:00:00 mysqld
3798 ? 00:00:00 mysqld
3799 ? 00:00:00 mysqld
  • Sur le maitre :
maitre:/var/log# ps -e | grep mysql
799 pts/0 00:00:00 mysqld_safe
836 pts/0 00:00:00 mysqld
838 pts/0 00:00:00 mysqld
839 pts/0 00:00:00 mysqld
840 pts/0 00:00:00 mysqld
841 pts/0 00:00:00 mysqld
842 pts/0 00:00:00 mysqld
843 pts/0 00:00:01 mysqld
844 pts/0 00:00:00 mysqld
845 pts/0 00:00:00 mysqld
846 pts/0 00:00:00 mysqld
847 pts/0 00:00:00 mysqld
..... (y'en a 83 de lancer)
La seconde : en faisant mysqladmin ping
Citation:
  • Sur l'esclave :
esclave:/var/log# mysqladmin ping
mysqld is alive
  • Sur le maitre :
maitre:/var/log# mysqladmin ping
mysqld is alive
Je ne vois absolument pas comment regler ce problème, et mon patron va finir par m'en vouloir

SVP si quelqu'un a une idée ca serait génial !!!! Moi en tout cas j'en ai plus...
didlette62 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 11/01/2007, 14h26   #2
Futur Membre du Club
 
Inscription : janvier 2007
Messages : 29
Détails du profil
Informations forums :
Inscription : janvier 2007
Messages : 29
Points : 16
Points : 16
personne n'aurait une idée ?
didlette62 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 11/01/2007, 15h35   #3
Futur Membre du Club
 
Inscription : janvier 2007
Messages : 29
Détails du profil
Informations forums :
Inscription : janvier 2007
Messages : 29
Points : 16
Points : 16
J'ai encore fait quelques tests :

J'ai changer id_server de l'esclave, je l'ai mis a 3 au lieu de 2. j'ai redémarré mysql pour que ce soit pris en compte...

Aussi, j'ai vérifié que toutes mes tables étaient bonnes sur les 2 bases des 2 serveurs (j'ai du en réparé quelques unes! )

Mais ça ne marche toujours pas. J'ai même essayé "FLUSH MASTER" sur le maitre et "FLUSH SLAVE" sur les 2.. J'ai tout redémarré au cas ou! Mais rien à faire..

D'où peut venir ce problème ???
didlette62 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 11/01/2007, 15h41   #4
Membre Expert
 
Avatar de Adjanakis
 
Inscription : avril 2004
Messages : 734
Détails du profil
Informations personnelles :
Localisation : France, Pas de Calais (Nord Pas de Calais)

Informations forums :
Inscription : avril 2004
Messages : 734
Points : 1 281
Points : 1 281
Bonjour,

Après tout ça le maître n'a toujours pas de thread en rapport avec la réplication ?
__________________
Pensez au tag
Adjanakis est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 11/01/2007, 15h43   #5
Futur Membre du Club
 
Inscription : janvier 2007
Messages : 29
Détails du profil
Informations forums :
Inscription : janvier 2007
Messages : 29
Points : 16
Points : 16
Ben ça j'avoue ne pas pouvoir répondre, je ne sais pas trop ce que c'est un thread.. A chaque fois j'oublie. Mais sur le maître il n'y a aucune trace de l'esclave... Nul part.
didlette62 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 12/01/2007, 09h12   #6
Futur Membre du Club
 
Inscription : janvier 2007
Messages : 29
Détails du profil
Informations forums :
Inscription : janvier 2007
Messages : 29
Points : 16
Points : 16
Mise à jour de mes tests :

Hier j'ai testé aussi le tcpdump.

Du maitre vers l'esclave, rien ne se passe, par contre, dans l'autre sens il y a du trafic !

C'est peut être un blem matériel mais ça me semble bizarre étant donné que le maitre arrive à recevoir et envoyer des données vers les autres adresses du réseau.
didlette62 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 12/01/2007, 11h07   #7
Futur Membre du Club
 
Inscription : janvier 2007
Messages : 29
Détails du profil
Informations forums :
Inscription : janvier 2007
Messages : 29
Points : 16
Points : 16
J'ai oublié un test :

J'ai fait un telnet sur l'esclave vers le maitre : telnet esclave 3306, et ça m'a dit time out...

Pareil dans l'autre sens : telnet maitre 3306 => TIME OUT

Snif !
didlette62 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 12/01/2007, 13h25   #8
Membre Expert
 
Avatar de Adjanakis
 
Inscription : avril 2004
Messages : 734
Détails du profil
Informations personnelles :
Localisation : France, Pas de Calais (Nord Pas de Calais)

Informations forums :
Inscription : avril 2004
Messages : 734
Points : 1 281
Points : 1 281
En fait ma question signifiait simplement: N'y a-t-il toujours rien lors d'un SHOW PROCESSLIST sur le maitre en rapport avec la réplication.
__________________
Pensez au tag
Adjanakis est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 12/01/2007, 14h09   #9
Futur Membre du Club
 
Inscription : janvier 2007
Messages : 29
Détails du profil
Informations forums :
Inscription : janvier 2007
Messages : 29
Points : 16
Points : 16
Citation:
Envoyé par Adjanakis
En fait ma question signifiait simplement: N'y a-t-il toujours rien lors d'un SHOW PROCESSLIST sur le maitre en rapport avec la réplication.
Je confirme qu'il n'y a rien dans le SHOW PROCESSLIST en rapport avec l'esclave !
didlette62 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 12/01/2007, 14h37   #10
Membre Expert
 
Avatar de Adjanakis
 
Inscription : avril 2004
Messages : 734
Détails du profil
Informations personnelles :
Localisation : France, Pas de Calais (Nord Pas de Calais)

Informations forums :
Inscription : avril 2004
Messages : 734
Points : 1 281
Points : 1 281
Je ne sais pas si ça a été fait, mais je pense qu'il faudrait revoir l'installation de la réplication sur le serveur en commençant par vérifier si c'est le bon fichier de configuration qui a été utilisé.
__________________
Pensez au tag
Adjanakis est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 12/01/2007, 14h39   #11
Futur Membre du Club
 
Inscription : janvier 2007
Messages : 29
Détails du profil
Informations forums :
Inscription : janvier 2007
Messages : 29
Points : 16
Points : 16
Citation:
Envoyé par Adjanakis
Je ne sais pas si ça a été fait, mais je pense qu'il faudrait revoir l'installation de la réplication sur le serveur en commençant par vérifier si c'est le bon fichier de configuration qui a été utilisé.
comment je pourrais vérifier ça ?
didlette62 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 12/01/2007, 14h44   #12
Membre Expert
 
Avatar de Adjanakis
 
Inscription : avril 2004
Messages : 734
Détails du profil
Informations personnelles :
Localisation : France, Pas de Calais (Nord Pas de Calais)

Informations forums :
Inscription : avril 2004
Messages : 734
Points : 1 281
Points : 1 281
En regardant le script de lancement de la base master. Il doit prendre en compte soit les fichiers d'initialisation par défaut, soit les fichiers donnés en argument de la ligne de commande.
__________________
Pensez au tag
Adjanakis est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 12/01/2007, 15h26   #13
Futur Membre du Club
 
Inscription : janvier 2007
Messages : 29
Détails du profil
Informations forums :
Inscription : janvier 2007
Messages : 29
Points : 16
Points : 16
Citation:
Envoyé par Adjanakis
En regardant le script de lancement de la base master. Il doit prendre en compte soit les fichiers d'initialisation par défaut, soit les fichiers donnés en argument de la ligne de commande.
C'est bon, il utilise le bon fichier...
didlette62 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 12/01/2007, 15h33   #14
Membre Expert
 
Avatar de Adjanakis
 
Inscription : avril 2004
Messages : 734
Détails du profil
Informations personnelles :
Localisation : France, Pas de Calais (Nord Pas de Calais)

Informations forums :
Inscription : avril 2004
Messages : 734
Points : 1 281
Points : 1 281
Les logs sont bien là ? (je ne sais plus lesquels sont nécessaires)
__________________
Pensez au tag
Adjanakis est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 12/01/2007, 15h37   #15
Membre Expert
 
Avatar de Adjanakis
 
Inscription : avril 2004
Messages : 734
Détails du profil
Informations personnelles :
Localisation : France, Pas de Calais (Nord Pas de Calais)

Informations forums :
Inscription : avril 2004
Messages : 734
Points : 1 281
Points : 1 281
Sinon de façon plus générale, est-ce que tout est ok par rapport à ceci ?
__________________
Pensez au tag
Adjanakis est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 12/01/2007, 15h57   #16
Futur Membre du Club
 
Inscription : janvier 2007
Messages : 29
Détails du profil
Informations forums :
Inscription : janvier 2007
Messages : 29
Points : 16
Points : 16
Tout est en rapport, mis à part que server_id sur le maitre est à 1...

Je crois avoir compris qu'il faut le mettre à 2 donc je l'ai fait, mais je ne peux pas redémarrer le service, il y a des clients connectés sur la base...

Donc je verrais que lundi si ça a marché.

J'espère que c'est ça, sinon si je ne suis pas sur la bonne piste, tu pourrais me le dire ?
didlette62 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 12/01/2007, 16h03   #17
Membre Expert
 
Avatar de Adjanakis
 
Inscription : avril 2004
Messages : 734
Détails du profil
Informations personnelles :
Localisation : France, Pas de Calais (Nord Pas de Calais)

Informations forums :
Inscription : avril 2004
Messages : 734
Points : 1 281
Points : 1 281
euh... de ce que j'ai pu comprendre de la réplication(jamais fait jusqu'à présent), il faut que les identifiants de chaque serveur soient différents. C'est tout ce que je crois savoir sur le sujet
__________________
Pensez au tag
Adjanakis est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 12/01/2007, 16h05   #18
Futur Membre du Club
 
Inscription : janvier 2007
Messages : 29
Détails du profil
Informations forums :
Inscription : janvier 2007
Messages : 29
Points : 16
Points : 16
Ah ben merci quand même alors !!! C'est gentil de m'avoir répondu, maintenant je croise les doigts pour lundi !
didlette62 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 12/01/2007, 16h11   #19
Membre Expert
 
Avatar de Adjanakis
 
Inscription : avril 2004
Messages : 734
Détails du profil
Informations personnelles :
Localisation : France, Pas de Calais (Nord Pas de Calais)

Informations forums :
Inscription : avril 2004
Messages : 734
Points : 1 281
Points : 1 281
En attendant, tu peux toujours préparer le rattrapage des données pour mettre à jour l'esclave(si ça ne remarche pas automatiquement of course). Par contre, lors du redémarrage du maitre, regarde un coup les logs pour voir s'il n'y a pas une erreur au redémarrage. Et puis il faudrait vérifier que le bin-log est bien mis à jour... bref, que de boulot
__________________
Pensez au tag
Adjanakis est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 12/01/2007, 16h20   #20
Futur Membre du Club
 
Inscription : janvier 2007
Messages : 29
Détails du profil
Informations forums :
Inscription : janvier 2007
Messages : 29
Points : 16
Points : 16
T'imagines même pas !! lol
didlette62 est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 00h56.


 
 
 
 
Partenaires

Hébergement Web