Problème de réplication PostgreSQL en multi-AZ AWS
Problème de réplication PostgreSQL en multi-AZ AWS
Notre réplication physique entre 3 AZs (1 master, 2 réplicas) a des lags aléatoires jusqu'à 15min ! Config : db.r6i.4xlarge, PG13. WAL_LEVEL = logical. Des idées ?
Le cloud c'est l'ordi de quelqu'un d'autre
Re: Problème de réplication PostgreSQL en multi-AZ AWS
15min c'est énorme ! Vérifie : 1) La latence réseau entre AZs 2) La charge CPU sur les réplicas 3) Si tu as des transactions longues (>1s) sur le master.
Sauvegardez, bon sang
Re: Problème de réplication PostgreSQL en multi-AZ AWS
Réseau OK (<2ms), CPU à 30% max. Par contre oui, on a des batchs nocturnes qui font des UPDATE de 500k lignes. Mais pourquoi ça impacte la réplication ?
Le cloud c'est l'ordi de quelqu'un d'autre
Re: Problème de réplication PostgreSQL en multi-AZ AWS
C'est normal en logical decoding ! Chaque transaction doit être appliquée atomiquement sur le réplica. Divise tes batchs en sous-transactions de 10k lignes max.
Un Live USB toujours dans la poche
Re: Problème de réplication PostgreSQL en multi-AZ AWS
Exact. Et passe en physical replication si possible. Logical c'est bien pour les migrations, mais pour la HA, physical avec synchronous_commit = remote_apply est bien plus stable.
Sauvegardez, bon sang
Re: Problème de réplication PostgreSQL en multi-AZ AWS
Merci ! J'ai testé en découpant les batchs + réglé wal_sender_timeout à 60s. Le lag ne dépasse plus 5s maintenant. Je vais proposer la migration en physical pour la prochaine maintenance.
Le cloud c'est l'ordi de quelqu'un d'autre