yandex · noname0443 · Mar 5, 2025 · Feb 13, 2025 · Feb 14, 2025 · Feb 14, 2025
diff --git a/internal/app/app.go b/internal/app/app.go
@@ -1201,10 +1201,16 @@ func (app *App) updateActiveNodes(clusterState, clusterStateDcs map[string]*Node
 	}
 
 	// and finally enlarge HA-group, if needed
-	for _, host := range becomeActive {
-		err := app.enableSemiSyncOnSlave(host, clusterState[host], masterState)
+	for _, hostname := range becomeActive {
+		err := app.enableSemiSyncOnSlave(hostname, clusterState[hostname], masterState)
 		if err != nil {
-			app.logger.Errorf("failed to enable semi-sync on slave %s: %v", host, err)
+			app.logger.Errorf("failed to enable semi-sync on slave %s: %v", hostname, err)
+		}
+
+		host := app.cluster.Get(hostname)
+		err = host.SetDefaultReplicationSettings(masterNode)
+		if err != nil {
+			app.logger.Errorf("failed to set default replication settings %s: %v", hostname, err)
 		}
 	}
 	if waitSlaveCount < oldWaitSlaveCount {
@@ -1304,6 +1310,105 @@ func (app *App) disableSemiSyncIfNonNeeded(node *mysql.Node, state *NodeState) {
 	}
 }
 
+func (app *App) optimizeReplicaWithSmallestLag(
+	replicas []string,
+	masterHost string,
+	optionalDesirableReplica string,
+) error {
+	hostnameToOptimize, err := app.chooseReplicaToOptimize(optionalDesirableReplica, replicas)
+	if err != nil {
+		return err
+	}
+
+	replicaToOptimize := app.cluster.Get(hostnameToOptimize)
+	isOptimized, err := app.isReplicationLagUnderThreshold(replicaToOptimize)
+	if err != nil {
+		return err
+	}
+	if isOptimized {
+		return nil
+	}
+
+	err = replicaToOptimize.OptimizeReplication()
+	if err != nil {
+		return err
+	}
+	defer func() {
+		masterNode := app.cluster.Get(masterHost)
+		err = replicaToOptimize.SetDefaultReplicationSettings(masterNode)
+		if err != nil {
+			app.logger.Error("can't set default replication settings")
+		}
+	}()
+
+	return app.waitReplicaToConverge(replicaToOptimize)
+}
+
+func (app *App) chooseReplicaToOptimize(
+	optionalDesirableReplica string,
+	replicas []string,
+) (string, error) {
+	if len(optionalDesirableReplica) > 0 {
+		return optionalDesirableReplica, nil
+	}
+
+	positions, err := app.getNodePositions(replicas)
+	if err != nil {
+		return "", err
+	}
+
+	hostnameToOptimize, err := app.getMostDesirableReplicaToOptimize(positions)
+	if err != nil {
+		return "", err
+	}
+	app.logger.Infof("replica optimization: the replica is '%s'", hostnameToOptimize)
+
+	return hostnameToOptimize, nil
+}
+
+func (app *App) getMostDesirableReplicaToOptimize(positions []nodePosition) (string, error) {
+	lagThreshold := app.config.OptimizeReplicationLagThreshold
+	return getMostDesirableNode(app.logger, positions, lagThreshold)
+}
+
+func (app *App) waitReplicaToConverge(
+	replica *mysql.Node,
+) error {
+	timer := time.NewTimer(app.config.OptimizeReplicationConvergenceTimeout)
+	for {
+		select {
+		case <-timer.C:
+			return errors.New(DeadlineExceeded)
+		default:
+			lagUnderThreshold, err := app.isReplicationLagUnderThreshold(replica)
+			if err != nil {
+				app.logger.Infof("can't check replication status: %s", err.Error())
+			}
+			if lagUnderThreshold {
+				return nil
+			}
+			time.Sleep(time.Second)
+		}
+	}
+}
+
+func (app *App) isReplicationLagUnderThreshold(
+	replica *mysql.Node,
+) (bool, error) {
+	status, err := replica.GetReplicaStatus()
+	if err != nil {
+		return false, err
+	}
+
+	lag := status.GetReplicationLag().Float64
+	lagThreshold := app.config.OptimizeReplicationLagThreshold.Seconds()
+
+	if !app.config.ASync && lag < lagThreshold {
+		return true, nil
+	}
+	return false, nil
+}
+
 // nolint: gocyclo, funlen
 func (app *App) performSwitchover(clusterState map[string]*NodeState, activeNodes []string, switchover *Switchover, oldMaster string) error {
 	if switchover.To != "" {
@@ -1323,6 +1428,11 @@ func (app *App) performSwitchover(clusterState map[string]*NodeState, activeNode
 		activeNodes = filterOut(activeNodes, []string{oldMaster})
 	}
 
+	err := app.optimizationPhase(activeNodes, switchover, oldMaster)
+	if err != nil {
+		return err
+	}
+
 	// set read only everywhere (all HA-nodes) and stop replication
 	app.logger.Info("switchover: phase 1: enter read only")
 	errs := util.RunParallel(func(host string) error {
@@ -1404,7 +1514,7 @@ func (app *App) performSwitchover(clusterState map[string]*NodeState, activeNode
 			frozenActiveNodes = append(frozenActiveNodes, host)
 		}
 	}
-	err := app.switchHelper.CheckFailoverQuorum(activeNodesWithOldMaster, len(frozenActiveNodes))
+	err = app.switchHelper.CheckFailoverQuorum(activeNodesWithOldMaster, len(frozenActiveNodes))
 	if err != nil {
 		return err
 	}
@@ -1583,6 +1693,44 @@ func (app *App) performSwitchover(clusterState map[string]*NodeState, activeNode
 	return nil
 }
 
+func (app *App) optimizationPhase(activeNodes []string, switchover *Switchover, oldMaster string) error {
+	if !app.switchHelper.IsOptimizationPhaseAllowed() {
+		app.logger.Info("switchover: phase 0: turbo mode is skipped")
+		return nil
+	}
+
+	appropriateReplicas := filterOut(activeNodes, []string{oldMaster, switchover.From})
+	desirableReplica := switchover.To
+
+	app.logger.Infof(
+		"switchover: phase 0: enter turbo mode; replicas: %v, oldMaster: '%s', desirable replica: '%s'",
+		appropriateReplicas,
+		oldMaster,
+		desirableReplica,
+	)
+	err := app.optimizeReplicaWithSmallestLag(
+		appropriateReplicas,
+		oldMaster,
+		desirableReplica,
+	)
+	if err != nil && err.Error() == DeadlineExceeded {
+		app.logger.Infof("switchover: phase 0: turbo mode failed: %v", err)
+		switchErr := app.FinishSwitchover(switchover, fmt.Errorf("turbo mode exceeded deadline"))
+		if switchErr != nil {
+			return fmt.Errorf("switchover: failed to reject switchover %s", switchErr)
+		}
+		app.logger.Info("switchover: rejected")
+		return err
+	}
+
+	// Conceptually, we should only reject the switchover if we encounter a DeadlineExceeded error.
+	// This indicates that the replica with the freshest data is too far from convergence,
+	// and we can't optimize it within a limited time frame.
+	// Other cases can be handled in subsequent steps, so no special action is needed here.
+	app.logger.Info("switchover: phase 0: turbo mode is complete")
+	return nil
+}
+
 func (app *App) getCurrentMaster(clusterState map[string]*NodeState) (string, error) {
 	master, err := app.GetMasterHostFromDcs()
 	if master != "" && err == nil {

diff --git a/internal/app/util.go b/internal/app/util.go
@@ -10,6 +10,10 @@ import (
 	"github.com/yandex/mysync/internal/util"
 )
 
+const (
+	DeadlineExceeded = "deadline exceeded"
+)
+
 type nodePosition struct {
 	host     string
 	gtidset  gtids.GTIDSet

diff --git a/internal/config/config.go b/internal/config/config.go
@@ -99,9 +99,11 @@ type Config struct {
 	ReplMonErrorWaitInterval                time.Duration                `config:"repl_mon_error_wait_interval" yaml:"repl_mon_error_wait_interval"`
 	ReplMonSlaveWaitInterval                time.Duration                `config:"repl_mon_slave_wait_interval" yaml:"repl_mon_slave_wait_interval"`
 	ShowOnlyGTIDDiff                        bool                         `config:"show_only_gtid_diff" yaml:"show_only_gtid_diff"`
-	ManagerSwitchover                       bool                         `config:"manager_switchover" yaml:"manager_switchover"`
 	ForceSwitchover                         bool                         `config:"force_switchover" yaml:"force_switchover"` // TODO: Remove when we will be sure it's right way to do switchover
 	DSNSettings                             string                       `config:"dsn_settings" yaml:"dsn_settings"`
+	ManagerSwitchover                       bool                         `config:"manager_switchover" yaml:"manager_switchover"`
+	OptimizeReplicationLagThreshold         time.Duration                `config:"optimize_replication_lag_threshold" yaml:"optimize_replication_lag_threshold"`
+	OptimizeReplicationConvergenceTimeout   time.Duration                `config:"optimize_replication_convergence_timeout" yaml:"optimize_replication_convergence_timeout"`
 }
 
 // DefaultConfig returns default configuration for MySync
@@ -192,6 +194,8 @@ func DefaultConfig() (Config, error) {
 		ManagerSwitchover:                       false,
 		ForceSwitchover:                         false,
 		DSNSettings:                             "?autocommit=1&sql_log_off=1",
+		OptimizeReplicationLagThreshold:         60 * time.Second,
+		OptimizeReplicationConvergenceTimeout:   300 * time.Second,
 	}
 	return config, nil
 }

diff --git a/internal/mysql/switch_helper.go b/internal/mysql/switch_helper.go
@@ -12,12 +12,14 @@ type ISwitchHelper interface {
 	GetRequiredWaitSlaveCount([]string) int
 	GetFailoverQuorum([]string) int
 	CheckFailoverQuorum([]string, int) error
+	IsOptimizationPhaseAllowed() bool
 }
 
 type SwitchHelper struct {
 	priorityChoiceMaxLag               time.Duration
 	rplSemiSyncMasterWaitForSlaveCount int
 	SemiSync                           bool
+	ASync                              bool
 }
 
 func NewSwitchHelper(config *config.Config) ISwitchHelper {
@@ -31,6 +33,7 @@ func NewSwitchHelper(config *config.Config) ISwitchHelper {
 		priorityChoiceMaxLag:               priorityChoiceMaxLag,
 		rplSemiSyncMasterWaitForSlaveCount: config.RplSemiSyncMasterWaitForSlaveCount,
 		SemiSync:                           config.SemiSync,
+		ASync:                              config.ASync,
 	}
 }
 
@@ -71,3 +74,7 @@ func (sh *SwitchHelper) CheckFailoverQuorum(activeNodes []string, permissibleSla
 	}
 	return nil
 }
+
+func (sh *SwitchHelper) IsOptimizationPhaseAllowed() bool {
+	return !sh.ASync
+}
diff --git a/tests/images/mysql/mysync.yaml b/tests/images/mysql/mysync.yaml
@@ -66,3 +66,5 @@ force_switchover: ${FORCE_SWITCHOVER:-false}
 manager_switchover: ${MANAGER_SWITCHOVER:-true}
 manager_election_delay_after_quorum_loss: ${MANAGER_ELECTION_DELAY_AFTER_QUORUM_LOSS:-15s}
 manager_lock_acquire_delay_after_quorum_loss: ${MANAGER_LOCK_ACQUIRE_DELAY_AFTER_QUORUM_LOSS:-30s}
+optimize_replication_lag_threshold: 60s
+optimize_replication_convergence_timeout: 300s