Tarantool discussions archive
 help / color / mirror / Atom feed
From: Konstantin Osipov via Tarantool-discussions <tarantool-discussions@dev.tarantool.org>
To: "Дмитрий Обухов" <d.oboukhov@corp.mail.ru>
Cc: tarantool-discussions@dev.tarantool.org
Subject: Re: [Tarantool-discussions]  Мозгоштурм: Фейловер с режимом деградации
Date: Sun, 15 Aug 2021 10:56:54 +0300	[thread overview]
Message-ID: <20210815075654.GA22409@starling> (raw)
In-Reply-To: <1628957596.509402934@f394.i.mail.ru>

* Дмитрий Обухов via Tarantool-discussions <tarantool-discussions@dev.tarantool.org> [21/08/15 03:02]:

Сначала надо реализовать изменение конфигурации как часть
протокола Рафт, и реализовать raft learner расширение протокола,
описанное в PhD.

Проблему чётного числа узлов нужно решать именно с помощью raft
learners (non-voting nodes).

Режим автоматического уменьшения размера кворума описан в PhD и
был реализован, по сути это автоматическая инициация configuration
change после длительной недоступности одного узла. 

Репликационный фактор, как и placement/locality - это свойство
данных, а не свойство топологии. Для одной таблицы он может быть
3, для других 7, при этом дата центра может быть хоть 2 хоть 10. И
менятьего должен DBA а не СУБД автоматически. То что в тарантуле
это "слито" воедино - просто наследственность.
 
> А вот давайте попробуем пообсуждать здесь. Может такой формат больше народу подойдёт.
>  
> В этом релизе у нас появляется автоматический фейловер «на борту» Тарантула — RAFT.
>  
> Это прекрасное событие, однако у него есть некоторые недостатки:
> 
> - Беспроблемные гарантированные выборы возможны только если число участников выборов нечётное. Или число кворума больше половины числа участников на 1. Для 2 — это 2. Для 3 это 2. Для 4 это 3.
>  
> Кроме того ещё несколько вводных в виде F.A.Q:
>  
> Q: Для чего пользователи ставят репликасет в нескольких ДЦ?
> A: Чтобы при недоступности одного (или нескольких) ДЦ сервис продолжал работу.
>  
> Q: Если сервис располагается в X датацентрах, умерли все кроме одного последнего. Хочет ли пользователь чтоб его сервис был доступен клиентам?
> A: Безусловно
>  
> Q: Какая инсталляция по нескольким ДЦ самая популярная?
> A: Инсталляция на 2 независимых ДЦ (минимальный случай резервирования, экономически самый дешёвый)
>  
>  
> Если порефлексировать над этими вводными, то мы можем сформулировать требования к «идеальному» фейловеру:
>  
> - Работоспособность сервиса должна сохраняться «до последнего ДЦ»
> - Из предыдущего пункта следует необходимость поддержки «режима деградации» — по аналогии с режимом деградациии в RAID: отключили винчестер, избыточность исчезла, но RAID продолжает работу
> - Работоспособность сервиса не должна «предпочитать» чётные/нечётные числа, а должна сохраняться при снижении числа работоспособных узлов от N до 1.
>  
>  
> Исходя из перечисленного, я вижу RAFT — это только подузел такого механизма, а над ним действуют какие-то правила, которые плавно снижают кворум, выводя из игры недоступные узлы, вплоть до 1 (кворума нет, остался последний боец).
>  
> Очевидно (мне очевидно, я могу ошибаться), что такой фейловер невозможен, если только сами узлы будут решать кто главный: рано или поздно ситуация что кластер разделился на две независимые половины, каждая со своим главным — произойдёт.
>  
> Если взглянуть на многие пользовательские сервисы, то увидим, что пользователи заходят на них через одну точку входа: на mail.ru — через адрес mail.ru. На сервис банка — через адрес банка. И так далее. Возможно, если разместить stateful мониторы в этих точках, то подобный фейловер можно реализовать?
>  
> Есть у кого-то мысли как построить подобный фейловер?
>  
> --
> Дмитрий Обухов

-- 
Konstantin Osipov, Moscow, Russia

  reply	other threads:[~2021-08-15  7:56 UTC|newest]

Thread overview: 4+ messages / expand[flat|nested]  mbox.gz  Atom feed  top
2021-08-14 16:13 Дмитрий Обухов via Tarantool-discussions
2021-08-15  7:56 ` Konstantin Osipov via Tarantool-discussions [this message]
  -- strict thread matches above, loose matches on Subject: below --
2020-11-26 16:39 [Tarantool-discussions] Говорят у нас проблемы с почтой Timur Safin
2020-11-26 16:40 ` Тимур Сафин

Reply instructions:

You may reply publicly to this message via plain-text email
using any one of the following methods:

* Save the following mbox file, import it into your mail client,
  and reply-to-all from there: mbox

  Avoid top-posting and favor interleaved quoting:
  https://en.wikipedia.org/wiki/Posting_style#Interleaved_style

* Reply using the --to, --cc, and --in-reply-to
  switches of git-send-email(1):

  git send-email \
    --in-reply-to=20210815075654.GA22409@starling \
    --to=tarantool-discussions@dev.tarantool.org \
    --cc=d.oboukhov@corp.mail.ru \
    --cc=kostja.osipov@gmail.com \
    --subject='Re: [Tarantool-discussions]  Мозгоштурм: Фейловер с режимом деградации' \
    /path/to/YOUR_REPLY

  https://kernel.org/pub/software/scm/git/docs/git-send-email.html

* If your mail client supports setting the In-Reply-To header
  via mailto: links, try the mailto: link

This is a public inbox, see mirroring instructions
for how to clone and mirror all data and code used for this inbox