From: Konstantin Osipov via Tarantool-discussions <tarantool-discussions@dev.tarantool.org>
To: "Дмитрий Обухов" <d.oboukhov@corp.mail.ru>
Cc: tarantool-discussions@dev.tarantool.org
Subject: Re: [Tarantool-discussions] Мозгоштурм: Фейловер с режимом деградации
Date: Sun, 15 Aug 2021 10:56:54 +0300 [thread overview]
Message-ID: <20210815075654.GA22409@starling> (raw)
In-Reply-To: <1628957596.509402934@f394.i.mail.ru>
* Дмитрий Обухов via Tarantool-discussions <tarantool-discussions@dev.tarantool.org> [21/08/15 03:02]:
Сначала надо реализовать изменение конфигурации как часть
протокола Рафт, и реализовать raft learner расширение протокола,
описанное в PhD.
Проблему чётного числа узлов нужно решать именно с помощью raft
learners (non-voting nodes).
Режим автоматического уменьшения размера кворума описан в PhD и
был реализован, по сути это автоматическая инициация configuration
change после длительной недоступности одного узла.
Репликационный фактор, как и placement/locality - это свойство
данных, а не свойство топологии. Для одной таблицы он может быть
3, для других 7, при этом дата центра может быть хоть 2 хоть 10. И
менятьего должен DBA а не СУБД автоматически. То что в тарантуле
это "слито" воедино - просто наследственность.
> А вот давайте попробуем пообсуждать здесь. Может такой формат больше народу подойдёт.
>
> В этом релизе у нас появляется автоматический фейловер «на борту» Тарантула — RAFT.
>
> Это прекрасное событие, однако у него есть некоторые недостатки:
>
> - Беспроблемные гарантированные выборы возможны только если число участников выборов нечётное. Или число кворума больше половины числа участников на 1. Для 2 — это 2. Для 3 это 2. Для 4 это 3.
>
> Кроме того ещё несколько вводных в виде F.A.Q:
>
> Q: Для чего пользователи ставят репликасет в нескольких ДЦ?
> A: Чтобы при недоступности одного (или нескольких) ДЦ сервис продолжал работу.
>
> Q: Если сервис располагается в X датацентрах, умерли все кроме одного последнего. Хочет ли пользователь чтоб его сервис был доступен клиентам?
> A: Безусловно
>
> Q: Какая инсталляция по нескольким ДЦ самая популярная?
> A: Инсталляция на 2 независимых ДЦ (минимальный случай резервирования, экономически самый дешёвый)
>
>
> Если порефлексировать над этими вводными, то мы можем сформулировать требования к «идеальному» фейловеру:
>
> - Работоспособность сервиса должна сохраняться «до последнего ДЦ»
> - Из предыдущего пункта следует необходимость поддержки «режима деградации» — по аналогии с режимом деградациии в RAID: отключили винчестер, избыточность исчезла, но RAID продолжает работу
> - Работоспособность сервиса не должна «предпочитать» чётные/нечётные числа, а должна сохраняться при снижении числа работоспособных узлов от N до 1.
>
>
> Исходя из перечисленного, я вижу RAFT — это только подузел такого механизма, а над ним действуют какие-то правила, которые плавно снижают кворум, выводя из игры недоступные узлы, вплоть до 1 (кворума нет, остался последний боец).
>
> Очевидно (мне очевидно, я могу ошибаться), что такой фейловер невозможен, если только сами узлы будут решать кто главный: рано или поздно ситуация что кластер разделился на две независимые половины, каждая со своим главным — произойдёт.
>
> Если взглянуть на многие пользовательские сервисы, то увидим, что пользователи заходят на них через одну точку входа: на mail.ru — через адрес mail.ru. На сервис банка — через адрес банка. И так далее. Возможно, если разместить stateful мониторы в этих точках, то подобный фейловер можно реализовать?
>
> Есть у кого-то мысли как построить подобный фейловер?
>
> --
> Дмитрий Обухов
--
Konstantin Osipov, Moscow, Russia
next prev parent reply other threads:[~2021-08-15 7:56 UTC|newest]
Thread overview: 4+ messages / expand[flat|nested] mbox.gz Atom feed top
2021-08-14 16:13 Дмитрий Обухов via Tarantool-discussions
2021-08-15 7:56 ` Konstantin Osipov via Tarantool-discussions [this message]
-- strict thread matches above, loose matches on Subject: below --
2020-11-26 16:39 [Tarantool-discussions] Говорят у нас проблемы с почтой Timur Safin
2020-11-26 16:40 ` Тимур Сафин
Reply instructions:
You may reply publicly to this message via plain-text email
using any one of the following methods:
* Save the following mbox file, import it into your mail client,
and reply-to-all from there: mbox
Avoid top-posting and favor interleaved quoting:
https://en.wikipedia.org/wiki/Posting_style#Interleaved_style
* Reply using the --to, --cc, and --in-reply-to
switches of git-send-email(1):
git send-email \
--in-reply-to=20210815075654.GA22409@starling \
--to=tarantool-discussions@dev.tarantool.org \
--cc=d.oboukhov@corp.mail.ru \
--cc=kostja.osipov@gmail.com \
--subject='Re: [Tarantool-discussions] Мозгоштурм: Фейловер с режимом деградации' \
/path/to/YOUR_REPLY
https://kernel.org/pub/software/scm/git/docs/git-send-email.html
* If your mail client supports setting the In-Reply-To header
via mailto: links, try the mailto: link
This is a public inbox, see mirroring instructions
for how to clone and mirror all data and code used for this inbox