* [Tarantool-discussions] Мозгоштурм: Фейловер с режимом деградации
@ 2021-08-14 16:13 Дмитрий Обухов via Tarantool-discussions
2021-08-15 7:56 ` Konstantin Osipov via Tarantool-discussions
0 siblings, 1 reply; 4+ messages in thread
From: Дмитрий Обухов via Tarantool-discussions @ 2021-08-14 16:13 UTC (permalink / raw)
To: tarantool-discussions
[-- Attachment #1: Type: text/plain, Size: 4142 bytes --]
А вот давайте попробуем пообсуждать здесь. Может такой формат больше народу подойдёт.
В этом релизе у нас появляется автоматический фейловер «на борту» Тарантула — RAFT.
Это прекрасное событие, однако у него есть некоторые недостатки:
- Беспроблемные гарантированные выборы возможны только если число участников выборов нечётное. Или число кворума больше половины числа участников на 1. Для 2 — это 2. Для 3 это 2. Для 4 это 3.
Кроме того ещё несколько вводных в виде F.A.Q:
Q: Для чего пользователи ставят репликасет в нескольких ДЦ?
A: Чтобы при недоступности одного (или нескольких) ДЦ сервис продолжал работу.
Q: Если сервис располагается в X датацентрах, умерли все кроме одного последнего. Хочет ли пользователь чтоб его сервис был доступен клиентам?
A: Безусловно
Q: Какая инсталляция по нескольким ДЦ самая популярная?
A: Инсталляция на 2 независимых ДЦ (минимальный случай резервирования, экономически самый дешёвый)
Если порефлексировать над этими вводными, то мы можем сформулировать требования к «идеальному» фейловеру:
- Работоспособность сервиса должна сохраняться «до последнего ДЦ»
- Из предыдущего пункта следует необходимость поддержки «режима деградации» — по аналогии с режимом деградациии в RAID: отключили винчестер, избыточность исчезла, но RAID продолжает работу
- Работоспособность сервиса не должна «предпочитать» чётные/нечётные числа, а должна сохраняться при снижении числа работоспособных узлов от N до 1.
Исходя из перечисленного, я вижу RAFT — это только подузел такого механизма, а над ним действуют какие-то правила, которые плавно снижают кворум, выводя из игры недоступные узлы, вплоть до 1 (кворума нет, остался последний боец).
Очевидно (мне очевидно, я могу ошибаться), что такой фейловер невозможен, если только сами узлы будут решать кто главный: рано или поздно ситуация что кластер разделился на две независимые половины, каждая со своим главным — произойдёт.
Если взглянуть на многие пользовательские сервисы, то увидим, что пользователи заходят на них через одну точку входа: на mail.ru — через адрес mail.ru. На сервис банка — через адрес банка. И так далее. Возможно, если разместить stateful мониторы в этих точках, то подобный фейловер можно реализовать?
Есть у кого-то мысли как построить подобный фейловер?
--
Дмитрий Обухов
[-- Attachment #2: Type: text/html, Size: 4667 bytes --]
^ permalink raw reply [flat|nested] 4+ messages in thread
* Re: [Tarantool-discussions] Мозгоштурм: Фейловер с режимом деградации
2021-08-14 16:13 [Tarantool-discussions] Мозгоштурм: Фейловер с режимом деградации Дмитрий Обухов via Tarantool-discussions
@ 2021-08-15 7:56 ` Konstantin Osipov via Tarantool-discussions
0 siblings, 0 replies; 4+ messages in thread
From: Konstantin Osipov via Tarantool-discussions @ 2021-08-15 7:56 UTC (permalink / raw)
To: Дмитрий
Обухов
Cc: tarantool-discussions
* Дмитрий Обухов via Tarantool-discussions <tarantool-discussions@dev.tarantool.org> [21/08/15 03:02]:
Сначала надо реализовать изменение конфигурации как часть
протокола Рафт, и реализовать raft learner расширение протокола,
описанное в PhD.
Проблему чётного числа узлов нужно решать именно с помощью raft
learners (non-voting nodes).
Режим автоматического уменьшения размера кворума описан в PhD и
был реализован, по сути это автоматическая инициация configuration
change после длительной недоступности одного узла.
Репликационный фактор, как и placement/locality - это свойство
данных, а не свойство топологии. Для одной таблицы он может быть
3, для других 7, при этом дата центра может быть хоть 2 хоть 10. И
менятьего должен DBA а не СУБД автоматически. То что в тарантуле
это "слито" воедино - просто наследственность.
> А вот давайте попробуем пообсуждать здесь. Может такой формат больше народу подойдёт.
>
> В этом релизе у нас появляется автоматический фейловер «на борту» Тарантула — RAFT.
>
> Это прекрасное событие, однако у него есть некоторые недостатки:
>
> - Беспроблемные гарантированные выборы возможны только если число участников выборов нечётное. Или число кворума больше половины числа участников на 1. Для 2 — это 2. Для 3 это 2. Для 4 это 3.
>
> Кроме того ещё несколько вводных в виде F.A.Q:
>
> Q: Для чего пользователи ставят репликасет в нескольких ДЦ?
> A: Чтобы при недоступности одного (или нескольких) ДЦ сервис продолжал работу.
>
> Q: Если сервис располагается в X датацентрах, умерли все кроме одного последнего. Хочет ли пользователь чтоб его сервис был доступен клиентам?
> A: Безусловно
>
> Q: Какая инсталляция по нескольким ДЦ самая популярная?
> A: Инсталляция на 2 независимых ДЦ (минимальный случай резервирования, экономически самый дешёвый)
>
>
> Если порефлексировать над этими вводными, то мы можем сформулировать требования к «идеальному» фейловеру:
>
> - Работоспособность сервиса должна сохраняться «до последнего ДЦ»
> - Из предыдущего пункта следует необходимость поддержки «режима деградации» — по аналогии с режимом деградациии в RAID: отключили винчестер, избыточность исчезла, но RAID продолжает работу
> - Работоспособность сервиса не должна «предпочитать» чётные/нечётные числа, а должна сохраняться при снижении числа работоспособных узлов от N до 1.
>
>
> Исходя из перечисленного, я вижу RAFT — это только подузел такого механизма, а над ним действуют какие-то правила, которые плавно снижают кворум, выводя из игры недоступные узлы, вплоть до 1 (кворума нет, остался последний боец).
>
> Очевидно (мне очевидно, я могу ошибаться), что такой фейловер невозможен, если только сами узлы будут решать кто главный: рано или поздно ситуация что кластер разделился на две независимые половины, каждая со своим главным — произойдёт.
>
> Если взглянуть на многие пользовательские сервисы, то увидим, что пользователи заходят на них через одну точку входа: на mail.ru — через адрес mail.ru. На сервис банка — через адрес банка. И так далее. Возможно, если разместить stateful мониторы в этих точках, то подобный фейловер можно реализовать?
>
> Есть у кого-то мысли как построить подобный фейловер?
>
> --
> Дмитрий Обухов
--
Konstantin Osipov, Moscow, Russia
^ permalink raw reply [flat|nested] 4+ messages in thread
* Re: [Tarantool-discussions] Говорят у нас проблемы с почтой
2020-11-26 16:39 [Tarantool-discussions] Говорят у нас проблемы с почтой Timur Safin
@ 2020-11-26 16:40 ` Тимур Сафин
0 siblings, 0 replies; 4+ messages in thread
From: Тимур Сафин @ 2020-11-26 16:40 UTC (permalink / raw)
To: tarantool-discussions
[-- Attachment #1: Type: text/plain, Size: 439 bytes --]
C и на @tarantool.org доходит. Давайте проверим посылку от @corp.mail.ru?
From: Tarantool-discussions <tarantool-discussions-bounces@dev.tarantool.org> On Behalf Of Timur Safin
Sent: Thursday, November 26, 2020 7:39 PM
To: tarantool-discussions@dev.tarantool.org
Subject: [Tarantool-discussions] Говорят у нас проблемы с почтой
Давайте проверим!
[-- Attachment #2: Type: text/html, Size: 41402 bytes --]
^ permalink raw reply [flat|nested] 4+ messages in thread
* [Tarantool-discussions] Говорят у нас проблемы с почтой
@ 2020-11-26 16:39 Timur Safin
2020-11-26 16:40 ` Тимур Сафин
0 siblings, 1 reply; 4+ messages in thread
From: Timur Safin @ 2020-11-26 16:39 UTC (permalink / raw)
To: tarantool-discussions
[-- Attachment #1: Type: text/plain, Size: 40 bytes --]
Давайте проверим!
[-- Attachment #2: Type: text/html, Size: 36940 bytes --]
^ permalink raw reply [flat|nested] 4+ messages in thread
end of thread, other threads:[~2021-08-15 7:56 UTC | newest]
Thread overview: 4+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2021-08-14 16:13 [Tarantool-discussions] Мозгоштурм: Фейловер с режимом деградации Дмитрий Обухов via Tarantool-discussions
2021-08-15 7:56 ` Konstantin Osipov via Tarantool-discussions
-- strict thread matches above, loose matches on Subject: below --
2020-11-26 16:39 [Tarantool-discussions] Говорят у нас проблемы с почтой Timur Safin
2020-11-26 16:40 ` Тимур Сафин
This is a public inbox, see mirroring instructions
for how to clone and mirror all data and code used for this inbox