From: Cyrill Gorcunov via Tarantool-patches <tarantool-patches@dev.tarantool.org> To: Vladislav Shpilevoy <v.shpilevoy@tarantool.org> Cc: tml <tarantool-patches@dev.tarantool.org> Subject: Re: [Tarantool-patches] [PATCH] limbo: introduce request processing hooks Date: Tue, 13 Jul 2021 01:32:53 +0300 [thread overview] Message-ID: <YOzDFflt+MqiOjBG@grain> (raw) In-Reply-To: <51e97609-c593-0693-1133-ae09dfbc78cc@tarantool.org> On Mon, Jul 12, 2021 at 11:20:17PM +0200, Vladislav Shpilevoy wrote: > >> > >> That is the core problem of your entire approach - why do you imagine > >> we update promote_term_map before writing to WAL? We do not do that. > > > > We don't do that now, and this is all this patch about - we must not > > write the PROMOTE from split-brained node into our wal file at all, > > for exactly this reason I splitted processing into phases: "filter" and > > "application". > > Я вижу, я не могу на английском объяснить. Да, мы не делаем этого сейчас. > Зачем ты начинаешь это делать в своем патче? Ничего не должно меняться > до записи в WAL. Ни vclock с термами, ни что-либо еще. Лимб должен быть > const пока запись в WAL не кончена. > > Я вижу, что ты split processing, но ты на самом деле сделал не filter и > application. Ты сделал apply part 1 и apply part 2. У тебя обе стадии > меняют лимб. Зачем? Filter не должен менять вообще ничего. Только > проверять и отсеивать с ошибкой, если что не так. Потому что выходить с какой-то ошибкой изнутри WAL уже нельзя. Смотри, вот как сейчас фильтруется (с моим патчем) static int limbo_op_filter(struct txn_limbo *limbo, const struct synchro_request *req) { struct txn_limbo_promote *pmt = &limbo->promote; uint32_t origin = req->origin_id; uint64_t term = req->term; if (txn_limbo_replica_term(limbo, origin) < term) { vclock_follow(&pmt->terms_infly, origin, term); if (term > pmt->term_max) pmt->term_max = term; } else if (iproto_type_is_promote_request(req->type) && pmt->term_max > 1) { say_info("RAFT: declining %s request from instance " "id %u for term %llu. Greatest term seen " "before (%llu) is bigger.", iproto_type_name(req->type), origin, (long long)term, (long long)pmt->term_max); diag_set(ClientError, ER_UNSUPPORTED, "RAFT", "backward terms"); --> return -1; } return 0; } Это делается до записи в вал, чтобы ловить одновременно приходящие промоты от разных реплик, пропускать только первый валидный, а остальные выкидывать с ошибкой. Так что ты правильно говоришь ниже, что это защита. Если я не буду ловить такие данные до записи в вал, то получится следующая ситуация: приходит пакет, который будет модифицировать txn_limbo_replica_term, уходит на запись в вал и мы переключаемся на другой апплаер, с него приходит промот, который мы по идее не должны пропустить. Но мы пропускаем, и тоже пихаем его в очередь на запись в вал, просто потому что первая запись в вал еще не успела отработать. Получается такая зависимость от таймингов, если запись отрабатывает быстро, то и фильтрация отловит плохой промот, а если нет, то не отловит. В итоге в вале сможет появиться промот, которого там быть не должно. Сейчас нам пофигу до такой ситуации, потому что мы просто игнорим такие вещи. Но раз мы хотим отваливаться с ошибкой, то отваливаться надо в ранней стадии, даже до того, как данные в вал попадают. Либо надо тогда быть готовым, к тому что в wal будут какие-то промоты которые надо проигнорировать на рестарте. > > >> And you should not do that. Before WAL write there should no be any > >> changes. **Zero changes before WAL write**. Before you write to WAL, > >> you can only validate requests. Using `const struct txn_limbo *`. With > >> zero changes. > > > > If we write screwed PROMOTEs request into our WAL then this patch is not > > needed at all. > > Я не говорил, что надо писать плохие PROMOTE. Я говорю, что ты можешь > их отсеивать с ошибкой не делая никаких изменений состояния лимба до > записи в WAL. Да вот похоже, что не могу (если без локов). > Я так понимаю, ты пытаешься как-то защититься от того, что одновременно > пришло несколько PROMOTE, и пока один пишется, надо остальные сразу > отлупить? Так делает для обычных данных аплаер - он двигает vclock > кластера до записи в WAL, и копирует его в replicaset.vclock если > запись удалась. При этом если во время записи придут еще такие же > транзакции от других инстансов, то они сразу отфильтруются. > > Но в лимбе нет такой проблемы, что все надо делать параллельно. При > любых "паралеллельных" промоутах, конфирмах и прочих изменениях > состояния лимба лучше просто брать на него лок и все. Эти вещи > параллельно от разных инстансов приходить не должны во время нормальной > работы, так что это по перфу самого частого случая не ударит нисколько, > а код упростит значительно. Ну технически да, можно лок\латч взять, для модификаций промота и вклок термов. Это уберет необходимость infly модификаций, что я сделал для filter phase. Я наоборот, хотел избежать локов, но давай действительно попробуем с локами. Если вдруг будет жесткая просадка, то вернемся на схему с inlfy переменными и их обновлениями после записи в вал. Я пока бранч старый удалять не буду. Cyrill
next prev parent reply other threads:[~2021-07-12 22:32 UTC|newest] Thread overview: 21+ messages / expand[flat|nested] mbox.gz Atom feed top 2021-07-10 22:28 Cyrill Gorcunov via Tarantool-patches 2021-07-11 14:00 ` Vladislav Shpilevoy via Tarantool-patches 2021-07-11 18:22 ` Cyrill Gorcunov via Tarantool-patches 2021-07-12 8:03 ` Vladislav Shpilevoy via Tarantool-patches 2021-07-12 8:09 ` Cyrill Gorcunov via Tarantool-patches 2021-07-12 21:20 ` Vladislav Shpilevoy via Tarantool-patches 2021-07-12 22:32 ` Cyrill Gorcunov via Tarantool-patches [this message] 2021-07-13 19:32 ` Vladislav Shpilevoy via Tarantool-patches 2021-07-12 8:01 ` Serge Petrenko via Tarantool-patches 2021-07-12 8:04 ` Vladislav Shpilevoy via Tarantool-patches 2021-07-12 8:12 ` Cyrill Gorcunov via Tarantool-patches 2021-07-12 8:23 ` Cyrill Gorcunov via Tarantool-patches 2021-07-12 21:20 ` Vladislav Shpilevoy via Tarantool-patches 2021-07-12 22:34 ` Cyrill Gorcunov via Tarantool-patches 2021-07-12 9:43 ` Cyrill Gorcunov via Tarantool-patches 2021-07-12 15:48 ` Cyrill Gorcunov via Tarantool-patches 2021-07-12 16:49 ` Serge Petrenko via Tarantool-patches 2021-07-12 17:04 ` Cyrill Gorcunov via Tarantool-patches 2021-07-12 21:20 ` Vladislav Shpilevoy via Tarantool-patches 2021-07-12 21:52 ` Cyrill Gorcunov via Tarantool-patches 2021-07-12 7:54 ` Serge Petrenko via Tarantool-patches
Reply instructions: You may reply publicly to this message via plain-text email using any one of the following methods: * Save the following mbox file, import it into your mail client, and reply-to-all from there: mbox Avoid top-posting and favor interleaved quoting: https://en.wikipedia.org/wiki/Posting_style#Interleaved_style * Reply using the --to, --cc, and --in-reply-to switches of git-send-email(1): git send-email \ --in-reply-to=YOzDFflt+MqiOjBG@grain \ --to=tarantool-patches@dev.tarantool.org \ --cc=gorcunov@gmail.com \ --cc=v.shpilevoy@tarantool.org \ --subject='Re: [Tarantool-patches] [PATCH] limbo: introduce request processing hooks' \ /path/to/YOUR_REPLY https://kernel.org/pub/software/scm/git/docs/git-send-email.html * If your mail client supports setting the In-Reply-To header via mailto: links, try the mailto: link
This is a public inbox, see mirroring instructions for how to clone and mirror all data and code used for this inbox