From: Vladislav Shpilevoy <v.shpilevoy@tarantool.org> To: Sergey Bronnikov <sergeyb@tarantool.org> Cc: tarantool-patches@dev.tarantool.org Subject: Re: [Tarantool-patches] [PATCH 2/4] replication: add advanced tests for sync replication Date: Tue, 7 Jul 2020 22:57:15 +0200 [thread overview] Message-ID: <95ae952b-4062-9ebe-2af3-3ed58502fc1b@tarantool.org> (raw) In-Reply-To: <20200707121224.GA58485@pony.bronevichok.ru> >>> test_run:switch('default') >>> box.cfg{replication_synchro_quorum=NUM_INSTANCES, replication_synchro_timeout=0.1} >>> _ = box.schema.space.create('sync', {is_sync=true, engine=engine}) >>> _ = box.space.sync:create_index('pk') >>> -- Testcase body. >>> box.space.sync:insert{1} >>> box.space.sync:insert{2} >>> box.space.sync:insert{3} >>> box.space.sync:select{} -- 1, 2, 3 >>> test_run:switch('replica') >>> box.space.sync:select{} -- 1, 2, 3 >>> -- Testcase cleanup. >>> test_run:switch('default') >>> box.space.sync:drop() >>> >>> -- Synchro timeout is not bigger than replication_synchro_timeout value. >>> -- Testcase setup. >>> test_run:switch('default') >>> box.cfg{replication_synchro_quorum=BROKEN_QUORUM, replication_synchro_timeout=orig_synchro_timeout} >>> _ = box.schema.space.create('sync', {is_sync=true, engine=engine}) >>> _ = box.space.sync:create_index('pk') >>> -- Testcase body. >>> start = os.time() >>> box.space.sync:insert{1} >>> (os.time() - start) == box.cfg.replication_synchro_timeout -- true >> >> 7. Очень плохая идея. Если процесс подвиснет тут ненадолго, то эта проверка >> упадет. Не должно быть тестов, которые полагаются на то, что процесс будет >> выполняться стабильно. > > Ты предлагаешь не проверять или есть более надежные способы проверки, > что таймаут именно такой величины, каким его выставили? Если тебе надо проверить, что таймаут провалился, то надо проверять, что прошедшее время >= timeout, но точно не == timeout. Второе очень ненадежно. >>> -- Testcase cleanup. >>> test_run:switch('default') >>> box.space.sync:drop() >>> >>> -- replication_synchro_quorum >>> test_run:switch('default') >>> INT_MIN = -2147483648 >>> INT_MAX = 2147483648 >>> box.cfg{replication_synchro_quorum=INT_MAX} -- error >>> box.cfg.replication_synchro_quorum -- old value >>> box.cfg{replication_synchro_quorum=INT_MIN} -- error >>> box.cfg.replication_synchro_quorum -- old value >> >> 8. Это тоже явно не advanced тесты. Это самые базовые проверки. > > Я изначально делал тесты в отдельном файле, чтобы проще было изменять > это в общей ветке, без мержей, ребейзов и прочих вещей. Тесты назвались > advanced, потомы что должны были покрывать высокоуровневые требования из > RFC. Я могу перенести эти тесты в qsync_basic, если возражений по сути > тестов нет. Да, лучше бы в basic. >>> -- Testcase setup. >>> test_run:switch('default') >>> box.cfg{replication_synchro_quorum=NUM_INSTANCES, replication_synchro_timeout=0.1} >>> _ = box.schema.space.create('sync', {is_sync=true, engine=engine}) >>> _ = box.space.sync:create_index('pk') >>> -- Testcase body. >>> box.begin() box.space.sync:insert({1}) box.commit() >>> box.begin() box.space.sync:insert({2}) box.commit() >>> -- Testcase cleanup. >>> box.space.sync:drop() >>> >>> -- [RFC, summary] switch sync replicas into async ones, expected success and >>> -- data consistency on a leader and replicas. >> >> 10. Это пожалуй пока единственный тест, который тут можно было бы оставить. >> То есть 'advanced'. Но коммент неверен - нет никаких синхронных реплик. >> Есть синхронные транзакции. Которые определяются синхронными спейсами. > > RFC: "ability to switch async replicas into sync ones and vice versa" > ^^^^^^^^^^^^^^^^^^^ > В тесте поправлю комментарий. Еще, как я понял, у тебя были возражения > по поводу того, как делаем выключение синхронной репликации, чтобы она > стала асинхронной. Или запись в системный спейс это ок? Пока ок. Потом будет интерфейс нормальный. Сейчас у спейса ничего кроме формата поменять нельзя нормально. Надо эту проблему решать в общем случае. >>> test_run:cmd("setopt delimiter ';'") >>> _ = fiber.create(function() >>> box.space.sync:insert{2} >>> end); >>> test_run:cmd("setopt delimiter ''"); >>> -- Disable synchronous mode. >>> disable_sync_mode() >>> -- Space is in async mode now. >>> box.space.sync:insert{3} -- async operation must wait sync one >>> box.error.injection.set('ERRINJ_SYNC_TIMEOUT', false) >>> box.space.sync:select{} -- 1 >>> test_run:cmd('switch replica') >>> box.space.sync:select{} -- 1 >>> -- Testcase cleanup. >>> test_run:switch('default') >>> box.space.sync:drop() >>> >>> -- Warn user when setting `replication_synchro_quorum` to a value >>> -- greater than number of instances in a cluster, see gh-5122. >>> box.cfg{replication_synchro_quorum=BROKEN_QUORUM} -- warning >> >> 13. Этот тест походу вообще ничего не проверяет. Варнинг сейчас не пишется, >> и тест проходит. > > Обычный процесс такой: если тест падает, то, пока есть открытая > проблема, добавляют XFAIL и при изменении поведения XFAIL меняется на > XPASS, чтобы убрать XFAIL. У нас нет такого механизма, поэтому добавил > тест на будущее и когда варнинг добавят, то тест сломается и result файл > обновят. Мне кажется, что это вполне себе ок. Это было бы ок, если бы коммент говорил, что тест пока невалидный. Но что еще важнее - тест все равно пройдет даже когда добавится ворнинг. Потому что он пойдет в лог, и в выводе теста его не будет. Так что тест пройдет, хоть и не должен.
next prev parent reply other threads:[~2020-07-07 20:57 UTC|newest] Thread overview: 68+ messages / expand[flat|nested] mbox.gz Atom feed top [not found] <cover.1593723973.git.sergeyb@tarantool.org> 2020-06-29 23:15 ` [Tarantool-patches] [PATCH v2 00/19] Sync replication Vladislav Shpilevoy 2020-06-29 23:15 ` [Tarantool-patches] [PATCH v2 01/19] replication: introduce space.is_sync option Vladislav Shpilevoy 2020-06-30 23:00 ` Vladislav Shpilevoy 2020-07-01 15:55 ` Sergey Ostanevich 2020-07-01 23:46 ` Vladislav Shpilevoy 2020-07-02 8:25 ` Serge Petrenko 2020-06-29 23:15 ` [Tarantool-patches] [PATCH v2 10/19] txn_limbo: add ROLLBACK processing Vladislav Shpilevoy 2020-07-05 15:29 ` Vladislav Shpilevoy 2020-06-29 23:15 ` [Tarantool-patches] [PATCH v2 11/19] box: rework local_recovery to use async txn_commit Vladislav Shpilevoy 2020-06-29 23:15 ` [Tarantool-patches] [PATCH v2 12/19] replication: support ROLLBACK and CONFIRM during recovery Vladislav Shpilevoy 2020-06-29 23:15 ` [Tarantool-patches] [PATCH v2 13/19] replication: add test for synchro CONFIRM/ROLLBACK Vladislav Shpilevoy 2020-06-29 23:15 ` [Tarantool-patches] [PATCH v2 14/19] applier: remove writer_cond Vladislav Shpilevoy 2020-07-02 9:13 ` Serge Petrenko 2020-06-29 23:15 ` [Tarantool-patches] [PATCH v2 15/19] applier: send heartbeat not only on commit, but on any write Vladislav Shpilevoy 2020-07-01 23:55 ` Vladislav Shpilevoy 2020-07-03 12:23 ` Serge Petrenko 2020-06-29 23:15 ` [Tarantool-patches] [PATCH v2 16/19] txn_limbo: add diag_set in txn_limbo_wait_confirm Vladislav Shpilevoy 2020-06-29 23:15 ` [Tarantool-patches] [PATCH v2 17/19] replication: delay initial join until confirmation Vladislav Shpilevoy 2020-06-29 23:15 ` [Tarantool-patches] [PATCH v2 18/19] replication: only send confirmed data during final join Vladislav Shpilevoy 2020-06-29 23:15 ` [Tarantool-patches] [PATCH v2 19/19] replication: block async transactions when not empty limbo Vladislav Shpilevoy 2020-07-01 17:12 ` Sergey Ostanevich 2020-07-01 23:47 ` Vladislav Shpilevoy 2020-07-03 12:28 ` Serge Petrenko 2020-06-29 23:15 ` [Tarantool-patches] [PATCH v2 02/19] replication: introduce replication_synchro_* cfg options Vladislav Shpilevoy 2020-07-01 16:05 ` Sergey Ostanevich 2020-07-01 23:46 ` Vladislav Shpilevoy 2020-07-02 8:29 ` Serge Petrenko 2020-07-02 23:36 ` Vladislav Shpilevoy 2020-06-29 23:15 ` [Tarantool-patches] [PATCH v2 03/19] txn: add TXN_WAIT_ACK flag Vladislav Shpilevoy 2020-07-01 17:14 ` Sergey Ostanevich 2020-07-01 23:46 ` Vladislav Shpilevoy 2020-07-02 8:30 ` Serge Petrenko 2020-06-29 23:15 ` [Tarantool-patches] [PATCH v2 04/19] replication: make sync transactions wait quorum Vladislav Shpilevoy 2020-06-30 23:00 ` Vladislav Shpilevoy 2020-07-02 8:48 ` Serge Petrenko 2020-07-03 21:16 ` Vladislav Shpilevoy 2020-07-05 16:05 ` Vladislav Shpilevoy 2020-06-29 23:15 ` [Tarantool-patches] [PATCH v2 05/19] xrow: introduce CONFIRM and ROLLBACK entries Vladislav Shpilevoy 2020-06-29 23:15 ` [Tarantool-patches] [PATCH v2 06/19] txn: introduce various reasons for txn rollback Vladislav Shpilevoy 2020-06-29 23:15 ` [Tarantool-patches] [PATCH v2 07/19] replication: write and read CONFIRM entries Vladislav Shpilevoy 2020-06-29 23:15 ` [Tarantool-patches] [PATCH v2 08/19] replication: add support of qsync to the snapshot machinery Vladislav Shpilevoy 2020-07-02 8:52 ` Serge Petrenko 2020-07-08 11:43 ` Leonid Vasiliev 2020-06-29 23:15 ` [Tarantool-patches] [PATCH v2 09/19] txn_limbo: add timeout when waiting for acks Vladislav Shpilevoy 2020-06-29 23:22 ` [Tarantool-patches] [PATCH v2 00/19] Sync replication Vladislav Shpilevoy 2020-06-30 23:00 ` [Tarantool-patches] [PATCH v2 20/19] replication: add test for quorum 1 Vladislav Shpilevoy 2020-07-03 12:32 ` Serge Petrenko 2020-07-02 21:13 ` [Tarantool-patches] [PATCH 1/4] replication: regression test on gh-5119 [not fixed] sergeyb 2020-07-02 21:13 ` [Tarantool-patches] [PATCH 2/4] replication: add advanced tests for sync replication sergeyb 2020-07-02 22:46 ` Sergey Bronnikov 2020-07-02 23:20 ` Vladislav Shpilevoy 2020-07-06 12:30 ` Sergey Bronnikov 2020-07-06 23:31 ` Vladislav Shpilevoy 2020-07-07 12:12 ` Sergey Bronnikov 2020-07-07 20:57 ` Vladislav Shpilevoy [this message] 2020-07-08 12:07 ` Sergey Bronnikov 2020-07-08 22:13 ` Vladislav Shpilevoy 2020-07-09 9:39 ` Sergey Bronnikov 2020-07-02 21:13 ` [Tarantool-patches] [PATCH 3/4] replication: add tests for sync replication with anon replica sergeyb 2020-07-06 23:31 ` Vladislav Shpilevoy 2020-07-02 21:13 ` [Tarantool-patches] [PATCH 4/4] replication: add tests for sync replication with snapshots sergeyb 2020-07-02 22:46 ` Sergey Bronnikov 2020-07-02 23:20 ` Vladislav Shpilevoy 2020-07-06 23:31 ` Vladislav Shpilevoy 2020-07-07 16:00 ` Sergey Bronnikov 2020-07-06 23:31 ` [Tarantool-patches] [PATCH] Add new error injection constant ERRINJ_SYNC_TIMEOUT Vladislav Shpilevoy 2020-07-10 0:50 ` [Tarantool-patches] [PATCH v2 00/19] Sync replication Vladislav Shpilevoy 2020-07-10 7:40 ` Kirill Yukhin
Reply instructions: You may reply publicly to this message via plain-text email using any one of the following methods: * Save the following mbox file, import it into your mail client, and reply-to-all from there: mbox Avoid top-posting and favor interleaved quoting: https://en.wikipedia.org/wiki/Posting_style#Interleaved_style * Reply using the --to, --cc, and --in-reply-to switches of git-send-email(1): git send-email \ --in-reply-to=95ae952b-4062-9ebe-2af3-3ed58502fc1b@tarantool.org \ --to=v.shpilevoy@tarantool.org \ --cc=sergeyb@tarantool.org \ --cc=tarantool-patches@dev.tarantool.org \ --subject='Re: [Tarantool-patches] [PATCH 2/4] replication: add advanced tests for sync replication' \ /path/to/YOUR_REPLY https://kernel.org/pub/software/scm/git/docs/git-send-email.html * If your mail client supports setting the In-Reply-To header via mailto: links, try the mailto: link
This is a public inbox, see mirroring instructions for how to clone and mirror all data and code used for this inbox