Первый "Magister Ludi": заключение

Активный этап проведения соревнования валидаторов Crystal Game (Magister Ludi) можно считать завершенным.

В процессе игр мы наткнулись на немалое количество технических трудностей, проблем и задач, которые еще не решены полностью. Мне кажется, что это не должно нас расстраивать и заставлять опускать руки - напротив, нам следует принять этот ценный опыт, рассмотреть и проанализировать его, найти причины возникших проблем и трудностей и решить их. Это определенно посильная задача, особенно если мы вместе постараемся над ней поработать! :slight_smile:

cikl-bsm

Нет предела совершенству, поэтому давайте начнем с выявления тех проблем, с которыми мы встретились в играх валидаторов. Пожалуйста, напишите обо всех замеченных вами проблемах с:

  • нодой;
  • работой сети в целом;
  • скриптами, которые вы брали из репозиториев TonLabs (net.ton.dev/scripts at master · tonlabs/net.ton.dev · GitHub);
  • документацией, распространенными подходами;
  • и даже с организацией самих игр.

Предложения по решению замеченных проблем тоже очень приветствуются. Не стесняйтесь высказать свои мысли и мнения! :slight_smile:

После этого мы сможем вместе найти решения найденных проблем, высказать более точные и конкретные предложения по их решению, определить статус и причины проблем и улучшить сеть. Без вас не получится!

6 Likes

хотелки

  1. запускать скрипт validator_msig.sh при помощи systemd timer (с cron были проблемы)
  2. добавить в validator-engine возможность переключения на резервный ip адрес, в случае не работы основного
1 Like
  • скрипт validator_msig.sh не надежный (в ближайший месяц буду гонять альтернативный), но похоже для валидатора требуются альтернативные инструменты для работы через lite-client в качестве основных;
  • в настройках validator_engine желательно добавить различение путей к Базе и к Архиву;
  • нода по-умолчанию затирает лог-файл. В связи с важностью логов, необходимо чтобы она при старте всегда их сама ротировала(!). Тем более что в новой версии еще добавили логирования;
  • в ноде бы завести внутренние perf-counters для отслеживания текущего bottle-neck, т.к. по текущим логам валидаторам ничегошеньки не понятно));
  • нода продолжает течь (жрать ОЗУ), с этим нужно что-то делать;
  • как было понятно с первого дня, все же нужно уходить от fsync в ноде, например, вынести в опции запуска validator-engine;
  • по результатам игр стало понятно, что нужна оптимизация объема трафика гоняемого нодой по сети. Для этого потребуются как мелкие правки, так и изменения в дизайне (алгоритмах) ноды;
  • продолжают требоваться анти-DDOS инструменты, судя по всему сделаем их в следующем месяце.
    :blush:
6 Likes