Как обеспечить стабильную круглосуточную работу майнинг рига

Как обеспечить стабильную круглосуточную работу майнинг рига

Заработок от майнинга напрямую зависит от продолжительности работы устройств, которые производят вычисления для поддержания работы того или иного блокчейна.

В связи с этим необходимо обеспечить бесперебойную работу майнинг ригов со стабильным хешрейтом. Работа компьютерного оборудования в режиме 24/7 должна быть максимально автоматизирована и обеспечивать высокий уровень безопасности.

В данной статье рассматривается проблематика обеспечения продолжительного uptime в недели/месяцы при майнинге на ригах с видеокартами.

Что нужно сделать для обеспечения бесперебойной работы компьютера при майнинге?

Для обеспечения стабильной продолжительной работы ригов нужно обеспечить выполнение следующих требований:

  1. Устранить (минимизировать) возможность зависаний и сбоев (crashes);
  2. Автоматизировать процедуру перезагрузки/рестарта и повторного включения компьютера в случае зависания, сбоя, после пропадания питания/интернета;

Кроме того, важно обеспечить возможность удаленного мониторинга и доступа по сети к ригам.

Рассмотрим подробнее, как обеспечить более стабильную работу ригов в круглосуточном режиме.

Устранение (сведение до минимума) зависаний и сбоев майнинг ригов

Для обеспечения стабильной работы рига нужно:

  • использовать надежное программное обеспечение, содержащее минимум ошибок (операционная система, драйвера, майнер). Для минимизации появления возможных сбоев нужно настроить систему: отключить в системе ненужные службы, удалить неиспользующиеся программы, отменить ненужные задания автоматического обслуживания/обновления. При сбоях по питанию и частых перезагрузках рига могут слететь драйвера, что будет приводить к зависаниям и появлению ошибок. В ОС типа Linux такие проблемы появляются редко, поэтому риги стоит переводить именно на Linux-подобные системы (по возможности);
  • использовать качественный блок питания, способный длительное время отдавать нужную мощность и напряжение. Блок питания должен стабильно работать при скачках напряжения в сети, фильтровать импульсные помехи, иметь защиту от коротких замыканий, перегрузок и перегрева;
  • обеспечить качественные контакты, в особенности по цепи прохождения сигнала между видеокартами, райзерами и материнской платой. Нужно учитывать тот факт, что риг с подключенными шестью видеокартами имеет в десятки раз больше ненадежных контактов через разъемы, чем обычный компьютер с одной видеокартой, вставленной в разъем PCI-E материнской платы. Некачественный контакт даже в одном месте может привести к зависанию всей системы. Плохой контакт по линии питания (что часто случается при использовании переходников) может привести не только к зависанию, но и к возгоранию (из-за этой опасности не стоит использовать райзера с питанием по разъему PCI-E). При использовании переходников нужно регулярно проверять их на предмет нагревания, изменения цвета изоляции на проводниках. Если провода слишком сильно греются, то нужно заменить их на более мощные (толще);
  • не стоит использовать слишком большой разгон видеокарт. Погоня за лишней копейкой может обернуться потерями долларов из-за простоев, вызванных прекращением работы ригов, вызванных сбоями из-за переразгона/излишнего даунвольтинга. После сборки рига нужно найти частоты и вольтаж, при котором он работает относительно стабильно, но для практической работы выставить эти значения на уровне 80-90% от найденных (немного уменьшить частоту разгона). Это обеспечит более надежную работу рига и убережет его от лишних зависаний/сбоев. Кроме того, нужно учитывать, что со временем у чипов памяти проявляется деградация из-за эффекта электромиграции. Из-за этого для стабильности периодически нужно немного снижать разгон по памяти.

Большую пользу для обеспечения круглосуточной работы рига окажут сторожевые таймеры. Они недороги и просты в настройке, поэтому их стоит использовать на всех ригах.

Кроме аппаратных сторожевых таймеров, стоит добавить программную функцию повторного запуска майнера или перезагрузки компьютера в батнике.

Для этого батник модернизируют следующим образом:

@echo off

:loop

команды для запуска майнера (основной батник)

timeout /t 1 >nul

taskkill /f /im название_майнера >nul

goto loop

Такая модернизация позволяет осуществлять циклический перезапуск майнера после программных сбоев в его работе.

Если риг работает нестабильно даже без оверклокинга и даунвольтинга, используется хороший БП, обеспечены нормальные контакты, то причину зависаний и сбоев нужно искать в несовместимости/неисправности использующегося железа.

Возможно, сбоит оперативная память компьютера (нужно прогнать memory test), в BIOS выставлена слишком большая скорость обмена по линии PCI-E (нужно использовать GEN1 или GEN2), недостаточен размер файла подкачки, или сбоит жесткий диск, на котором он стоит.

Кроме сбоев, существуют внешние факторы, приводящие к простоям ригов. К ним можно отнести сбои по сетевому питанию и пропадание подключения к интернету.

При нестабильной сети 220В можно подключить риги через UPS, а также использовать аппаратные watchdog-и. Также в BIOS нужно включить опцию автоматического включения после пропадания питания.