Что делать при резком падении хешрейта на видеокарте при майнинге?

Что делать при резком падении хешрейта на видеокарте при майнинге?

Иногда после запуска майнинга пользователя ожидает неприятный сюрприз, проявляющийся резким падением хешрейта с последующим отвалом видеокарты.

При этом доступный объем видеопамяти более чем достаточен для текущего DAG, настройки разгона сведены до минимума, но майнер выдает печальную картинку подобную приведенной ниже.

Скриншот майнера nanominer при майнинге ETC с DAG, равным 2.591 Gb на видеокарте Radeon RX5500XT с 8 Гб памяти (хешрейт всего 1.5 mh/s, при нормальной работе — порядка 28-29 mh/s):

Что делать при резком падении хешрейта на видеокарте при майнинге?

Такая проблема может возникнуть в любой операционной системе, как Windows, так и Linux (включая HiveOS) и связана со сбросом частот видеокарты на базовые. Проверка текущих настроек видеокарты, которую можно произвести разными способами, показывает, что видеокарта работает на очень низких частотах памяти/видеопроцессора.

Скриншот видеокарты AMD Radeon RX5500XT, которая отказывается работать не только в разогнанном, но и в базовом режиме:

Что делать при резком падении хешрейта на видеокарте при майнинге?

Выдача информации о состоянии видеокарты в программе amdcovc (видно, что частота памяти сброшена на 500 МГц):

Что делать при резком падении хешрейта на видеокарте при майнинге?

Переключение на алгоритм, сильно задействующий видеопамять, эффекта не дает, проблема остается открытой.

На алгоритме kawpow проблемная видеокарта продолжает «бастовать», саботируя проведение вычислений:

Что делать при резком падении хешрейта на видеокарте при майнинге?

Казалось бы (временным) спасением может стать переключение на майнинг криптовалют, которые не требуют высокой производительности памяти, например, на Equihash 192, но и здесь возникают ошибки, вплоть до «вылета» карты.

Отвал видеокарты в программе lolminer с ошибкой Stuck device detected, invoking emergency script:

Что делать при резком падении хешрейта на видеокарте при майнинге?

Проблемы, выражающиеся в странной работе видеокарты, как правило, связаны с некорректной работой драйверов, либо нарушениями в цепи передачи данных.

Существуют следующие способами решения проблемы сброса частот памяти на проблемной видеокарте:

  • Проверить лимит виртуальной памяти, выставленный на компьютере. Проблемы могут появиться при малом файле подкачки в Windows или при некорректной установке значения vm.swappiness в Linux.
  • Включить в карту AMD монитор/эмулятор.
  • Произвести сброс настроек разгона и даунвольтинга с последующей перезагрузкой. Перед этим нужно отключить сохранение сеанса. В окружении xfce это делается командой:
rm ~/.cache/sessions/xfce4-session-*
  • Удалить/выключить программы разгона и проверить, восстановилась ли нормальная работоспособность карты.
  • Осуществить полное удаление и чистую установку драйверов.
  • Переустановить видеокарту в другой слот PCI-E или райзер (заменить USB-кабель передачи данных).
  • Обновить систему (Linux) командой:
sudo apt update && sudo apt -y upgrade && sudo apt -y dist-upgrade && sudo apt -y autoremove

и перезагрузиться.

  • Перенести видеокарту на другой риг/переустановить операционную систему/перейти на другое ядро.
  • Прошить корректный BIOS видеокарты.

Иногда наиболее простым решением проблем с некорректной работой видеокарт является чистая установка системы. Исходя из практического опыта, это помогает после обновления работающей системы xubuntu 18.04 на версию 20.04. После такого апдейта видеокарты стали вести себя аномально, сбрасывая частоты, при установке драйверов возникали ошибки, связанные с установкой пакета amdgpu-dkms:

Error! Bad return status for module build on kernel: 5.4.0-56-generic (x86_64)

Consult /var/lib/dkms/amdgpu/5.6.0.15-1098277/build/make.log for more information.

dpkg: ошибка при обработке пакета amdgpu-dkms (--configure):

installed amdgpu-dkms package post-installation script subprocess returned error exit status 10

...

При обработке следующих пакетов произошли ошибки:

amdgpu-dkms

E: Sub-process /usr/bin/dpkg returned an error code (1)
Что делать при резком падении хешрейта на видеокарте при майнинге?

Типичные способы устранения такой ошибки

sudo dpkg --configure -a

sudo dpkg -P error-packages

apt install -f

sudo apt --fix-broken install

не помогали, риг возобновил нормальную работу только после чистой установки системы.