Troubleshooting

  1. «Зависшая» клиентская сессия beegfs.

В выводе команды beegfs-ctl —listnodes —nodetype=client можно заметить 2 сессии с одного хоста. Сессии имеют разные ID, одна активная, действительная сессия, вторая просто висит, даже если служба клиента остановлена на самом клиенте, или хост на котором располагается клиент недоступен/выключен.

Для начала необходимо убедиться, что это является неверным поведением в данном случае, поскольку beegfs позволяет запускать несколько клиентов файловой системы с одного хоста, в добавок еще и разных версий.

Далее стоит попробовать перезапустить службу beegfs-mgmtd на управляющем сервер beegfs, затем перезапустить службу beegfs-client на проблемном клиенте.

Если все эти меры не помогли, и после перезапуска служб сессия по прежнему «висит», тогда следует приступить к изучению директории установки вашего инстанса beegfs. Обычно это что то вроде /beegfs/mgmt/. В этой директории храниться файл clients.nodes это генерируемый бинарник, в котором хранятся действующие сессии файловой системы. Важно сделать бэкап этого файла перед любыми вмешательствами руками

cp /beegfs/mgmt/clients.nodes /backup/

Затем необходимо остановить службу beegfs-mgmtd:

systemctl stop beegfs-mgmtd

Открыв файл редактором вы обнаружите имена клиентов, ID сессий, и некоторые бинарные данные, необходимо отредактировать файл удалив из него «зависшую» сессию и часть бинарных данных вокруг него. Удалять нужно секцию между разделителями, обычно это символ |. После редактирования файла, сохраните изменения и перезапустите службу, вероятнее всего это поможет.

В случае, если этот метод вам не поможет, то можно попробовать другое решение — удалить данный файл, после чего остановить службу управления beegfs-mgmtd, остановить клиентские службы на всех хостах вашей файловой системы. Затем запустить службу beegfs-mgmtd, и запускать клиентские службы на хостах по очереди. В случае возникновения проблем при подключении клиентов после удаления файла, нужно смотреть в файл логов /var/log/beegfs-mgmtd.log там описывается процесс регистрации новых клиентов, что может указать на наличие проблем.