МістоКиев
Мова сайту
Укр
Рус
Увійти в кабінет
Каталог товарів
Пасивне мережеве обладнання
Активне мережеве обладнання
Оптичні компоненти
Короб, лотки, гофра, інструмент
Електроживлення, електрика

Чому відключається живлення у серверних стійках та як цьому запобігти

19 квітня 2022

 

Вимкнення живлення в серверній стійці — це серйозно. Вирішувати такий інцидент треба якнайшвидше. І хоча зазвичай у дата-центрі найважливіше обладнання має два джерела живлення, постійне та резервне, іноді це не допомагає. Через помилки може «впасти» вся стійка. Як уникнути більшості причин «падіння» стійки, читайте в статті. У ній розказано, як справлятися із класичними випадками припинення живлення, як уникнути технічних причин та усувати проблеми, пов’язані з людським фактором.

 

Чому відключається живлення у серверних стійках та як цьому запобігти - фото

 

Поширені помилки з блоками живлення та як їх вирішити

 

Збої електропостачання майже завжди трапляються через блоки живлення. Особливо якщо це недороге обладнання. І навіть при запланованих роботах, коли електроживлення необхідно відключати, БЖ може згоріти через перепад напруги. При цьому згорілий блок може призвести до того, що спрацюють автомати в PDU та щитку, хіба що стійка оснащена просунутим PDU. Коротке замикання — ще одна класична причина.

Щоб усунути збій у телекомунікаційній стійці, можна діяти за таким алгоритмом:

  • Візуальний огляд. Потрібно подивитися, чи не йде дим, запах гару від компонентів. Насамперед варто оглянути PDU та БЖ.
  • Оглянути автоматичне введення резерву, а також перевірити журнал подій на PDU та АВР.
  • Переконатися в тому, чи надійно підключені кабелі живлення, з’єднання роз’ємів живлення типу «груша», а також заземлення.
Порада: на всіх трьох етапах перевірити нагрів усієї лінії, використовуючи тепловізор.
  • Перевірити автомати у розподільчому щитку.
  • Перевірити навантаження на автоматі.
  • Протестувати автомат за допомогою тепловізора.
  • За умови, що ситуація негостра, а живлення вимкнулося через те, що спрацював автомат, його потрібно включити. Якщо живлення у стійці відновилося, слід пошукати БЖ, який згорів та замінити його. Виявити зіпсований блок неважко: його індикатор не світиться.
  • Усі етапи діагностики необхідно зафіксувати у чек-листі, щоб з’ясувати причини збою.
  • Якщо включений автомат відразу вибиває ще раз, причини збою набагато серйозніші. В цьому випадку треба зняти з PDU все навантаження та провести діагностику кожного БЖ по черзі.
  • Трапляється, що причина відключення або короткого замикання відразу незрозуміла. Тут знадобиться спеціальний портативний аналізатор. Цей прилад для діагностики мережі можна приєднати до PDU, що вийшла з ладу, на добу, а потім зібрати за цей час журнал і знайти причину неполадки.

 

Як вирішити

 

Щоб уникнути наведених вище ситуацій з БЖ, потрібно пам’ятати про необхідність запасних блоків живлення. Це допоможе швидко усунути збій і цим скоротити час простою.

Також важливо не перевантажувати блоки: вони мають працювати на номінальній потужності. Зручні БЖ, які оснащені захистом від перевантаження.

Крім того, необхідно перевіряти, чи правильно використовуються всі елементи стійки. Річ у тому, що не можна перевантажувати будь-яке обладнання у стійці. Адже якщо хоч один елемент перевантажений, то може впасти сервер.

Все це звучить просто, доки не попадеться нестандартне обладнання. Наприклад, бувають сервери з парою БЖ, де один подає живлення, а другий — у гарячому резерві. Подібні налаштування можуть бути встановлені в БІОС. Насправді це означає, що все навантаження ляже тільки одну PDU.

Зазначимо, що БЖ може згоріти через приховані дефекти. І якщо є привід підозрювати заводську ваду, знадобиться провести експертизу у центрі з ремонту.

 

Людський фактор

 

Звичайно, поломки, пов’язані з людським фактором, не означають некомпетентності співробітників, і тим більше не означають злого наміру. Помилки, пов’язані з цим, часто трапляються через непорозуміння. Наприклад, людина може просто неправильно запам’ятати номер стійки, з якою потрібно попрацювати, щось не так почути.

 

Як цього уникнути:

 

  • Заявки на відключення приймати тільки від уповноважених працівників і лише письмово, наприклад, на електронну пошту. Те саме стосується і передачі заявки на виконання.
  • Перевірити, що заявку подано в рамках договору та послуг, які надає ваша команда.
  • Планувати роботи, пов’язані з відключенням, тільки в робочий час: увечері або вночі цього не варто робити, оскільки майстер може бути втомленим і втратити концентрацію.
  • Складні роботи проводити лише вдвох. В ідеалі при роботі зі щитом має бути старший інженер.
  • Вимикати автомати по черзі. Так, якщо потрібно відключити стійку повністю, необхідно вимкнути спочатку один автомат, подивитися, чи потрібна PDU відключена. І лише потім вимикати ще один автомат.
  • Маркувати кожен вузол підключення: як роз’єм живлення для під’єднання PDU, так і власне PDU.
  • Прокладати кольорові кабелі (знадобиться для маркування).
  • Дотримуватись колірної схеми протягом усієї лінії.
  • Розповідати замовникам про те, як правильно встановлювати компоненти у стійку.
  • Майстер повинен притримувати відкриту захисну панель щитка, якщо така є. Це необхідно, щоб пластрон не впав та не відключив інші автомати.
 

Важливо! Маркування провідників може виконуватися за різними схемами. З цієї причини рекомендується заздалегідь домовлятися про те, яке маркування ви використовуватимете, та вказати його в документації дата-центру. Крім того, необхідно маркувати автомат, особливо у разі його горизонтальної установки.

 

Через що «падають» стійки: технічні помилки та їх вирішення

 

Однією з найчастіших таких причин є статична електрика, згубна для електроніки. Через це в кожному ЦОД повинен бути певний клімат, а також використовуватися антистатичні фальшпідлоги, упакування та інше.

Однак якщо у великих дата-центрах все влаштовано, як ведеться, у невеликих серверних кімнатах стежити за показниками вологості складніше. У таких ситуаціях рекомендується носити антистатичні браслети: статика в невеликих кількостях нестрашна стійці, але при обслуговуванні людина може давати розряд, який може зіпсувати компоненти.

Ще одна технічна причина — шнури низької якості. Не рекомендується заощаджувати на кабелях живлення обладнання. Згодом тонкі шнури низької якості прогорають, оскільки просто не витримують такого навантаження. Локалізувати стійку зі згорілим кабелем, якщо в приміщенні їх багато, буває важко. Тож краще заздалегідь не скупитися і брати добрий дріт.

Зазвичай у стійках підключають все за допомогою кабелів С13 та С14. Вони відрізняються перетином. Найкращий варіант для ЦОДу — моделі з показником хоча б 1 мм2.

Крім цього, технічною неполадкою, що веде до проблем із живленням стійки, є те, що мережне обладнання просто неакуратно поставили. Через це іноді шнур живлення вставляють у роз’єм не до кінця, що погіршує провідність, а також збільшує показники опору. А якщо дріт ще часто зачіпають, з’єднання гріється сильніше, ніж необхідно. Це пожежонебезпечна ситуація, а значить автомат скоро спрацює та вимкне стійку.

Якщо серверна кімната невелика, можна порекомендувати використовувати роз’єми та кабелі від одного виробника, однак у великих комерційних ЦОДах це навряд чи вдасться. Але можна використовувати спеціальну накладку із силікону, яка виконує функцію ущільнювача.

Потрібно пам’ятати! Показник допустимої сили струму змінюється, якщо адаптери для кабелів задіяні.

Ще одна причина — спека. Оптимальний клімат необхідний не тільки для коректної роботи серверів, але й автоматів. Так, вимикач з показником 25 А при температурі понад 30 градусів може видавати всього 23 А. Це означає, що якщо в кімнаті жарко, то він вимкнеться раніше. Рішення — враховувати місце розташування щита та стежити за кліматом.

Примітка: бувають непояснені збої, для виявлення причин яких вішають переносний аналізатор. Він допоможе визначити причину повторного збою. Однак такого випадку можна й не дочекатися, тому краще використовувати постійний аналізатор якості живлення, який дозволяє визначити причину проблеми в той же момент, коли трапляється збій. Таким приладом рекомендується оснащувати промені після всіх ДБЖ.

Підсумуємо. Уникнути виходу стійок з ладу можна, вживаючи різних заходів. Так, важливо не економити на обладнанні та кабелях, встановлювати резервні БЖ й уникати перевантажень, а також розраховувати оптимальне навантаження з урахуванням аварійного режиму. Крім того, варто перевіряти правильність підключення, наносити маркування. Не менш важливо захистити обладнання від розрядів статики.

Крім того, варто ретельно фіксувати всі домовленості письмово, планувати всі важливі роботи вдень і разом з напарником. І перш ніж вводити стійку до експлуатації, важливо тестувати її під навантаженням. До речі, можна залучити до тестування спеціалістів ЦОД: нехай вони по черзі відключать автомати та перевірять, чи правильно працює обладнання.

Не менш важливо складати звіти: вести статистику збоїв, визначати типові помилки та фіксувати їх в інструкціях.