Аварія кращого системного адміністратора [закрита]


87

Я шукаю кумедних історій нещасних випадків системного адміністратора. Видалення електронного листа генерального директора, форматування неправильного жорсткого диска тощо.

Я додам свою власну історію як відповідь.


3
Дивіться також serverfault.com/questions/5066
Zoredache

14
Це дійсно більше опитування, а не питання. Це, мабуть, має бути встановлено у вікі спільноти.
Зоредаче

7
Так, це безумовно має бути вікі спільноти. Однак, з метою наміру, моя улюблена історія - це електронна пошта на 500 миль - ibiblio.org/harris/500milemail.html - хоча, очевидно, це був не я.
Міхай Лімбашан

500 миль просто чудові
Хуберт Каріо

Це слід назвати "гіршою аварією системного адміністратора".
Ріліндо

Відповіді:


133

Мені було цікаво виявити різницю між командою linux "killall" (вбиває всі процеси, що відповідають вказаному імені, корисною для зупинки зомбі) та командою solaris "killall" (вбиває всі процеси та зупиняє систему, корисно для зупинки виробничого сервера в середина пікових годин і змусити всіх своїх колег сміятися над тобою тиждень).


74
Був там зробив те. Після цього ми відключили команду killall на полях solaris: alias killall = 'echo ORLLY?' =)
Командир Кін

29
Також на Solaris є важлива різниця між 'ifconfig -a4' (показати всі інтерфейси 'IPv4 інформації) та' ifconfig -a 4 '(встановіть для всіх інтерфейсів 0,0.0.4).
Zanchey

3
+1 "ой, цей вітер увійшов у соляр?"
Марк Гаррісон

4
@Commander, я збирався підтримати ваш коментар, але в цей же момент є точно 42 оновлення ... Я просто не зміг .
Массімо

5
Також hostname -fу Linux друкується повноцінне доменне ім’я в Linux. У програмі Solaris вона встановлює ім'я хоста -f.
200_успіх

73

Я керував нашим корпоративним веб-проксі, який в той час був продуктом Netscape. Під час гри в адміністраторських формах (це був веб-інтерфейс) була велика (і я клянусь, це була червона) кнопка, на якій було сказано Видалити базу даних користувача . Без проблем, подумав я. Давайте подивимося, які варіанти, які вона дає мені, коли я це вдарив. Звичайно, якщо немає варіантів, з'явиться запит на підтвердження.

Так, ніякого підтвердження. Немає варіантів. Більше користувачів немає.

Отже, підійшов до пана Соларіса Сисадміна і сказав, що я відчайдушно потребую відновлення з стрічки, на що він відповів: "Я не підтримую цю скриньку".

"А-а, приходьте знову", - відповів я.

"Я не повертаю цю скриньку. Це в моєму списку речей, які слід додати до обертання резервного копіювання, але я до цього часу ще не обійшов його."

"Цей сервер виробляється майже 8 місяців!" Я кричав.

знизавши плечима , відповів він. "Вибачте".


50
Це, безумовно, історія для всіх тих людей, які скаржаться на ті примхливі "Ви впевнені?" діалоги;)
MikeyB

45
Я не дуже впевнений, що ти
мусиш

14
Це насправді не випадковість - ви спеціально натиснули кнопку Видалити базу даних користувачів, давай чувак ...
Wayne Koorts

5
Так, ти маєш рацію. Натискання кнопки не випадково. Фактично видалення бази було частиною аварії. Що б не було ...
шквал

7
За цією кнопкою повинні слідувати два або три запити про підтвердження. Як корисна функція для видалення користувальницької бази даних? Я повністю звинувачую програміста, що вклав кнопку. І той факт, що DB не було підкріплено. "Геній може мати свої обмеження, але дурість таким чином не обмежена". (attr до Ельберта Хаббарда). Будівництво з припущенням, що люди не цікаві, недбайливі мавпи - це лише побудова катастрофи.
Jared Updike

66

Багато років тому в компанії, в якій я працював, був клієнт, який здійснював нічну резервну копію їх сервера NT 4.0 на Jaz-накопичувач (як блискавичний диск з високою ємністю).

Ми створили пакетний файл, який працював як запланована робота протягом ночі. Щоранку вони збирали диск із минулої ночі з накопичувача, а перед тим, як піти ввечері, вставляли наступний диск у послідовність.

У будь-якому випадку, пакетний файл виглядав приблизно так (Jaz-диск був F Drive):

@echo off
F:
deltree /y *.*
xcopy <important files> F:

У будь-якому випадку, однієї ночі вони забули поставити диск. Зміна диска F: не вдалося (диск не в диску), і пакетний файл продовжував працювати. Типовий робочий каталог для пакетного файлу? С:. Перший раз, коли я коли-небудь бачив процедуру резервного копіювання, знищити сервер, на який він створювався.

Того дня я дізнався трохи про систематичне керування (та обробку винятків).

Джим.

PS: Виправлення? "deltree / y F: \ *. *".


57
... ми повинні пояснити, що таке приводи Jaz? Я справді такий старий ??
Спенсер Рупорт

3
Це була річ IOMEGA (пам’ятаєте Zip Drives?) Була старшим братом Zip-накопичувачів, і вона нагадувала жорсткий диск без головки, просто тарілки, що зайшов всередину пластикового корпусу з маленьким вікном, і коли його вставили на привід, привід вставив заголовки на нього. Там, де 1 або 2 Гб, дорогі і мають тенденцію до перегріву, тому не рекомендували залишати картриджі всередині зчитувача (про це сказав старий бос IOMEGA)
Андор,

3
Хе-хе, мені подобається, як jaz-накопичувач пояснюється порівнянням з просто-як-мертвим-і-нерелевантним поштовим накопичувачем.
Лука

2
Якщо ви змушуєте себе відчувати себе старше, є сисадміни, які ніколи раніше не бачили дельтрея.
Йосип

5
Мені довелося пояснити багатьом програмістам, що при спробі операції, яка змінює стан, і все ж може провалитися і залишити вас у попередньому стані, ви повинні перевірити, чи вдалося це, якщо ви збираєтесь зробити щось небезпечне якщо ти знаходишся в попередньому стані. Чому я повинен пояснювати це?
carlito

61

root @ dbhost # find / -name core -exec rm -f {} \;

Я: "Ви не можете ввійти? Добре. Як називається БД?"

Cu: "Основні".

Я: "О".


3
і з цього моменту до команди очищення додано використання команди "файл" ... :)
MikeyB

3
О Боже
мій

4
О боже мій ... ух. Я збираюся подумати про це, тому ніколи цього не роблю.
Глен Віллен

60

Мені подобається, як кожен кваліфікує свою історію з "коли я був молодим / зеленим" так, ніби вони ніколи цього не повторять. Нещасні випадки можуть трапитися навіть з найбільш досвідченими профі.

Мій власний найгірший момент такий поганий, що я все одно відчуваю серцебиття ...

У нас був SAN з даними про виробництво. Критично ставиться до компанії. Мій "наставник" вирішив розширити розділ, щоб звільнити трохи дискового простору. Ви можете бачити, куди це заголовок? Він сказав, що програмне забезпечення SAN може робити це в прямому ефірі, у виробничі години, і ніхто цього не помітить. Дзвони тривоги повинні були задзвонити, але помітно мовчали. Він сказав, що робив це "багато разів раніше" без проблем. Але ось у чому річ - він змусив мене натиснути кнопку, яка сказала "ти впевнений?" Як я був новим у компанії, я припустив, що цей хлопець знав, про що він говорить. Велика помилка. Хороша новина полягала в тому, що LUN розширили. Погана новина була ... ну я знав, що були погані новини, коли я почав бачити помилки в записі диска на вікно Windows.

Я радий, що вдягнув коричневі штани.

Нам довелося пояснити, чому 1 об’єм даних зник у обідній час. Це був дійсно, дуже поганий день.

Насправді це хороший принцип - перш ніж робити щось, у чому ви сумніваєтесь, уявіть, що потрібно пояснити керівництву, якщо щось піде не так. Якщо ви не можете придумати гарну відповідь, щоб пояснити свої дії, тоді не робіть цього.


17
+1 за останній абзац - техніка "сиди на руках", одна життєва хвилина для роздумів
Енді

12
Є певний навик, який ви отримуєте, працюючи з живими системами деякий час: павук відчуває те, що небезпечно, а що ні. Як і призупинення додаткової секунди перед натисканням клавіші return у кореневій підказці, або переконайтеся, що оператор оновлення SQL має належний пункт, де застереження (це вже запущено у підрахунку вибору (*)).
jplindstrom

18
Я хочу, щоб спливаюче вікно написало щось на кшталт "Чи бажаєте ви надрукувати своє резюме, перш ніж продовжувати?" .. і є лише один варіант: "Так"
warren

+1 за порадою в останньому абзаці
Йероен Хуїнінк,

3
+1, дітто. Я пам’ятаю, як почув від друга-сидсмена, що в його щорічній оцінці ефективності виникали проблеми з приводу його поганої швидкості набору тексту, яку він зневажливо (і правильно) відхилив: «Мені не заплатили за те, щоб швидко набрати текст. повільно і задумливо ".
MadHatter

54

Nagios пінгендував нас одного ранку, коли в робочий час почали говорити, що він не може підключитися до некритичного сервера. Добре, похід до серверної кімнати. Це старий сервер, Dell 1650, придбаний у 02 році, і ми знали, що у 1650-х були проблеми з обладнанням. PFY натискає кнопку живлення. Нічого. Знову натисніть і потримайте його протягом п’яти секунд, щоб «увімкнути живлення» ... що перекриває захист від помилок BMC, оскільки без DRAC немає можливості перевірити журнали BMC, не ввівши живлення в корпус.

Машина запускає POST, а потім знову гине. Я стою над ним і йду, "пахну димом". Ми витягуємо сервер на його рейки, і один з джерел живлення відчуває тепло, тому PFY витягує його і збирається закрити коробку назад. Я кажу: "Ні, це не димовий блок живлення, це дим на материнській платі".

Ми знову відкриваємо корпус і шукаємо джерело запаху пекучого. Виявляється котушка індуктора та конденсатор, що-небудь здувало регулятор напруги на материнській платі, і розпорошував розплавлений мідь та конденсаторний контур по всьому, вкорочуючи купу речей і в основному створюючи великий безлад.

Найгірше для мене було те, що я визнав, що я курив достатньо обладнання, щоб визнати різницю між запахом згорілої материнської плати та згорілим джерелом живлення.


17
Критерії відбору цієї роботи включають: хороший нюх. Блискуча.
mlp

13
Мій приятель вкрутив набір накопичувачів накопичувача в диск так, що вони зайшли в друковану плату і вкоротили її. Досить рожевий дим. Дуже помітний.
squillman

47

Три дні тому (серйозно) мене віддалено увійшли до шкільного сервера, встановивши Service Pack 2 на файловому сервері Windows Server 2008.

Я вирішив запланувати необхідну перезавантаження на пізню ніч, коли викладачі не будуть входити в систему оформлення карт звітів на кінець року. Я набрав щось на кшталт:

 о 23:59 "вимкнення -r -t 0" 

... що, можливо, спрацювало б чудово.

Але потім я вдруге здогадався. Чи був мій синтаксис "відключення" правильним? Я спробував переглянути довідку щодо використання, ввівши

 відключення / год 

... і миттєво втратив зв’язок RDP. Панікуючи, я натиснув Google на синтаксис. Швидкий пошук показав, що версія вимкнення версії Server 2008 включає перемикач / h, який (як ви вже здогадалися) перезимує машину.

Вчителі почали телефонувати мені протягом декількох хвилин, щоб повідомити, що вони більше не можуть відкривати або зберігати картки звітів, над якими працювали. Оскільки я був поза межами сайту і серверна кімната була заблокована, мені довелося безпосередньо зателефонувати директору школи і пройти її через процес включення машини.

Сьогодні я приніс усім домашнє печиво як форму вибачення.


32
Ідеальний приклад недосконалого дизайну інтерфейсу користувача в командному рядку: що трапилося з "Принципом найменшого сюрпризу"?
Май

9
в DOS / Windows, чи не так?
Jared Updike

3
Зазвичай /? на Win, але є багато утиліт, які переносяться з UNIX або написані людьми UNIX (у тому числі досить багато таких у MS), які є -h або / h
Річард Ґадсден

6
..але ти все-таки ВЖЕ Спробуй /?перше!
warren

14
Ось чому мені подобається Linux. man shutdown. Я знаю, що я не збираюся створювати проблем з цим man!
Джош

37

У попередній роботі у нас була чудова система доморощених виробів, яка реєструвала та архівувала кожну частину пошти, яка входила, залишала чи залишалася в компанії.

Знищив всю свою поштову скриньку? Нема проблем! Шукаєте шматочок пошти, який вам надіслав хтось тиждень / місяць / рік тому, але ви не можете згадати, хто його надіслав чи що було за тему? Нема проблем! Ми просто перезавантажимо все з лютого для вас у спеціальну папку.

У якийсь момент у генерального директора компанії виникла потреба контролювати пошту, яка перебуває між конкурентом та внутрішнім продавцем під підозрою. Тож ми налаштовуємо сценарій, ніж щоночі бігали та доставляли відповідну пошту попереднього дня генеральному директору. Нема проблем!

Приблизно через місяць слово про невідкладну проблему з подвійним плюсом прозвучало з високого рівня. Здається, що, як генеральний директор читав список листів, надісланих до $ OTHERCOMPANY, він натрапив на цей:

To: somebody@$OTHERCOMPANY
From: CEO
Subject: CEO has read your message (subject line here)

Звичайно, що генеральний директор був важливою людиною, і він був надто зайнятий, щоб натиснути на всі діалоги "Надіслати читання" в Outlook і налаштував свого клієнта просто надіслати їх усім. В одному з повідомлень, що потрапив у фільтр моніторингу, було встановлено запит на читання. Здогадайтесь, що зробив Outlook? Очевидно, що посилили "підпільний" моніторинг.

Наступне наше завдання: додавання правил до поштового фільтра для блокування вихідних квитанцій про читання від генерального директора до цієї компанії. Так, це було найпростіше. :)


3
Однак це не є законним у моїй країні. Зовсім.
мафу

1
Ах, ну це твоя країна. :) У Канаді це просто чудово.
MikeyB

7
Немає права контролювати надходження електронної пошти або вихід із серверів своєї компанії? У якій країні ви живете?
Ендрю Енслі

1
+1 для новинки
Фахад Сада

36

А-а-а, моє було близько 10 років тому, коли я ще мочив ноги. Я мав радість встановити резервні копії акумуляторів на всіх комп’ютерах програмістів. Вони також хотіли, щоб завантажене програмне забезпечення попереджало про відключення електроенергії та справно закривало.

Тому я встановив це на своєму комп’ютері, щоб спершу протестувати все і переконатися, що все працює. Тому я відключаю шнур живлення і на моєму екрані з'являється повідомлення. "втрачена зовнішня потужність, починається відключення системи".

Тому я подумав: Ей здорово, це спрацювало. Але я з якихось дивних причин навіть не пам’ятаю, що це повідомлення було надіслано як мережеве повідомлення, тому всі 200+ комп’ютерів компанії отримали це повідомлення, де 100+ користувачів, де програмісти.

Так, говори про масові виродки !!

Я ненадовго тримав голову в цьому місці!


3
Ха-ха, звучить як те, що сталося з моїм другом тут із "чистим відправкою" та приблизно 1300 одержувачами :)
майстерним майстром

10
Тьфу. Я теж робив "чисте надсилання" в коледжі. Я думав, "вони повинні були відключити це" ба-дін! ба-дінь! у всій лабораторії комп'ютери підняли повідомлення. Я вирішив попросити вибачення у мережевого адміністратора, і на моєму шляху кожен комп'ютер, який я передав, мав повідомлення. / зітхання
Метт Сіммонс

3
Так, ходити сором прямо там! Мій друг не вставав зі свого крісла. Не потрудився відповісти і на його телефон.
шквал

10
Ха-ха, друг мого неттового послав би всіх в школу "ДОПОМОГА! Я в пастці в кімнаті 114", і, звичайно, через 60 секунд з'явилася невелика армія людей, щоб дізнатися, хто надіслав це повідомлення
Марк Хендерсон

2
Ми фактично використовували цю функцію, щоб панк-адмініструвати мого молодшого коледжу. Очистив усі комп'ютерні лабораторії з підробленими AV-повідомленнями та повідомленнями відключення системи, схожими на те, що вони надходили від нього. Він напевно підозрював, що ми були винуватцями, але у мене з моїм приятелем було алібі (я послав першого, коли він був у класі, а другий, коли я був у класі), а комп'ютери мали загальні
логотипи

35

Я часто використовував команду "sys-unconfig" на машинах Solaris, щоб скинути службу імені машини, IP-адресу та пароль root. Я був у системі користувачів, і я ввійшов на сервер встановлення будівлі і щось подивився (як root), а потім забувши, що я увійшов до іншої машини (не описовий "#" підказок), я запустив команду "sys-unconfig".

# sys-unconfig     
        WARNING

This program will unconfigure your system.  It will cause it
to revert to a "blank" system - it will not have a name or know
about other systems or networks.

This program will also halt the system.

Do you want to continue (y/n) ? y

Connection closed

#

Це повідомлення "закрито з'єднання" повільно перейшло в паніку ... на якій машині я ввійшов, коли запустив цю команду.

Найгірше це було не у важкий час, який мені дали колеги, це те, що я зробив те саме через місяць.


24
О, класичний, "на якій машині я?" момент паніки. Я був там. Я відчуваю твій біль.
sysadmin1138

2
Я також. Кожен, хто пережив це, точно знає, що означає фраза "крижана кров".
Метт Сіммонс

21
Існує причина, що мій підказки завжди включають ім’я користувача та ім’я хоста ...
derobert

2
Одного разу я створив псевдоніми для входу на різні машини, щоб отримати різні кольори тла, щоб можна було ще чіткіше розпізнати, на якій машині я перебуваю.
Zitrax

Оскільки я використовую Linux як на серверах, так і на моїй локальній машині, у мене часто відкриваються кореневі підказки на серверах і на моєму ПК, сервери мають червоні підказки для розрізнення
Hubert Kario

27

У мене досить гарна. Правда, це було до мого часу як систематик, але все ще пов'язаний з технікою, тому я подумав, що додам його.

Ще в той час я працював як сатком / широкосмуговий технік США. Нещодавно закінчивши технікум, я опинився в дислокуванні в Південній Кореї. Незабаром після прибуття на станцію з'явилася можливість подорожувати на південь із "великими хлопцями", які були там деякий час і фактично працювали над деяким реальним (тобто "виробничим") обладнанням.

Я зійшов з екіпажем і, як нетерплячий, молодий технік, балакав на шматочок, досить схвильований перспективою отримати мої руки на фактичному елементі обладнання, який пропускав LIVE військового голосу та передачі даних.

Щоб почати мене повільно, вони подали мені інструкцію, звернулися до секції профілактичного обслуговування і вказали мені у напрямку чотирьох стелажів, наповнених кількома великими цифровими мультиплексорами. Обладнання було досить простим, ми охопили те саме обладнання в технікумі.

Перша сторінка посібника прочитана; "Підключіть живлення до дистигального мультиплексора. Поверніть обидва задні вимикачі у положення ВКЛ. Я підняв очі, і вже застосували живлення!

Я точно опинився в неприємності. Не знаючи, як рухатись, я вистрілив з усіх сил: "Умммм. .. Щось тут програв", дивлячись на старшого.

Він подивився на мене і засміявся: "Ні, ні, це нормально. Ви можете проігнорувати цю частину контрольного списку". Потім, як він помітив погляд на моєму обличчі (оскільки нас в школі навчали НІКОЛИ, НІКОЛИ не ігнорувати будь-яку частину контрольного списку, і це була певна смерть і руйнування, якщо це потрібно зробити), він серйозно подивився на його обличчя і сказав: "Ігноруйте ТОЛЬКО цю частину! Дотримуйтесь решти, до листа!"

Прекрасно, я пробіг багатоступеневі інструкції щодо прем'єр-міністра, щасливий, як молюск, і пишаюся тим, що вони дозволяють такому низькому рейтингу (хоч і розумному) техніку робити цю важливу роботу.

Десь між п'ятим та шостим контрольним списком технічного обслуговування цих величезних мультиплексорів я почав помічати підвищений рівень активності навколо себе. Телефонували дзвінки, люди швидко рухалися. Вікторинні погляди обмінювалися.

Нарешті до мене підбігла група людей, яку очолив один із старших техніків, який мене збив.

"Гей! Ми спостерігаємо ВЕЛИЧЕЗНІ перебої в трафіку даних, і ми виділили / простежили шлях назад до стійок, над якими ви працюєте! Чи бачите ви якісь дивні?"

(У цей момент його відрізав ще один із інструкторів, що виправили неполадки, який пробрався до першої групи мультиплексорів, над якими я виконував прем'єр-міністри.)

"СВЯТІ ОРЕХИ! ЇХ ВІДКРИТИ! ЇХ ВІДКРИТИ !!!!"

Коротше кажучи, я спостерігав, як вони поспіхом пробігли перший крок в посібнику: "Поверніть обидва задні вимикачі в положення ВКЛ ..." Коли старший технік закінчився, він підійшов до мене і з недовірою запитав, що я думаю , відключивши критичні частини обладнання.

Перелякавшись розуму, я передав йому контрольний список, який я дотримувався, поклявшись, що я не відхилився ВСІХ. Щоб я дотримувався цього, «до листа», як він доручив.

Через деякий час він засміявся і вказав, де лежить проблема.

У посібнику ЗАКЛЮЧНИЙ крок у контрольному списку профілактичного обслуговування:

"Запишіть остаточне зчитування зонда, витріть передню панель, видаливши весь пил і тверді частинки, а потім поверніть обидва задні вимикачі живлення у положення OFF."

:)


Я зараз не знаю, що означає це
Джо Філіпс

Хіба останній крок, що говорить про вимкнення машин, не здався трохи дивним? Просто цікаво.
Ендрю Енслі

2
Це, мабуть, здавалося дивним, але пам’ятайте, він був у військових. Уявіть, що намагаєтеся командувати армією, де кожен солдат каже: "Зачекайте, ви впевнені? Цей наказ мені звучить смішно".
Kyralessa

26

Це своєрідна аварія на сисадміні. Оскільки сисадмінам періодично доводиться фізично перевозити велику кількість машин з точки А до точки В (де А і В, здавалося б, завжди розділені кількома сходами в будівлі без ліфта). Під час п’ятої подорожі дня я зупинився на перепочинок на три польоти вгору від рівня завантаження підвалу, щоб поспілкуватися з кимось, хто спускається, підперши повнорозмірну вежу з / по станції, яку я шипляв на внутрішній поруччя відкритої сходової клітки і ... ну, ви здогадалися ... трохи втратив мене в руках. Він безперешкодно поринув прямо в колодязь, а коли досяг дна, е ... не стільки з функціоналом для цього! Загальна кількість врятованих деталей: дві палички оперативної пам’яті, одна дискета та одна карта ISDN (нехай Бог благословить інженерів Hermstedt!). Все інше або тріснуло,

З ласки Божої, ніхто не ходив внизу, що, на щастя для мене, було першим моїм начальником, тому я повинен утримати свою роботу. Відчував себе дуже хворим протягом години або близько того.

Мораль: гравітація завжди перемагає!


2
Ви не сфотографували уламки, чи не так?
pupeno

5
@ J.Pablo - Ні, я боюся, що це було більше десяти років тому, коли камери були великими і в них були хімічні речовини та інше. Якби я це зробив нещодавно, я би мав наслідки на YouTube протягом десяти хвилин!
avstrallen

Справжня історія: це сталося зі мною 9 років тому, але з кондиціонером та з вікна 9 поверху . Це було не з моєї вини (я просто комусь допомагав), і ніхто не постраждав, але я нудився цілими днями .
imgx64

26

Я перезавантажував систему для когось, і під час процесу ручного резервного копіювання я поставив йому питання "Чи є у вас інші програми, які ви використовуєте?" і "Чи є ще щось важливе, що ви робите на комп'ютері?"

Він сказав "ні" кілька разів.

Я переконався і відформатував диск.

Близько 30 хвилин він сказав "о боже мій" і поклав обидві руки на голову.

Виявляється, він працював над написанням книги понад 10 РОКІВ у спеціалізованій програмі. Це повернулося, коли програми, які використовували для збереження даних користувачів у його каталозі програмних файлів, я пропустив це.

Whhhhooooops.

Він не злий на мене, але це було тверезим почуттям.


7
Ви навчили його цінним уроком: Важливі резервні копії
MikeyB

5
Просто читати це справді боляче. Так боляче. Звичайно, урок, але ...
mafu

Все-таки хороший досвід для бідного хлопця. Він міг би попрацювати 30 РОКІВ і перед вами отримати інфаркт.
перерва

Чоловік, якого я пам’ятаю, робив щось подібне. Мабуть, у мого дядька було багато подібних речей для клієнтів для цього користувальницького додатка для вікон, який його робота дала йому. Це було в програмних файлах / зітхання. На щастя, я згадав це, коли мій я виправив татовий робочий ПК, який мав на ньому спеціальну програму страхування.
PHGamer

@phgamer, чи можу я попросити вас подивитися мову, будь ласка - це не так шкода місця.
Chopper3


23

У мене цього не сталося, але ...

Я працював у компанії, яка виробляла програмне забезпечення, яке працювало на машинах Linux, наданих клієнтом. Ми, по суті, «взяли» на себе машини, повністю налаштували їх під наші характеристики, і зробимо все управління та моніторинг. По суті, ми були командою з 10-15 системних адміністраторів, які керували тисячами серверів для сотень клієнтів. Помилки повинні були відбутися.

Один з нашої команди знайшов деякі проблеми на сервері (резервна копія, я вважаю) і вирішив, що він повинен запустити fsck на ньому. Він зупинив усі відповідні служби, переконався, що в системі були зроблені резервні копії, зроблені нещодавно, а потім запустив fsck, але скаржився, що файлова система встановлена. Оскільки ми були віддалені і не мали віддаленого доступу (DRAC, ILO тощо), він не міг зробити fsck, але був впевнений, що це безпечно робити з встановленою файловою системою, якщо ви обережні.

Він вирішив спробувати сам, запустивши fsck на своєму кореневому розділі з передбачуваними результатами - він пошкодив свій кореневий розділ і більше не міг завантажуватися.

Розгублений, він підійшов і поспілкувався з нашою командою. Ведучий сказав, що він майже впевнений, що ви цього не можете зробити, і член команди сказав: "Звичайно, ви можете!", Взяв клавіатуру ведучого і показав йому, що ви можете - запустивши fsck на корінний розділ ведучого. Який повністю пошкодив його корінний розділ.

Кінцевий результат? Дані клієнта не втрачені завдяки тестуванню члена команди. Два дні продуктивності співробітників були втрачені, але це коштувало далеко, набагато менше, ніж дані на машині замовника. А для запису? Ви можете запустити fsck на встановленому диску, але тільки для перевірки даних. Не для ремонту. Це була помилка члена команди.

-

Щоб додати свою власну історію, я працював у тій же компанії і намагався скинути пароль користувача. Наша система відмовилася дозволити мені встановити потрібний йому пароль, оскільки він відслідковував старі хеші паролів і відмовив вас дублювати пароль. Механізм був простий: він підтвердив ваш пароль щодо останнього хешу в базі даних.

(І для запису, це повинен бути старий пароль, оскільки це спільний обліковий запис, і переконайтесь, що всі знають, що новий пароль недоцільний)

Я вирішив просто зайти в базу даних користувачів і видалити нові записи, щоб вони використовували старіші. Це все лише SQL (працює стародавня версія Sybase), тому це легко. По-перше, мені довелося знайти записи:

SELECT * FROM users_passwords WHERE username='someuser';

Я знайшов старий запис, який він хотів зберегти; перед ним було ще двоє. Я вирішив бути розумним і просто видалити все новіше, ніж старий запис. Подивившись набір результатів, я побачив, що в базі даних старий пароль був ідентифікатором №28, а новий - ID #several тисяча (дуже зайнята система). Це просто, всі старі рядки були> 28, так:

DELETE FROM users_passwords WHERE id > 28;

Немає нічого гіршого, ніж зробити просту обрізку рядків і побачити "постраждалих 212 500 рядків". На щастя, у нас було два головних сервери баз даних (з ідентифікатором користувача), але Sybase (принаймні, наша версія) не підтримував автоматичну реплікацію, тому він не вимикав автоматично старі записи. Тривіальна справа - отримати дамп таблиці user_passwords та повторно імпортувати його. І все-таки досить великий "о f ** k!" мить.


Тому є заява "LIMIT" в sql;)
hayalci

20
Більш суттєво, тому ви завжди спочатку видаєте "ВИДАЛИТИ З xxx" як "ВИБІР * З ІХХХ". Потім двічі перевірте, що вона показує, а потім просто замініть SELECT * на DELETE.
sleske

1
FYI, я не впевнений, що навіть fsck без змін є безпечним на встановленому ext3, він все-таки
повторює

14
Ні, саме тому ви завжди видаєте початковий транш. Тоді, коли ви побачите, що зафіксовано набагато більше рядків, ніж було передбачено, ви можете відмовитися.
pipTheGeek

1
@Dan Це майже так само, як і будь-який інший RDBMS, ви просто переконайтеся, що запускаєте свою заяву, чи плануєте свої чеки, як-от просто перевірка порушених рядків або вибір, який готовий перевірити результат оновлення, а потім здійснити чи скасувати. Це врятувало мене один раз, коли я забув виділити пункт WHERE у твердженні T-SQL в MS-SQL 2005.
pipTheGeek

22

Ще один із моїх улюблених:

Під час налаштування комп'ютера та локального лазерного принтера в системі, у мене виникла яскрава ідея підключити їх як до ДБЖ комп'ютера. Коли-небудь намагалися надрукувати на локальному лазерному принтері, коли він підключений до настільного ДБЖ? Ну, якщо ви не знаєте, воно, як правило, тягне всі ампери ... Що перезавантажує комп'ютер ... І завдання друку ніколи не закінчується ...!

Коли-небудь телефонуйте: " Щоразу, коли я друкую, він перезавантажує комп'ютер і не друкує !!! '?

Ой!

JFV


1
Ооо, я просто чекаю, коли це станеться в моїй церкві :)
Сквілман,

2
Більшість виробників ДБЖ кажуть, що "не підключайте лазерні принтери", оскільки вони перевантажать їх.
Андрій

22

ВИДАЛИТИ заяву без пункту WHERE, в базі даних живих меценатів клієнтів.


9
FTW!
Spoulson

6
Де ви були, перш ніж я витер їхню базу даних!
Ян Бойд

1
Це свого роду обряд проходження; кожен молодий DBA повинен зробити це хоча б раз. Сподіваємось, на щось, що не надто важливо ...
RainyRat

22

Введено kill 1як корінь. initі всі її діти померли. І всі їхні діти. тощо. На жаль.

Що я мав на увазі, це було kill %1

Після того як я зрозумів, що я зробив, я підбіг до панелі управління машини для сортування тюків BIG з вовни та натиснув кнопку аварійної зупинки. Це зупинило розрив машини на шматочки, оскільки я щойно вбив програмне забезпечення, яке ним керувало.


1
Це змусило мене сміятися! Працюючи з великою технікою в минулому, я можу застосувати системи управління.
SpaceManSpiff

1
На BSD, kill -1 1, викликаний init, щоб перечитати inittab або / etc / ttys. Відмова від "мінусу" мала наслідки ...
kmarsh

2
Слава богу за цю кнопку аварійного припинення! :-)
статистика

+1 за те, що не можна сказати: "Ви не можете завдати будь-якої шкоди обладнання, спілкуючись із програмним забезпеченням"
outis

21

Ми опинилися в середині відключення електроживлення і побачили, що ДБЖ працює на 112% від налаштованого навантаження. Це не було великою проблемою, оскільки ми працювали на генераторі в той час.

Тож ми розійшлися, підтягуючи резервні силові кабелі, щоб зменшити споживання електроенергії на цьому ДБЖ (у нас було два, один набагато більший за інший). Ми дісталися до мережевого комутатора, який керував серверною кімнатою (це була серверна кімната з усіма внутрішніми серверами компанії; клієнт звернувся до серверів в іншій серверній кімнаті). Комутатор був комутатором великого корпоративного класу з трьома джерелами живлення. Поставки були N + 1, тому нам потрібно було лише два, щоб запустити комутатор.

Ми вибрали кабель і витягли його. На жаль для нас, інші два були підключені до єдиної смуги живлення, яка негайно підірвала, коли навантаження піднялося на два джерела живлення, які були підключені до неї. Потім сисадмін запанікував і підключив третій кабель. Перемикач намагався загорітися, передавши весь набір комутатора на єдине джерело живлення. Замість того, щоб джерело живлення вимкнулося, воно вибухнуло в зливі іскр, не за 12 дюймів від мого обличчя, що відсилало мене стрибати назад у стійку серверів.

З інстинкту я намагався стрибнути в бік, але, на жаль, ліворуч була стіна, а двоє праворуч були дуже великими 6'4-дюймовими хлопцями. стійок Compaq (ті, що мають тонкі сітчасті фасади), не кладучи цілого в стійку, і не торкаючись до обладнання.


2
+1 за вражаючий стрибок.
RainyRat

1
Дякую. Денис із закладу був вражений тим, що я його не збив.
mrdenny

20

У якийсь момент моєї кар’єри юридичне розслідування в компанії, над якою я працював, поставило перед нами вимогу зберігати всю електронну пошту від "цього дня" до тих пір, поки не буде сказано інше. Приблизно через рік зберігання щоденних повних резервних копій обмінного середовища (1 ТБ щовечора) у нас не вистачало місця.

Адміністратори біржі запропонували нам зберігати лише кожну 8-ю копію електронного листа. Для цього нам довелося відновлювати дні обміну базами даних, витягувати потрібний їм електронний лист (конкретні люди, позначені для розслідування) та повторно архівувати його. Вони робили це для кожного 8-го дня електронної пошти для всіх наших резервних копій. 8-й день був обраний тому, що в обміні був набір параметрів, де "видалені елементи" зберігаються в базі даних протягом 8 днів.

Після того, як вони закінчать кожен архів, я б повернувся назад і видалив усі резервні копії, які були старшими за те, що вони архівували.

TSM не має простого способу зробити це, тому вам доведеться видаляти об'єкти вручну з резервної бази даних.

Я написав скрипт, який видалив би всі резервні копії, старші за якусь дату, шляхом обчислення дати, використовуючи різницю між сьогоднішньою і цією датою. В якийсь день мені довелося видалити резервні копії, що мали приблизно місяць, за винятком випадків, коли я здійснив підрахунок дати, я написав помилку та вписав дату як 7/10/2007 замість 6/10/2007, і запустив сценарій. Я видалив цілі зайві місяці даних, випадково це було частиною дуже важливого позову.

Після цього я додав кілька кроків до сценарію, щоб підтвердити, що ви хочете видалити дані, і показати вам, що він збирався видалити ...

На щастя, вони ніколи навіть не використовували жодних даних, над якими ми наполегливо працювали, щоб зберегти, і я все ще маю свою роботу.


5
1 ТБ за день: обмін даними? Вау - у вас, хлопці, було 365 терабайт, присвячених ДЖУСТУ для додаткових резервних копій Exchange? Ось якесь серйозне сховище ви збираєтеся туди.
Карл C

28
Ви втратили б лише 1 день, якби були в Європі :-)
PowerApp101,

20

Після довгого робочого дня або відстеження продуктивності та налаштування величезного мейнфрейму (ви знаєте, звірі, які проходять за пару годин, перш ніж всі резервні сайти в режимі очікування погодилися, що це дійсно знову завантажилося і повністю синхронізується), я розтягнув пальці, набрав задоволене відключення -p зараз у моєму ноутбуку підкажіть, закрив кришку, витягнув серійний кабель з мейнфрейму, очікуючи приємного холодного келиха лагеру.

Раптом я чую оглушливий звук, який крутиться вниз мейнфрейм, поки мій ноутбук із задоволенням демонструє X.

Дочекавшись, коли машина знову з'явиться повністю в Інтернеті, я вирішив, що у мене є час, щоб мої ACPI працювали на моєму ноутбуці, тому я ніколи не піддався спокусі відключити свій ноутбук.


Якщо обертання DOWN мейнфреймів шумить, я не хочу чути, як він крутиться вгору, або ще гірше, на повній швидкості.
Mircea Chirea

16

Ця аварія не сталася ... але варто згадати:

Мене відправили до центру даних, що використовується широко, щоб провести тести на пропускну здатність нового ланцюга. Я дістався до кімнати demarc / IDF, знайшов місце на одній із стелажів для мого тестового маршрутизатора, зробив зв’язки та розпочав тести. На жаль, я повністю не зміг помітити, що внутрішньовиробничий маршрутизатор не тільки знаходиться на наступній стійці (майже на тому самому рівні), але й те, що він був таким же маркою та моделлю, що і мій тестовий маршрутизатор.

Коли було проведено тестування, я почав натискати перемикач живлення у положення вимкненого (... уявіть це у повільному русі ...), і, клянусь, так само, як я чинив тиск, на мене осяялося, що маршрутизатор, про який я збирався відключити було те, що у виробництві. Моє серце зупинилося, і я майже… ну, використовую вашу уяву.

Я залишив МДФ центру обробки даних, виглядаючи розгубленим і блідим, але в той же час радий, що все-таки працював!


18
Уявіть собі, що це могла бути однією з таких ситуацій з мінами. Ви розумієте, що ваш палець натискає кнопку, що ви зробили, і ви не можете вийняти палець, або якщо сервер піде вниз. Тому все, що ви можете зробити, стоїть там і кричить про допомогу.
Том Ріттер

20
ЛОЛ .. не думала про це! Це була б ШЛЯХА краща історія. Я можу собі уявити, що інженери мережевих центрів обробки даних чіпляються навколо, підносячи різні рішення проблеми. Можливо, хтось із них розмістив би (якщо тоді був доступний SF) питання на кшталт: "Як ми можемо відключити перемикач живлення на роутері після того, як його буде натиснуто ідіотським техніком?" (+500
бантових

21
Якщо це схоже на те, де я працював, рішення передбачає швидке видалення кривдного пальця і ​​заміну його великою кількістю клейкої стрічки. (А потім маєте намір запланувати час простою машини для видалення стрічки, але відкладати її на 18 місяців, поки стрічка остаточно не вийде).
Ян

16

Я помилково видалив обліковий запис когось, імена змішалися з тим, кого я хотів видалити. Опс

Класна частина полягає в тому, що вони ніколи не знали, що сталося. Отримав дзвінок, на який вони не змогли ввійти, копійка потрапила на рахунок, який я видалив.

Під час спілкування з ними я швидко створив їхній обліковий запис, приєднав до нього стару поштову скриньку (на щастя, Exchange не видаляє поштові скриньки відразу) і повернув її до своїх старих файлів користувачів.

Тоді я звинувачував їх у тому, що вони забули свій пароль, який я щойно для них скинув :)


9
Я розірваний між +1 балами, якими ти повинен був скористатися цим виправданням, і -1'ing за те, щоб брехати користувачеві ....
Бабу

22
+1 за звинувачення користувача
JJ01,

16

Випадково встановлено файл tar.gz на моєму вікні Gentoo Linux у неправильному місці, і він залишив файли всюди. Це, мабуть, було близько 1999, 19 років (спасибі за коментарі нижче)

Будучи витівником, який я є, я вирішив спробувати скриптувати себе з роботи, проходячи вручну через кожен файл.

Тому я спробував:

смола - список evilevilpackage.tar.gz | xargs rm -rf

Мені не потрібно було довго зауважувати, що tar також перераховував усі каталоги, якими користувалася програма, включаючи такі: '/ / usr, / var, / і т. Д.' 'Та кілька інших, яких я не дуже хотів піти.

CTRL-C! CTRL-C! CTRL-C! Запізно! Все минуло, перевстановіть час. На щастя, в коробці не було нічого важливого.


10
Я ненавиджу деталізувати деталі, але я впевнений, що Gentoo розпочав близько 2002 року
Метт Сіммонс

Так, 1.0 було випущено в 2002 році. RedHat або Slackware будуть більш вірогідним вибором ще в '98
saschabeaumont

Якщо він не був по-справжньому хардкор, Enoch Linux випустив 0,75 в грудні 1999 року і, зрештою, став Gentoo з версією 1.0 2002 року
Shial

У той час жив у підвалі моїх матерів, тож це було приблизно в цей час, принаймні до 2000 року. це був наступний логічний крок після Slackware.
Андріоїд

Slackware мав пакети .tgz.
Маріус Гедмінас

12

Як невелика частина мого колишнього життя я керував файловим сервером компанії, вітком 4:11. Навряд чи КОГО-небудь взагалі потребував будь-якого вводу, але якщо це було, ви відкрили вікно віддаленої консолі.

Я звик використовувати DOS весь час, коли я закінчив, я, природно, набрав "Вихід". Для Netware "вихід" - це команда вимкнути ОС. На щастя, він не дасть вам вимкнутись, якщо спочатку не вимкнете сервер (зробіть його недоступним для мережі / клієнтів). Тому коли ви вводите "Вихід" у консолі, вона корисно говорить: "Спочатку потрібно ввести" Вниз ", перш ніж ви можете вийти"

Запитайте мене, скільки разів я 1: набрав "вихід" у сеансі консолі та 2: Покірно набрав "Вниз", а потім "Вихід", щоб я міг "закінчити те, що намагався зробити"

А потім телефон починає дзвонити .....

Лол


8
неодноразово??
BradC

2
Ось чому я використовую ^ D для виходу. Просто закінчується сеанс оболонки.
Хуберт Каріо

11

Ще одна історія, яка не відбулася (феу):

Ми щодня релігійно робили резервні копії на магнітофон.

Нам трапилось написати стрічку, що містить дані, щоб переслати комусь іншому. Вони сказали, що "ми не можемо прочитати вашу стрічку". Насправді, і ми не могли. Або будь-яка стрічка насправді.

Ми купили ще один магнітофон і затамували подих, поки не встановили його.

Мораль розповіді. Завжди переконайтесь, що ви протестуєте резервні копії.


11

Останнє місце, де я працював, мій колега мав своїх дітей із собою в серверній кімнаті (чому? У мене немає ІДЕЯ!).

Він переконався, що вони знаходяться далеко від серверів, і пояснив своєму 5-річному віку, що він не повинен торкатися жодного з серверів і ОСОБЛИВО жодного з вимикачів живлення.

Насправді він мав їх біля дверей ... (ви бачите, куди це йде ...?)

Хлопчик не торкнувся жодної кнопки живлення сервера ... Ні, це було б занадто просто пояснити. Натомість він натиснув на КРЕСЛУ КРИШКУ, що була біля дверей ... Кнопка, що вимикає живлення на ЦІЛЬКУ СЛУЖБУ СЛУЖБИ !!!

Телефонні лінії одразу почали загорятися, цікавлячись, чому обмін, файлові сервери тощо не були доступні ... Уявіть собі, що намагаєтесь пояснити це генеральному директору!

-JFV


4
у нас був кур'єр, що робить те саме. Не зовсім аварія на систематичній службі, хоча дивна металева коробка несподівано з’явилася над Великою Червоною кнопкою після цього.
март

дивіться також "Molly Guard": catb.org/~esr/jargon/html/M/molly-guard.html
jay_dubya

Мій брат зробив те саме, коли йому було 3 роки на сайті зв’язку, в якому працював мій батько. Половина мережі зв’язку знизилася, коли він включив головний вимикач живлення, який було зручно на 18 дюймів від підлоги. На щастя, мережа була повністю дубльована, тому трафік не втрачався, але все ж ...
staticsan

@marty - відповідна цитата: "Чому? Я не знаю. Він на третьому місці, і я не дам прокляття". "Що?" "Я не дам прокляття". "О! Це наш короткий стоп!"
warren

10

Я колись боровся з програмним забезпеченням для моніторингу АПК APC. Будучи невеликою компанією, у нас було декілька невеликих ДБЖ і різні сервери були налаштовані для їх моніторингу. Більшість серверів були Linux, але на деяких працює ОС Windows, і тому вони використовувались, оскільки програмне забезпечення APC - це лише Windows.

Однак у той час програмне забезпечення APC було важко зафіксовано, що ДБЖ, з якою він розмовляє, також забезпечує живлення ПК на своєму ПК! Це було не так для цього сервера, але я виявив, що занадто пізно, щоб сказати, що він зупинився. Також, на жаль, провідний програміст демонстрував партнеру продукт компанії - це веб-додаток, що працює на тому ж сервері, я не хотів, щоб програмне забезпечення APC закрилося ...


1
на щастя, у нас є apcupsd для linux
Hubert Kario

Що ж, ми робимо зараз. Цей інцидент стався 10 років тому. :-)
статик

8

Я давав новій систематичній екскурсії програму Service Manager. Я сказав: "Якщо вам коли-небудь потрібно було зупинити цю послугу, ви натиснули б цю кнопку, але ніколи не слід це робити протягом дня". Ви ніколи не повірите, наскільки чутливою була її кнопка миші!

Через дві хвилини служба знову запустилася, і ніхто, здавалося, не помітив.


8

Зіткнувшись над баштовим сервером, який був укріплений за стійкою, і вдарився головою об задню частину основного маршрутизатора Cisco на моєму знизу. Таким чином, виявляється, наскільки вільно шнури живлення сиділи в блоках живлення на передній частині Catalyst 6500 .

Так. Зараз у нас в серверній кімнаті міцно на гачку. З моїм ім'ям на ньому.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.