Сотрудник, который представился как «Колин», рассказал об инциденте в период его работы помощником инженера в отделе внешней торговли британского финансового учреждения. Однажды работы центра обработки данных банка внезапно остановилась.
Колин пришел на работу в 06:00 и обнаружил, что «никто в здании не может работать». Он понимал, что через час или два объём трейдинга резко вырастет, поэтому систему нужно перезапустить как можно быстрее.
Сотрудники службы поддержки помогли Колину перезагрузить серверы и провести диагностику. В конечном итоге проблема обнаружилась не в них, а на подоконнике, где стояла пара забытых радиочасов — гаджетов, которые синхронизируются с радиосигналами, чтобы точно показывать время. Одни определяли время для серверов Novell, а вторые — для компьютеров с Windows.
Выяснилось, что в радиочасах забыли заменить батарейки типа АА, и серверы, которые полагались на них, откатились к 1 января 1970 года — дате, которую многие компьютерные системы принимают за старт отсчёта времени.
После замены батареек проблема быстро решилась.
Оказалось, что служба поддержки должна была заменять батарейки раз в год, но забыла это сделать. На собрании по поводу инцидента инженеры решили прикрыть коллег и назвали в качестве причины сбоя незакреплённый сетевой кабель.
Источник новости: habr.com