Японский суперкомпьютер потерял несколько десятков миллионов файлов из-за глупой ошибки программистов. Система резервного копирования (СРК) суперкомпьютера дала сбой, в результате которого исчез большой объем данных. Исследователи потеряли 34 млн файлов.Работа четырех исследовательских групп вообще не может быть возобновлена.
Как сообщают в университете, из-за ошибки в работе СКР данных, разработанной Japan Hewlett Packard LLC, система суперкомпьютера перегрузилась. В итоге, часть данных из хранилища была случайно удалена, а именно — около 77 ТБ. Пострадали файлы 14-ти групп пользователей, однако большинство файлов (для 10-ти групп) подлежат восстановлению, но вот файлы 4-х групп — нет.
«Приносим искренние извинения за доставленные неудобства. Мы постараемся сделать так, чтобы впредь подобная ситуация не повторилась», — говорится в официальном сообщении Киотского университета.
Ученые полагают, что при обновлении bash-скрипта, задействованного в процессе резервного копирования и отвечающего за удаление старых журналов, фиксирующих действия программы, была допущена ошибка "по невнимательности".
Новую версию скрипта записывали поверх старого как раз в тот момент, когда старый скрипт уже начал работать. Эксперты из Japan Hewlett Packard говорят, что из-за этой накладки значения переменных были утеряны, новый скрипт загрузился не полностью, поэтому удалились файлы, а не старые журналы. Ошибку никто не заметил, что и привело к плачевным последствиям, сотрудники Japan Hewlett Packard признают свою вину.
В настоящее время процесс резервного копирования остановлен. Сотрудники университета планируют возобновить резервное копирование к концу января после исправления проблемы и принятия мер по предотвращению подобной ошибки.
Поскольку массив определенных данных не подлежит восстановлению, Киотский университет реализует не только резервное копирование путем зеркалирования, но и будем хранить инкрементные резервные копии некоторое время.
Как бы то ни было, сложно исключить все риски, включая возможность потери файлов из-за отказа оборудования или аварии. Поэтому, даже если вы обычный пользователь, сделайте резервную копию важных файлов в другой системе.
Чтобы понять масштаб произошедшего и «ощутить» 77 терабайт данных, давайте подумаем об этом в более общих терминах. 1 ТБ или один терабайт равен 1024 гигабайтам данных. Это уже во много раз больше, чем средняя емкость памяти телефона. Средняя песня занимает около 3 МБ данных, что означает, что 77 терабайт могут содержать более 25 миллионов песен.
Киотский университет считается одним из важнейших научно-исследовательских институтов Японии и занимает второе место по объему инвестиций в научные исследования национальных грантов. Его научные достижения и значимость особенно заметны в области химии, где он занимает четвертое место в мире, при этом он вносит вклад в биологию, фармакологию, иммунологию, материаловедение и физику. Понятно, что потеря 77 ТВ данных нанесла многим из этих исследований непоправимый удар.
Нит уже писал о том, что Китай первым в мире разработал два суперкомпьютера, производительность которых превышает 1 экзафлопс. Что известно про их рекордную производительность?