Роман Фишман

Текст

В 2011 году, когда Gmail уже был самым массовым сервисом электронной почты в мире, на серверах Google произошла череда сбоев. Данные более чем 40 тысяч пользователей оказались утеряны, несмотря на то что дублировались сразу на нескольких жестких дисках. Компании грозили серьезные потери. Избежать скандала и восстановить информацию помог архив, сохранивший все на старых добрых магнитных лентах

Современное человечество производит информации не меньше, чем отходов. Каждый день создается около 500 млн новых твитов, пересылается 300 млрд электронных писем, обрабатывается 5 млрд поисковых запросов, Instagram (признана экстремистской организацией) пополняется 95 млн новых картинок. Один только Большой адронный коллайдер  генерирует 90 петабайт данных в год (петабайт — ​10 байт в пятнадцатой степени (то есть квадриллион). Почти все они хранятся на магнитных дисках и лентах, которые являются ​близкими родственниками, работающими на одном и том же базовом принципе.

Магнитная лента — это довольно старая технология хранения данных, которая не перестает обновляться и развиваться. В современном виде технология появилась в 1928 году, когда Фриц Пфлеймер научился напылять порошок оксида железа на клейкую бумажную ленту. Намагниченность частиц железа на разных участках ленты можно менять, равномерно протягивая ее через записывающую головку с электромагнитом, на который подается сигнал. Это позволяет сохранять данные длинной дорожкой в виде череды по-разному намагниченных участков. Уже к концу 1930-х в Третьем рейхе так записывали звук, хотя технология оставалась засек­реченной вплоть до конца Второй мировой войны, когда попала в руки союзников в числе прочих репараций.

Это было время бурного развития вычислительной техники, и компьютерам срочно требовались новые носители информации. Что-нибудь поудобнее и повместительнее перфокарт и перфолент, ведущих историю еще с ткацких станков эпохи промышленной революции. И в 1952 году IBM выпустила первую коммерческую систему хранения данных Model 726 — ​с магнитными лентами на полимерной основе. Она вмещала 2,3 мегабайта, весила почти полтонны и могла заменить около 25 тыс. перфокарт, быстро став популярной на молодом IT-рынке. Однако уже в 1953-м та же IBM представила первый жесткий диск.

Объем и его значение

Как и на ленте, данные на диске кодируются в виде дорожек частиц магнита. Однако здесь они располагаются не несколькими параллельными линиями, а длинной спиралью на поверхности быстро вращающегося диска. Такая форма сразу выглядела перспективнее длинной ленты, поскольку она обеспечивала произвольный доступ к данным. Легко смещаясь к центру или краю диска, магнитная головка находит нужный участок на нем почти моментально, не требуя долгой перемотки, как при использовании ленты. Поэтому технологии HDD развивались быстрее, и в 1980-х они обошли ленты не только по популярности, но и по плотности хранения информации.

Сегодня жесткие диски позволяют записать на единицу поверхности в сотни раз больше данных, чем ленты. Зато на стороне лент сама геометрия. Каждый картридж вмещает сотни метров намагниченной пленки, общая площадь которой на порядки больше, чем у любого «винчестера». Неудивительно, что с приходом глобальных сетей и больших данных магнитные ленты снова стали востребованными, и даже архив Большого адронного коллайдера использует именно их. Миллиарды столкновений элементарных частиц, а также базы генетических данных, петабайты оцифрованных кинофильмов, архивы электронной почты — ​любые данные, не требующие быстрого доступа, остаются на «холодном» хранении на магнитной ленте.

Читать на ЦО.РФ

Сортировка мусора Как бизнесу избавляться от лишних данных и бороться с информационным ожирением

Данные — ​новая нефть. Но и новый мусор тоже. Люди постоянно создают информацию, а компании накапливают ее, надеясь повторить успех Amazon или Facebook. Обладатели больших данных часто не понимают, где их хранить и как использовать. Эта проблема уже получила яркое название: «инфоожирение»

Текущий стандарт таких накопителей, LTO (Linear Tape-Open) девятого поколения, позволяет записывать на один картридж до 18 терабайт. Промышленные системы хранения могут включать до 15–20 тысяч таких картриджей, размещенных на стойках, словно книги в биб­лиотеке. Помните знаменитую рекламу с Биллом Гейтсом, сидящим на высокой стопке листов, демонстрируя, какое внушительное количество бумаги заменяет один-единственный CD? Картинка легко продолжается накопителями на различных носителях. Объем такой системы хранения может достигать 300 петабайт. Это количество потребовало бы порядка 400 млн компакт-дисков — ​стопку высотой почти 500 км, куда вряд ли заберется даже основатель Microsoft.

Фактор времени

Для удобства производители маркируют свои картриджи разными цветами корпуса, по которым опытный специалист может определить поколение и компанию-производителя. Но чтобы управляться с тысячами отдельных носителей, большому LTO-архиву требуется «библио­текарь» расторопнее человека, поэтому сегодня они оснащаются роботизированными манипуляторами. Система автоматически находит нужный картридж, ориентируясь по штрихкоду на его ребре, и тут же размещает в стримере для чтения и записи.

LTO-картриджи стандартного формата Ultrium имеют корпус примерно 11 × 11 × 2 см и содержат около километра магнитной пленки, намотанной на одну катушку. Свободный кончик ленты крепится за направляющий штифт, который захватывают механизмы стримера и фиксируют на приемной катушке внутри самого устройства. Это обеспечивает высокую скорость прокручивания: на поиски нужного участка уходит в среднем 50 секунд, а для полной перемотки ленты требуется не более 80 секунд. К этому можно прибавить еще 10–15 секунд, которые требуются на установку, загрузку и инициализацию картриджа.

Такие задержки остаются неизбежным минусом LTO-накопителей, однако на их стороне едва ли не все остальные преимущества. Срок безопасного хранения ленты достигает 30 лет. Скоростью чтения и записи (до 1000 МБ/с) они превосходят и жесткие диски (до 160 МБ/с), и флеш-память (до 550 МБ/с). Магнитные ленты намного проще и дешевле их в производстве. Они годами могут спокойно лежать на полке, не расходуя энергию, как жесткие диски, которые приходится почти постоянно вращать на тысячах оборотов в минуту и все время охлаждать.

Память завтрашнего дня

«Дата-центров, которые используют накопители на магнитной ленте, с каждым годом становится все больше, — ​говорит старший IT-специалист компании 3Data Алексей Байков. — ​Объемы нашей ленточной библиотеки пока в 2–3 раза меньше, чем суммарно всех HDD и SSD-накопителей в ЦОДе. Суммарно — это 400 картриджей, часть из которых хранится «на полке», вне библиотеки. Многие клиенты, которым доступ к их данным и бэкапам требуется не слишком часто, предпочитают такой вариант. К тому же хранящиеся так ленты никак не связаны с интернетом и особо хорошо защищены: чтобы получить к ним доступ, нужно зайти в помещение. Но те, что нужны регулярно, остаются на своих местах в библиотеке».

Для конечного пользователя, работающего с ленточным хранилищем, процесс мало отличается от обычных операций с файлами. К своему архиву он обращается как к сетевому диску и может производить все нужные действия с файлами: искать, читать, копировать и т.  п. «Весь обмен производится через особый кеш хранилища — ​систему жестких дисков для быстрой записи и чтения, — ​объясняет Алексей Байков. — ​Если пользователю нужен файл, система обращается к ленте, прочитывает его и сохраняет в кеш, откуда его уже может забирать пользователь. Задержка на манипуляции с самими картриджами не превышает нескольких минут. Тот же кеш накапливает и пользовательские файлы для последующей записи на ленту».

Жесткие диски переживают сегодня нечто вроде застоя. В одних сферах их понемногу теснят более скоростные SSD-накопители, в других — ​магнитные ленты. Даже увеличение плотности записи на HDD затормозилось. Для прогресса в этой области требуется использовать как можно более крошечные металлические частицы. Однако после определенного предела в них начинают проявляться новые (суперпарамагнитные) свойства. Полярность таких частиц меняется под действием случайных флуктуаций, быстро уничтожая любую запись. Производители жестких дисков уже столкнулись с этими проблемами. А вот магнитным лентам до этой границы еще далеко, поэтому емкость новых поколений LTO-картриджей продолжает расти и расти.

Разработчики экспериментируют с новыми видами магнитных частиц, новыми способами их нанесения и распределения. Десятое поколение LTO, которое должно появиться в ближайшие годы, сможет сохранять до 36 терабайт на одном картридже. А в конце 2020-го разработчики IBM продемонстрировали экспериментальную технологию, которая позволит записывать на картридже уже до 580 терабайт. В 2025 году, когда общее количество накопленных данных вырастет по сравнению с 2020-м еще втрое, такие объемы нам очень ­пригодятся.

Александр Киселев
Александр Киселев, Руководитель отдела телевизионных серверных систем национального спортивного телеканала «Матч-ТВ»

Данные, хранящиеся у нас на лентах, — ​это не просто архив, это ценный актив. За оцифровку старых матчей и других событий были заплачены большие деньги, и сегодня они не только используются в наших передачах, но и продаются сами по себе. Эти записи занимают большую часть нашей библиотеки. Магнитные ленты — ​самый экономичный по стоимости владения способ хранения таких объемов информации. Наша библиотека потребляет всего три киловольт-ампера электрической мощности, фактически как утюг, и при этом не требует поддержания особых условий температуры и влажности. Даже кондиционер ей не слишком нужен. Единственное, чего боятся ленты, — ​это пыль. Однако их рабочий ресурс ограничен. Хотя современные картриджи могут быть рассчитаны даже на 12 тысяч циклов перемотки, библиотека постоянно работает. По нашей статистике, простой считывающего устройства не превышает пяти минут в сутки. Для снижения износа создается иерархическое хранилище, и ленты — ​лишь один, хотя и центральный, элемент этой инфраструктуры. Здесь есть «центральное хранилище», которое использует диски HDD и обеспечивает быстрый обмен данными между основными узлами системы. Есть промежуточный кеш — ​виртуальный аналог ленточной библиотеки, воспроизведенный на магнитных дисках. И лишь затем ​сама библиотека на лентах. Такая схема снижает износ картриджей и накладные расходы, а кроме того, обеспечивает быстрый обмен данными для наших творческих сотрудников. Напрямую с библиотекой они не контактируют. Все запросы к ней обрабатывает система управления медиаактивами (MAM), которой пользуются через «тонкого клиента» в браузере. Запись в систему тоже производится автоматически. Мы можем сохранять поток по определенному расписанию, если речь идет, например, о трансляции заранее запланированного матча, или в виде файлов с внешних носителей, если корреспонденты привозят видеоматериалы, записанные на стадионе, во время спортивных мероприятий.

Использованные источники: Материал опубликован в журнале «Цифровой океан» № 5, 2021, PATRICK LANDMANN / SPL / Legion-media, ebastian Gollnow / Dpa / Alamy / Legion-media, IBM RESEARCH / SPL / Legion-media, IBM Research, Дмитрий Жайворонок (x4)