Все большее количество корпоративных центров обработки данных (ЦОД), требующих высокой пропускной способности и низкой латентности транзакций, которые ранее использовали жесткие диски (HDD), теперь сталкиваются с задержкой в производительности и переходят на использование твердотельных накопителей (SSD), представляющих собой современное решение для повышения производительности, эффективности и надежности ЦОД, а также для снижения эксплуатационных расходов.

Чтобы определить разницу между различными классами SSD, необходимо разобраться в двух основных компонентах SSD: процессоре флеш-накопителя и энергонезависимой флеш-памяти NAND, используемой для хранения данных.

На современном рынке SSD и флеш-память NAND разделены на три основные группы: потребительские устройства (планшетные ПК, фотоаппараты, мобильные телефоны), клиентские устройства (нетбуки, ноутбуки, ультрабуки, многофункциональные устройства, персональные настольные ПК), встроенные/промышленные устройства (игровые аппараты) и решения для корпоративных вычислений (высокопроизводительные вычисления, серверы ЦОД).

Однако выбор нужного устройства SSD для корпоративных ЦОД может быть долгим и сложным процессом, который будет включать в себя изучение и оценку множества различных поставщиков и типов SSD, поскольку не все накопители и типы флеш-памяти NAND одинаковы.

Накопители SSD призваны стать заменой или дополнением для жестких дисков (HDD) на основе вращающихся магнитных пластин и имеют различные форм-факторы (в том числе 2,5 дюйма) и коммуникационные протоколы/интерфейсы (например, Serial ATA (SATA) и Serial Attached SCSI (SAS)) для передачи данных из центрального процессора сервера.

Однако простота установки не гарантирует пригодность всех SSD для долгосрочного использования в корпоративных средах, в которых они устанавливаются; убытки от неправильного выбора SSD часто могут свести к нулю все начальную выгоду от экономии и роста производительности – накопители SSD могут преждевременно выйти из строя из-за избыточного количества операций записи, их постоянная скорость записи может значительно снизиться в течение ожидаемого срока службы или увеличить задержки в массиве накопителей, что приведет к их преждевременной замене.

В этом документе мы рассмотрим три основных параметра, отличающие SSD корпоративного и клиентского класса, чтобы помочь вам сделать правильный выбор при замене или добавлении дополнительных накопителей для корпоративного ЦОД.

Производительность

Благодаря использованию многоканальной архитектуры и параллельному доступу процессора флеш-накопителя к кристаллам NAND накопители SSD могут обеспечивать высочайшую скорость чтения и записи, как для последовательных, так и для случайных запросов данных из процессора.

В типичном сценарии использования ЦОД, включающем миллионы байт произвольных данных компании, в том числе совместные технические чертежи CAD, сейсмические данные для анализа (обработка больших объемов данных) или доступ к клиентским данным по всему миру для банковских транзакций, доступ к устройствам хранения должен осуществляться с минимальными задержками и может выполняться большим количеством клиентов, которым нужен одновременный доступ к одинаковым данным без снижения скорости работы.

В случае клиентского использования доступ осуществляется одним пользователем или приложением; разность между минимальным и максимальным временем отклика может быть больше для любых действий пользователя или системы.

На комплексные массивы накопителей, использующие SSD (например, сетевые хранилища, системы хранения с прямым подключением или сети хранения данных), негативное влияние оказывает несоответствие производительности, которое может привести к значительному повышению задержек массивов накопителей, снижению средней производительности и качества обслуживания.

В отличие от клиентских SSD, накопители SSD корпоративного класса (например, твердотельные накопители Kingston E100) оптимизированы не только для пиковой производительности в течение первых нескольких секунд доступа; используя большую избыточную область, они также обеспечивают повышенную среднюю стабильную производительность в течение долгих периодов времени.

Это гарантирует постоянство производительности массива накопителей для организаций, ожидающих высокое качество обслуживания в течение периодов пиковой нагрузки.

Надежность

Флеш-памяти NAND свойственны некоторые ограничения: двумя самыми важными являются предельный расчетный срок службы и вероятность естественных ошибок.

В процессе производства флеш-памяти NAND каждый кристалл NAND тестируется и характеризуется исходной частотой ошибочных битов (BER или RBER).

BER определяет частоту возникновения естественных битовых ошибок флеш-памяти NAND без участия кода коррекции ошибок, которые процессор флеш-накопителя исправляет с помощью немедленной коррекции, не влияющей на доступ пользователя или системы.

Способность процессоров флеш-накопителей исправлять такие битовые ошибки может выражаться как коэффициент неисправляемых битовых ошибок (UBER) – “показатель искажения данных, равный количеству ошибок данных на чтение битов после применения определенного метода коррекции ошибок”.

В документах комитета JEDEC от 2010 года JESD218A: "Требования к твердотельным накопителям (SSD) и способ тестирования надежности" и JESD219: "Нагрузки на твердотельные накопители (SSD), обеспечивающие надежность" указано и стандартизировано отличие накопителей корпоративного и клиентского класса по множеству параметров, в том числе по способности выдерживать повышенные нагрузки записи, более экстремальные условия окружающей среды и восстановления с более высокой BER, по сравнению с клиентскими SSD.

Application Class Workload (see JESD219) Active Use (power on) Retention Use (power off) Functional Failure Requirement (FFR) Uber Requirement
Client Client 40° C
8 hrs/day
30° C
1 year
≤3% ≤10 -15th
Enterprise Enterprise 55° C 24hrs/day 40° C
3 monts
≤3% ≤10 -16

Таблица 1 - JESD218A:"Требования к твердотельным накопителям (SSD) и способ тестирования надежности" © JEDEC. Воспроизведено по разрешению JEDEC.

В соответствии с предложенным JEDEC показателем UBER для SSD корпоративного уровня ожидается появление 1 невосстанавливаемой битовой ошибки с частотой 1 битовая ошибка на каждые обработанные 10 квадриллионов бит (~1,11 петабайт), при 1 битовой ошибке на каждый 1 квадриллион бит (~0,11 петабайт) для клиентских SSD.

Дополнительные методы защиты, в том числе технология отказоустойчивого массива независимых кремниевых элементов (R.A.I.S.E.) в LSI® SandForce® могут применяться в SSD корпоративного класса благодаря использованию чередующегося контроля четности для флеш-кристаллов NAND в случаях, когда код коррекции ошибок процессора флеш-накопителя не может восстановить данные после битовой ошибки.

Технология R.A.I.S.E. ™ позволяет эффективно снижать UBER до 1 битовой ошибки на каждые обработанные 100 октиллионов бит (10-29) или ~111022302462515,66 петабайт и обеспечивает UBER до 1 квадриллиона раз ниже по сравнению со стандартными SSD.

В дополнение к технологии R.A.I.S.E. ™ в SSD Kingston E100 для обеспечения целостности данных при передаче от хоста к флеш-памяти и обратно также используется внутренняя схема сквозной защиты с периодическим созданием контрольных точек и циклической проверкой с избыточностью (CRC).

Наряду с расширенной защитой ECC от битовых ошибок накопителей SSD корпоративного класса они также должны стандартно содержать контрольную электронику с логикой распознавания отключения питания, эквивалентную поддержке защиты от сбоев питания Kingston E100 для контроля входной мощности и обеспечения временного питания с помощью танталовых конденсаторов на случай отключения питания, чтобы выполнить любые внутренние или внешние остаточные команды записи.

Длительный срок службы

Все типы флеш-памяти NAND, содержащиеся во флеш-устройствах хранения, постепенно теряют способность надежного хранения данных с каждым циклом программирования-стирания ячейки флеш-памяти NAND и достигают состояния, при котором надежное хранение данных невозможно; после этого необходимо удалить устройство из пула хранения данных, выделенного пользователям. Логический адрес при этом перемещается на другой физический адрес в массиве флеш-накопителей NAND.

Поскольку программирование или стирание данных ячейки происходит постоянно, BER линейно возрастает; по этой причине необходимо использовать в процессоре флеш-накопителя SSD набор комплексных методов управления для обеспечения возможности надежного хранения данных в ячейке на протяжении всего ожидаемого срока службы SSD.

Количество допустимых циклов программирования-стирания (P/E) конкретной флеш-памяти может значительно варьироваться в зависимости от литографического процесса производства и изготавливаемого типа флеш-памяти NAND.

Тип флеш-памяти NAND TLC MLC e-MLC SLC
Архитектура 3 бита на ячейку 2 бита на ячейку 2 бита на ячейку 1 бит на ячейку
Емкость Самая большая емкость Большая емкость Большая емкость Малая емкость
Срок службы (P/E) Малый срок службы Средний срок службы Высокий срок службы Самый высокий срок службы
Стоимость $ $$ $$$ $$$$
Приблизит. частота ошибочных битов NAND (BER) 10^4 10^7 10^8 10^9

Таблица 2 – типы флеш-памяти NAND

Флеш-память NAND корпоративного класса с многоуровневыми ячейками (e-MLC), используемая в накопителях Kingston E100 корпоративного уровня, в работе схожа с флеш-памятью MLC NAND потребительского класса, однако имеет требования по дополнительному экранированию и классификации с целью достижения повышенного количества циклов программирования-стирания и пониженной BER по сравнению со стандартной памятью MLC, используемой в SSD клиентского класса.

Поскольку SSD корпоративного класса должны выдерживать высокую нагрузку по записи в условиях, типичных для сервера ЦОД, требующего доступа к данным в течение 24 часов ежедневно, по сравнению с SSD клиентского класса, которые обычно используются полностью только 8 часов в день, e-MLC является идеальным вариантом для высокопроизводительных накопителей SSD с большой емкостью и сроком службы.

Расчет надежности при записи для любой области применения или накопителя SSD может быть сложным, поэтому комитет JEDEC также предложил показатель измерения надежности, использующий значение общего объема записанных данных в терабайтах (TBW), для указания количества данных, которое может быть записано на SSD до того, как содержащаяся в нем флеш-память NAND станет малонадежной, и накопитель потребует замены.

С помощью предложенных JEDEC способов тестирования JESD218A и нагрузок для накопителей корпоративного класса JESD219 удобнее оценивать расчеты срока службы SSD, представленные производителями в TBW, и экстраполировать более наглядный показатель надежности, который можно применить к любому ЦОД.

Как отмечается в документах JESD218 и JESD219, нагрузки различных классов областей применения также подвергаются воздействию коэффициента увеличения объема записи (WAF), благодаря которому количество операций записи выше, чем действительное количество, отправленное хостом, что быстро приводит к неуправляемому износу флеш-памяти NAND, повышенной BER флеш-памяти NAND из-за избыточных операций записи в течение долгого времени и сниженной производительности из-за большого количества недействительных страниц на SSD. Механизм сжатия на лету, используемый в накопителях Kingston E100 с технологией LSI® SandForce® DuraWrite™, снижает общий коэффициент WAF и увеличивает номинальный срок службы для областей применения корпоративного класса.

Несмотря на то, что TBW является важным параметром, отличающим SSD корпоративного и клиентского классов, TBW – это модель оценки срока службы на уровне флеш-памяти NAND; для модели оценки срока службы и надежности уровня компонентов для компонентов, используемых в устройстве, применяется параметр "средняя наработка на отказ" (MTBF). Оценка срока службы компонентов накопителей SSD корпоративного класса учитывает превышение по сроку службы и повышенную нагрузку при управлении напряжением для всей флеш-памяти NAND в течение всего ожидаемого срока службы SSD.

Система контроля и отчетности S.M.A.R.T. накопителей SSD корпоративного уровня позволяет с легкостью определять состояние устройства, предшествующее неисправности, на основании коэффициента увеличения объема записи и уровня износа. Также система часто поддерживает предупредительные сообщения, предшествующие неисправности, например, сообщения об отключении питания, о битовых ошибках, произошедших из-за физического интерфейса, или о неравномерном распределении износа.

Накопители SSD клиентского класса могут иметь только минимальные функции вывода S.M.A.R.T. для контроля SSD при стандартном использовании или после возникновения неисправности.

В зависимости от класса области применения и емкости SSD может выделяться расширенная резервная емкость флеш-памяти NAND. Резервная емкость скрыта от доступа пользователя и операционной системы и может использоваться как временный буфер записи для повышения усредненной производительности, а также в качестве замены дефектных ячеек флеш-памяти в течение ожидаемого срока службы SSD для увеличения надежности и срока службы SSD.

Заключение

Существуют значительные различия между накопителями SSD корпоративного и клиентского классов: от количества циклов программирования-стирания флеш-памяти NAND до комплексных методов управления для соответствия нагрузкам различных классов областей применения.

Понимание таких различий в классах областей применения и их связи с производительностью, надежностью и сроком службы может способствовать минимизации рисков простоев, а также управлению такими рисками в ответственных и критически важных корпоративных средах.

Статья с сайта kingston.com