banner
Centro de Noticias
Nos enfocamos en ofrecer productos excepcionales, entregas rápidas y una atención al cliente atenta.

Los SSD QLC ofrecen 175 GB/s en un servidor de almacenamiento de 2U

May 04, 2023

Hace casi dos años, completamos una revisión de un servidor de almacenamiento Viking Enterprise Solutions (VES) con 24 bahías NVMe y nodos de cómputo gemelos en un chasis 2U. VES es un OEM importante que crea algunos de los sistemas de servidores de almacenamiento más innovadores del mercado. Recientemente, tuvimos la oportunidad de probar una versión de su servidor de almacenamiento que está ajustado para unidades NVMe de un solo puerto. Naturalmente, tomamos 24 SSD QLC Solidigm P5316 de 30,72 TB, los colocamos en el servidor y retrocedimos para ver qué pueden hacer casi 750 TB de flash RAW.

Hace casi dos años, completamos una revisión de un servidor de almacenamiento Viking Enterprise Solutions (VES) con 24 bahías NVMe y nodos de cómputo gemelos en un chasis 2U. VES es un OEM importante que crea algunos de los sistemas de servidores de almacenamiento más innovadores del mercado. Recientemente, tuvimos la oportunidad de probar una versión de su servidor de almacenamiento que está ajustado para unidades NVMe de un solo puerto. Naturalmente, tomamos 24 SSD QLC Solidigm P5316 de 30,72 TB, los colocamos en el servidor y retrocedimos para ver qué pueden hacer casi 750 TB de flash RAW.

Más allá de su trabajo de OEM, VES también vende a una variedad de clientes de HPC e Hiperescala. Esta es una consideración importante porque, dado que consideramos el rendimiento del servidor de almacenamiento fuera del ámbito empresarial tradicional, la forma en que las organizaciones con huellas de datos masivas configuran el almacenamiento es diferente.

Muchas de las cargas de trabajo a las que se dirigen estos servidores son lo que consideramos análisis modernos y aplicaciones de inteligencia artificial donde el rendimiento es crítico y la disponibilidad de datos un poco menos. Como tal, estas configuraciones no se parecen a una SAN tradicional, donde los servicios de datos y la resiliencia son el enfoque principal. En este ejemplo, estamos configurando para un rendimiento óptimo dentro del servidor de almacenamiento VES en lugar de agregar tarjetas de E/S y aprovechar el servidor como almacenamiento compartido.

Este matiz de configuración es importante. Estamos entregando 12 de los SSD P5316 a cada nodo de cómputo AMD EPYC en la parte posterior del sistema. Estos nodos abordan el almacenamiento en JBOD, suponiendo resiliencia a nivel de aplicación para la disponibilidad de datos. Si bien no aprovechamos las GPU para este informe, es bastante razonable configurar esos nodos con algo como NVIDIA A2 para cargas de trabajo de análisis o inferencia.

Sin embargo, antes de sumergirnos demasiado en la configuración del servidor y el almacenamiento, echemos un vistazo a los componentes de hardware clave que forman parte de este trabajo.

Para este trabajo, acudimos a VES para encontrar un servidor potente que pudiera aprovechar al máximo los 24 SSD Solidigm P5316 de 30,72 TB en la parte delantera. Este no es un tema trivial; las unidades de un solo puerto funcionarán mejor en una solución que pueda entregar cuatro carriles PCIe v4 desde uno de los nodos del servidor AMD a cada unidad. El acceso directo ofrece el mayor rendimiento de cada SSD, en lugar de fluir a través de un expansor interno que puede limitar el ancho de banda. Además, este sistema está diseñado para SSD de un solo puerto, como Solidigm P5316, en comparación con la revisión del Viking Enterprise Server anterior que fue diseñado para SSD de dos puertos.

Viking Enterprise Solutions VSS2249P es un servidor de almacenamiento de nodo dual de 2U con 24 bahías para unidades U.2 PCIe v4 de puerto único. Más específicamente, cada nodo (o módulo) de servidor admite 12 SSD NVMe U.2 (SFF-8639) de 2,5 pulgadas conectables en caliente y de un solo puerto a través de carriles x4 PCIe Gen4, lo que lo convierte en un servidor impulsado por el rendimiento. Esto lo hace ideal para casos de uso en los que los cuellos de botella de E/S pueden ser un problema, como el almacenamiento de computación perimetral, análisis, aprendizaje automático, IA, bases de datos OLTP, comercio de alta frecuencia, así como modelado, simulación, investigación científica y otros casos de uso de alto rendimiento.

VES es una empresa líder en desarrollo de servidores y almacenamiento que se especializa en el desarrollo de soluciones a gran escala para clientes OEM empresariales de alto rendimiento y computación en la nube. Debido a su amplia cartera de clientes, tienen una amplia experiencia en el aprovechamiento de tecnologías emergentes al desarrollar sus soluciones, lo que puede ayudar a brindarles a sus clientes una ventaja competitiva. Esperamos mucho de lo mismo con el VSS2249P.

Hemos tenido este servidor en nuestro laboratorio antes, pero esta vez lo hemos llenado con SSD Solidigm D5-P5316 PCIe Gen4 NVMe de 30,72 TB, lo que equivale a casi las tres cuartas partes de un petabyte para almacenamiento a través de la forma U.2 de 15 mm. factor. Esto permitirá a los clientes (específicamente en el espacio de hiperescala) tener implementaciones a gran escala. Las unidades D5-P5316 también cuentan con QLC NAND de 144 capas, lo que reducirá los costos al tiempo que conserva los modelos de alta capacidad y un rendimiento sólido.

Se dice que el D5-P5316 ofrece hasta 7 GB/s en lecturas secuenciales, mientras que los modelos de 30,72 TB ofrecen un poco más de velocidad en escritura con 3,6 GB/s. En lecturas aleatorias de 4K, Solidigm cotiza su nueva unidad a 800 000 IOPS para todos los modelos. La unidad también cuenta con una calificación de 0,41 escrituras de unidad por día (DWPD), una garantía de 5 años y una gama de seguridad mejorada, que incluye cifrado de hardware AES-256, desinfección NVMe y medición de firmware.

Estas unidades son ideales para entornos que necesitan optimizar y acelerar el almacenamiento dentro de las cargas de trabajo del centro de datos, como redes de entrega de contenido (CDN), infraestructura hiperconvergente (HCI) y Big Data.

En general, descubrimos que Solidigm ha creado una unidad que encuentra un excelente equilibrio entre capacidad, rendimiento y costo, lo cual es perfecto para el VSS2249P.

Los dos módulos de servidor dentro del gabinete VSS2249P son intercambiables en caliente y están equipados con una CPU AMD EPYC Rome, dos ranuras x16 PCIe Gen4 y una OCPNIC v3.0 que admite tarjetas adicionales PCIe Gen 4 y hasta 8 DIMM. Con 3,43 pulgadas (alto) x 17,2 pulgadas (ancho) x 27,44 pulgadas (profundidad), el VSS2249P también está diseñado para encajar perfectamente en un rack estándar de 19 pulgadas y 1,0 metro, lo que permite implementarlo en un variedad de aplicaciones.

Cada nodo de nuestra configuración incluye una CPU AMD EPYC 7402P, que cuenta con 24 núcleos, un reloj base de 2,8 GHz (impulso máximo de 3,35 GHz), 48 subprocesos y 128 MB en caché L3. También está equipado con 64 GB de RAM DDR4 (8 x 8 GB) y un SSD de arranque M.2 de 250 GB.

El VSS2249P está diseñado como un sistema sin cables. Por ejemplo, el plano de la unidad proporciona conectividad para la alimentación, los datos y la gestión, así como las PSU. Los ventiladores del sistema también forman parte del ensamblaje del sled del servidor (conectados al plano de transmisión a través de la placa del ventilador) y reciben alimentación y control del plano de transmisión. Para facilitar el acceso, los ventiladores se extraen a través de la cubierta superior. Todos los SSD se conectan directamente al plano medio. Esto hace que el mantenimiento del VSS2249P sea perfecto, mientras que la falta de cables permite un mejor flujo de aire y, por lo tanto, nodos de servidor más fríos.

Si bien la mayoría de nosotros vemos el flash QLC como una alternativa de menor rendimiento a los SSD TLC, eso es solo mirar un lado de la ecuación. El rendimiento de escritura aleatoria de bloques más pequeños puede ser menor debido a decisiones arquitectónicas, como la dirección indirecta gruesa, pero el rendimiento de escrituras secuenciales y de escritura aleatoria de bloques grandes es muy competitivo y está muy cerca de los SSD TLC DC de nivel de entrada.

Con el flash basado en TLC en el mercado, las velocidades de escritura son más bajas, pero el rendimiento de lectura sigue siendo muy capaz, si no completamente competitivo. Nuestro enfoque en esta revisión fue aprovechar 24 SSD Solidigm P5316 de 30,72 TB dentro de un servidor de 2 nodos, mostrando hasta dónde podemos llevarlos con mucho cómputo detrás de ellos.

La última vez que analizamos un sistema similar de Viking Enterprise Solutions, estaba diseñado para compartir 24 SSD en dos nodos, y cada nodo tenía acceso de múltiples rutas a cada SSD. El VSS2249P usa nodos similares en el backend, aunque 12 SSD están conectados directamente a un nodo, y los 12 restantes al otro. Esto le da a cada SSD 4 canales completos de carriles PCIe Gen4 de regreso al nodo al que está conectado.

Instalamos Ubuntu 20.04 en cada servidor y aprovechamos FIO para saturar simultáneamente los 24 SSD Solidigm P5316. Cada SSD se llenó completamente con un llenado secuencial y luego se dividió para enfocar la huella de la carga de trabajo en el 5 % de la superficie de la unidad. Nos enfocamos en los tamaños de bloque optimizados para QLC, que se superponen con los medios flash tradicionales. La principal diferencia se reduce a minimizar la actividad de escritura de menos de 64 K, lo que fuerza un punto de dolor de escritura indirecta de la memoria flash QLC. Dicho esto, las cargas de trabajo que medimos fueron las siguientes:

En nuestra primera prueba con un tamaño de transferencia secuencial de 1 MB, medimos unos increíbles 175,5 GB/s de ancho de banda en 24 de los SSD P5316. Esto resultó en un poco más de 7,3 GB/s por SSD en la parte frontal. Con una carga de trabajo de escritura secuencial de 1 millón, esa cantidad se midió en 56,1 GB/s o 2,34 GB/s por SSD.

Al reducir el tamaño del bloque a una carga de trabajo de 64K, los SSD Solidigm P5316 ofrecieron 159 GB/s de ancho de banda o más de 6,62 GB/s por SSD. La carga de trabajo de escritura midió 57,7 GB/s o 2,40 GB/s por SSD.

Dado que no todas las cargas de trabajo son secuenciales, pasamos a un conjunto de trabajo aleatorio de 64K más exigente, lo que puso a las SSD QLC en una de sus situaciones más estresantes. El tráfico de lectura vio su ancho de banda más alto, con una increíble velocidad de 176,3 GB/s. Sin embargo, al cambiar de lectura a escritura, aquí es donde los SSD P5316 experimentaron la mayor tensión, midiendo 13,2 GB/s o 550 MB/s por unidad. Esto se alinea con las cifras de la hoja de especificaciones para esta carga de trabajo, pero muestra dónde llegan estos SSD a su límite.

Sabiendo que la lectura aleatoria de 64K ofrecía el mayor rendimiento de la unidad y la escritura el más bajo, observamos una combinación de cargas de trabajo mixtas para ver cómo varían estas unidades a medida que cambia el equilibrio de lectura/escritura. Con una carga de trabajo aleatoria de lectura de 64K del 70 %, el grupo de unidades midió 44 GB/s. Sin embargo, cuando ajustamos eso más al 90% de lectura, el ancho de banda se disparó a 130,7 GB/s. Esto impulsa aún más el punto en el que las SSD QLC implementadas en las situaciones adecuadas pueden ser unidades potentes, aunque no están diseñadas para reemplazar las SSD TLC en todas las situaciones.

Al finalizar las pruebas, observamos una prueba de rendimiento máximo que se centró en el rendimiento de lectura aleatoria de 4K. Se omitió la escritura de 4K ya que estas unidades usan una unidad de direccionamiento indirecto grueso de 64K y no proporcionarán el rendimiento más alto en 4K. En lectura aleatoria de 4K, medimos casi 87 GB/s de tráfico de 4K o 21,2 millones de IOPS. Esa es una estadística impresionante, que se alinea estrechamente con las ofertas de TLC SSD en el mercado.

Hemos trabajado mucho con las SSD QLC de Solidigm en el pasado, pero este es, con mucho, el trabajo más importante que hemos hecho hasta la fecha, con casi 750 TB de almacenamiento en un servidor de 2U. Queríamos ver cómo funcionan las unidades en una configuración en la que las aplicaciones como análisis e inferencia pueden aprovechar el diseño de la plataforma moderna. Si bien el sentimiento general hacia QLC es que solo son buenos para proyectos de valor o de archivo, eso no podría estar más lejos de la verdad.

En cuanto al rendimiento, podemos ver que las SSD P5316 en el servidor de almacenamiento VES VSS2249P pudieron publicar resultados sorprendentes. El rendimiento secuencial de bloques grandes satura el servidor, con cada SSD casi maximizando su bahía Gen4 U.2 en rendimiento de lectura. Medimos 175,5 GB/s en 1 M de lectura, lo que resultó en 7,3 GB/s por SSD.

El rendimiento de lectura aleatoria también fue excelente, con un máximo de 176,3 GB/s en un tamaño de bloque de 64K. Pero no se duerma con el rendimiento de escritura; las unidades funcionaron muy bien en grandes cargas de trabajo bloqueadas. La escritura secuencial de 64K midió 57,7 GB/s, mientras que la aleatoria de 64K se redujo a 13,2 GB/s. Las cargas de trabajo mixtas con un enfoque en la actividad de lectura funcionaron bastante bien, donde medimos 44 GB/s en 64K 70/30 y poco menos de 131 GB/s en 64K 90/10. Finalmente, para la lectura aleatoria de bloques pequeños, medimos unos asombrosos 86,9 GB/s o 21,2 millones de IOPS en nuestra carga de trabajo de 4K.

En el pasado, hemos trabajado con la versión HA de dos nodos de este Viking Enterprise Server aprovechando los SSD TLC de dos puertos. Si bien no son exactamente manzanas con manzanas, hay algunas líneas de tendencia interesantes que muestran que estos SSD QLC resisten muy bien frente a las soluciones TLC.

Ambos conjuntos de unidades pudieron manejar una inmensa cantidad de ancho de banda, con las SSD TLC midiendo 125 GB/s y las SSD Solidigm P5316 QLC midiendo 159 GB/s en lectura secuencial de 64K. El rendimiento de escritura también estuvo cerca, con los SSD TLC midiendo 63,2 GB/s en escritura secuencial de 64 K en comparación con los P5316 con 57,7 GB/s.

Estos datos no pretenden sugerir que QLC es un reemplazo completo para TLC en todas las aplicaciones, TLC aún tiene una gran ventaja a medida que aumenta el porcentaje de escritura y la necesidad de resistencia. Sin embargo, para muchos casos de uso, los SSD QLC están listos para su implementación y, a menudo, pueden ser más rápidos que los competidores de TLC, especialmente cuando la carga de trabajo no requiere mucha escritura.

Además, si necesita una combinación de capacidad y rendimiento, las SSD QLC DC ganarán sin duda, esta es una combinación única que QLC y, en el futuro, las SSD PLC están bien posicionadas para servir. Dado que publicamos más de 175 GB/s en este servidor de almacenamiento VES en casi 3/4 de PB de almacenamiento en 2U, la eficiencia del rack parece bastante convincente.

Servidor de almacenamiento VES

Productos Solidigm

Solidigm patrocina este informe. Todos los puntos de vista y opiniones expresados ​​en este informe se basan en nuestra visión imparcial de los productos bajo consideración.

Interactuar con StorageReview

Boletín | YouTube | Podcast iTunes/Spotify | Instagram | Gorjeo | facebook | RSS Feed

Brian se encuentra en Cincinnati, Ohio y es el analista jefe y presidente de StorageReview.com.

Interactuar con StorageReview