Unifabrix désagrège la RAM pour doper les serveurs
Pionnier du Memory as a Service, Unifabrix s'appuie sur la norme d'interconnexion CXL (Compute Express Link) pour désagréger la gestion de la mémoire (DDR et Nand flash) dans les serveurs équipés des dernières puces d'Intel (Xeon Sapphire Rapids) et AMD (Epyc Genoa), avec sa baie Memory Smart Module.
Avec la multiplication du nombre de coeurs dans les processeurs pour serveur (jusqu'à 60 avec les derniers Intel Xeon Sapphire Rapids et même 96 ou 128 avec les AMD Epyc Genoa), la quantité de mémoire vive disponible pour alimenter les charges de travail gourmandes en calcul, les machines virtuelles, le VDI, les containers et les instances devient problématique dans les datacenters. Chargé à bloc, un Dell PowerEdge R760 avec une puce Xeon Platinium 8468 (56 coeurs) plafonne à 4 To de Ram (16 Dimm par processeur) en mono-socket et 8 To en bi-socket pour un tarif avoisinant les 300 à 600 000 € pour la seule partie mémoire vive. Si plusieurs start-ups sont sur les rangs pour répondre à ce problème avec une approche désagrégée exploitant l'interface CXL (Compute Express Link) pour gérer un pool mémoire partagé (jusqu'à 32 To) avec une faible latence, Unifabrix semble avoir pris une bonne longueur d'avance sur ses principaux concurrents, à savoir Liqid, Enfabrica ou encore GigaIO, avec son Smart Memory Node.
Plusieurs types de mémoire sont combinés dans le châssis Smart Memory Node : DDR et EDSFF (mémoire vive et Nand flash). (Crédit S.L.)
Fondé en 2020 à Haïfa - la Silicon Valley israélienne - par deux anciens du datacenter group d'Intel à l'origine de l'architecture IPU, Ronen Hyatt (CEO), Danny Volkind (CTO) - épaulés par Micha Risling (CBO) pour la partie marketing - Unifabrix s'annonce déjà comme une start-up disruptive. « L'un des grands problèmes aujourd'hui dans les datacenters est la mémoire locale, DRAM ou quel que soit le nom qu'on lui donne. La bande passante de la DRAM pose également de nombreux problèmes. La performance et la quantité de mémoire disponible sont insuffisants pour de nombreuses applications, en particulier le domaine du HPC (High Performance Computing) [...] Aujourd'hui, nous parlons de dizaines, voire de centaines de gigaoctets sur un socket serveur. Et apparemment, cela ne suffit pas car les applications font de plus en plus de choses », nous a expliqué Ronen Hyatt, lors d'un point presse organisé dans le cadre d'un IT Press Tour en Israël.
CTO d'Unifabrix, Danny Volkind a longtemps travaillé chez Intel sur l'architecture des puces Xeon. (Crédit S.L.)
Mieux répartir la mémoire entre les serveurs
Comme indiqué un peu plus haut, la DRAM est la partie la plus chère d'un serveur. Elle représente près de 50% du coût global. « Beaucoup de gens l'ignorent, mais la DRAM est aussi un facteur important de consommation d'énergie. Plus que l'unité centrale. Elle est de plus très mal utilisée. Si vous regardez les chiffres cités par les hyperscalers, Microsoft a dit que 25% de la mémoire des centres de données est bloquée. Cela signifie que des dizaines de milliards de dollars sont gaspillés chaque année pour acheter de la mémoire pour les infrastructures sans pouvoir l'utiliser, et une partie de la raison est due à la fragmentation. Jusqu'à récemment, il n'y avait pas de moyen plausible d'utiliser de la mémoire autre que celle attachée au processeur », nous a indiqué le CEO. Pour répondre à cette problématique, Unifabrix a donc développé dans son carré un switch fabric - reposant sur CXL 3.0 - capable de piloter un pool mémoire, tout en restant dans les standards du protocole. « Le standard CXL 3.0 Fabric est disponible depuis novembre dernier, et nous avons montré que nous étions les premiers à l'exploiter et nous sommes toujours les seuls », a précisé le CEO.
Unifabrix propose mixer DDR et flash poru répondre à des besoins comme les bases de données in-memory ou le calcul intensif. (Crédit S.L.)
Pour la partie contrôleur, la start-up exploite un FPGA Agilex fourni par Intel avec une partie logicielle customisée. Ce composant clef est au coeur du Smart Memory Node d'Unifabrix, qui peut accueillir jusqu'à 32 To de DRAM (DDR5 et DDR4), au standard Dimm, mais également des cartes mémoire au format, ainsi que des SSD NVMe EDSFF. Une exploitation de la mémoire HBM est également envisageable si besoin. « Le CXL vient décupler les possibilités d'exploiter les différents types de mémoire avec un serveur », nous a indiqué Danny Volkind, le CTO d'Unifabrix. De 10 à 20 serveurs peuvent se connecter à la baie mémoire de la jeune pousse, et il est même possible de cascader la box avec un switch fabric en faisant toutefois attention à la latence, a poursuivi le CTO. Le Smart Memory Module est équipé de deux liens 400G et de 10 ports EDFFS avec 16 lignes PCI exploitables par connecteur (ou 8 lignes avec 20 serveurs). La magie de la solution d'Unifabrix réside dans le fait qu'il est possible d'alimenter et de déprovisionner en mémoire un pool de serveurs - bare-metal ou avec hyperviseur - sans passer par la case redémarrage. Si un serveur a besoin de plus de RAM, il peut la trouver dans le module de mémoire CXL du châssis d'Unifabrix. Les performances sont légèrement inférieures et il y a un peu plus de latence, mais en contrepartie, il fournit plus de mémoire dans un serveur sans avoir à l'installer de manière exclusive. Évidemment, il est nécessaire d'acquérir la baie Memory Smart Module, dont le prix n'a pas encore totalement fixé par Unifabrix. Ce dernier commercialisera d'ailleurs son châssis sans barrettes Dimm ou cartes EDFSS afin de ne pas immobiliser inutilement son capital de départ dans des stocks de RAM ou de NAND flash. Précisons au passage que la jeune pousse est en partie financée par le fonds d'investissement israélien Grove Ventures Herel pour un montant non précisé.
Unifabrix propose de cascader ses baies Smart Memory Node pour accroitre les combinaisons mémoire. (Crédit S.L.)
Concentration sur le marché HPC
Sur le plan commercial, la start-up cible les marchés du HPC, des hyperscalers et des datacenters, avec pour démarrer un focus sur le premier segment. « Nous vendons déjà à des acteurs du monde HPC et à des hyperscalers, mais pas seulement. Des discussions sont en cours pour proposer notre solution en mode OEM », nous a indiqué le CEO. On pense immédiatement à Dell, HPE ou Lenovo qui sauront immédiatement comment exploiter au mieux cette technologie avec leurs grappes de serveurs. Le marché du HPC semble toutefois plus facile à adresser avec des acteurs capables d'adopter une technologie innovante pour mieux servir les charges de travail nécessitant du calcul intensif. Si aujourd'hui, Unifabrix commence avec un pool mémoire, la même technologie est facilement adaptable à d'autres besoins comme des grappes de GPU ou de DPU pour alimenter des cascades de serveurs. Mais, la jeune pousse entend d'abord s'imposer sur le marché de la mémoire, avant d'attaquer d'autres secteurs.