思想+技术沙龙:高效存储架构与服务器变革实践
近日,以“高效存储架构与服务器变革实践”为主题的思想+技术沙龙在北京举行,来自清华大学、快手、美团、金山、磐吉云数、浪潮信息等高校、知名企业、研究机构的产学研专家、互联网行业大咖再度聚首,基于服务器硬件和存储软件平台两个维度,探讨解决企业存储引擎关键痛点的硬件规划路径,从而找到适用于存储业务不同发展阶段,并匹配“安全”“性能”“降本”诉求的基础设施选型方向。
浪潮信息互联网行业部产品总监王帅在《云存储驱动下的服务器创新实践》主题演讲中表示,过去10年间,高密存储机型规划主要围绕提升存储密度、降低存储功耗两个关键要素,将单盘容量和单机密度提升作为硬件规划的主要方向。从2020年开始,高密存储机型迭代速度放缓,单纯的容量或密度提升已不再是企业用户核心诉求,预计在未来3年,当前最具代表性的4U60盘高密存储服务器仍将是高密存储最主流的产品形态。而存储介质和网络带宽的持续优化将更加受到关注,同时考虑用户对业务高效匹配、成本极致优化、存储IO性能提升、集群稳定可靠、运维简便部署的五大基础诉求,浪潮信息未来也将持续为用户打造满足互联网行业业务需求的产品。
清华大学副教授陆游游做了《SuperFS: 高速硬件时代的文件系统》主题演讲,分享了清华大学计算机系存储实验室围绕计算领域所做的新一代存储系统探索。他表示,随着超级计算步入千万核时代,存储成为影响计算性能发挥的重要瓶颈,存在存储架构繁冗、元数据管理低效、I/O干扰严重、软件开销大四个关键问题。清华大学通过打造SuperFS高性能文件系统,在数据部分通过数据直通等技术,用5台存储节点达到了179.6GB/s,带宽性能达到硬件理论性能的90%以上。在元数据部分,通过低开销索引等技术大幅度降低了软件依赖开销,元数据性能远超其他存储系统。
某互联网公司大数据存储负责人贾宇晗在《高效分布式存储架构优化与基础设施选型实践》主题演讲中分享了内部搭建的云存储平台,借助超低延迟RDMA网络、用户态NVMe、SPDK全新存储架构,提供高性能、低成本、高可用、安全可靠的一体化存储方案,支持容器CSI、虚拟化、AI大模型、大数据存储,助力客户业务全面上云。 此外,通过资源整合、分布式缓存、数据治理优化存储架构,实现硬件成本、服务成本和业务成本的降低。同时,也指出了未来存储软件的发展趋势:一是从私有化部署转向云原生;二是由独立存储向统一存储发展,包括统一存储底座和接入层的统一;三是通过生命周期、数据血缘、数据分层、服务管控、行为审计等诸多产品形态的完善让管理者更了解服务和业务,让使用者更了解数据。
随着AIGC驱动与数据中心级应用对存储IO性能要求的提升,全闪分布式存储与NVME存储介质迎来了高速增长。浪潮信息的《面向AIGC的分布式融合全闪存储》主题演讲中,分布式存储产品线总经理姜乐果指出:面向大模型训练需要有领先的算法和优质的算力,同时高质量的数据也是支撑大模型训练的关键要素之一。浪潮信息提供了基于AS13000G7的AIGC存储解决方案,更成熟、更简约、更高效,是助力大模型训练落地的坚实存储底座。目前已完成国内数十个大模型客户交付,数据处理时间节省30%,整体性能提升160%,运维效率提升50%。
浪潮信息SSD产品线总经理王杰华分享了《浪潮信息企业级SSD技术发展与应用实践》,指出:存储整体呈现出高性能的技术要求,QLC NAND关键技术成熟,读性能接近TLC,延迟达到100μs,性价比优势凸显,伴随NAND成本的优化,未来有机会在读IO密集的场景实现对HDD的替换。此外,浪潮信息积极围绕应用感知开发定制化特性产品,已经完成ZNS的产品化和Multi-Stream的技术开发。在云存储场景,ZNS SSD表现出三倍于传统NVMe SSD的写入带宽性能;Multi-stream多流应用,在部分场景下收益达到37%-73%。
除以上主题分享之外,OCP中国社区负责人、浪潮信息首席架构师叶毓睿主持并邀请了清华大学、磐吉云数、浪潮信息等多位嘉宾参与了以《生成式AI对存储系统的挑战与机遇》为主题的圆桌对话,讨论了大模型、AIGC与RAG应用等对存储系统的需求,以及技术和应用演进带给存储架构的冲击。
数据是支撑计算的重要基石,是千亿级模型精度优化的保障。浪潮信息将继续携手互联网用户,发挥JDM优势,基于业务应用对存储底座的需求特点,从存储服务器硬件、存储软件和存储介质三个维度,持续打造高收益、高可用的软硬件产品。(科轩)