 | | 0 |
| SK海力士 |
内存巨头SK海力士(SK hynix)今日宣布,已正式开始量产全球首款专为英伟达(NVIDIA)下一代 AI 服务器平台“Vera Rubin”优化的 192GB SOCAMM2 内存产品。
这款 SOCAMM2(Server On Board Compression Attached Memory Module)采用了业界领先的 1c 纳米(10纳米级第6代)工艺。它通过将原本用于智能手机等移动设备的低功耗内存技术引入服务器环境,打破了现有服务器内存的性能瓶颈。
在当前的 AI 数据中心架构中,内存一直面临“两难”境地:HBM(高带宽内存)虽然速度极快,但面临成本高、功耗大和散热难的挑战;传统的服务器 DRAM 虽然容量大,但在传输速度和能效比上已逐渐跟不上 AI 计算的需求。
SOCAMM2 的出现恰好填补了这一市场空白。基于 LPDDR5X 技术,这款 192GB 模块在性能上实现了质的飞跃:
性能翻倍: 相比传统服务器 DRAM 模块,带宽提升了 2 倍以上。
节能典范: 能效比大幅改善超过 75%,有效降低了数据中心的电力成本和冷却压力。
极致工艺: 1c 纳米工艺使其在相同芯片面积下集成了更多 D-RAM 单元,在提升容量的同时进一步压缩了能效损耗。
SK 海力士特别强调,该产品是专门针对英伟达的 Vera Rubin 平台进行的优化设计。在 Vera Rubin 架构中,GPU 端的高带宽内存(HBM4)与 CPU 端的系统内存通过 NVLink-C2C 互联技术实现深度融合。
这意味着 SOCAMM2 将作为超大容量的系统内存,与 HBM4 协同工作。当 GPU 的 HBM4 满载时,任务可以无缝流转至 SOCAMM2 处理。这种设计能显著缓解在长文本推理(Long Context Inference)或多模型并行运行时的“内存瓶颈”现象,大幅提升 AI 系统的整体吞吐速度。
随着 AI 市场从模型预训练(Learning)向应用推理(Inference)转型,如何在保持低功耗的同时高效运行大语言模型(LLM)已成为行业焦点。
SK 海力士 AI 基础设施社长(CMO)金柱善表示:“192GB SOCAMM2 的供应树立了 AI 内存性能的新标杆。我们将通过与全球 AI 头部客户的深度合作,稳固公司作为‘最受信任的 AI 内存解决方案提供商’的地位。”
目前,SK 海力士已针对全球云服务商(CSP)的需求完成了量产体系的早期稳定化,预计将迅速导入全球顶尖数据中心的供应链。