山东智算领域取得新突破,推动国产芯片训练效率提升

74

在当今快速发展的科技时代,人工智能(AI)和大数据处理能力已成为衡量一个地区乃至国家科技水平的重要指标。2025年2月16日,山东移动携手产业合作伙伴,在智算领域取得了重要进展,发布了两项关键性成果——智算“芯合”异构混训系统1.0和算力原生基础软件栈2.0,这标志着山东省在构建自主可控的智能计算生态系统方面迈出了坚实的一步。

异构混训系统助力大模型训练

众所周知,大型AI模型的训练需要巨大的计算资源支持,而不同类型的智算芯片难以聚合成有效的资源集群,这对跨厂商、跨架构的大规模模型训练提出了挑战。面对这一难题,山东移动与中移齐鲁创新院合作研发了智算“芯合”异构混训系统1.0。该系统通过自主研发实现了3D并行非均匀切分功能,能够支持流水线并行、数据并行等多种主流并行模式的混合训练。基于此系统,即使是百亿级别的大模型也能够在英伟达、天数智芯、壁仞、海光等多家智算芯片上进行高效训练,且训练加速比达到了95%以上,大幅降低了训练成本,并提高了国产芯片的训练效率。

算力原生基础软件栈促进应用迁移

随着多样化异构智算芯片的不断涌现,如何让上层AI应用灵活地在不同的智算芯片间迁移成为了新的课题。为此,中国移动联合业界推出了算力原生技术,旨在实现AI应用的跨架构运行,从而解除AI应用与特定智算芯片之间的绑定关系。在此背景下,智算“芯合”算力原生基础软件栈2.0应运而生。这款软件栈不仅优化了高性能计算库,使得其性能接近国际领先水平,而且实现了泛AI应用在六家不同智算芯片间的高效流转迁移,转换效率超过95%,为行业客户提供了一站式的解决方案。

科技创新驱动产业升级

除了上述两项重要成果外,山东省还制定了《山东省新一代信息技术创新能力提升行动计划(2023-2025年)》,旨在全面提升本省的信息技术自主创新能力,打造高质量发展的新引擎。计划明确指出,到2025年,山东省将在信息安全、元宇宙等领域达到国际先进水平;同时,将建立国家级创新平台10家左右,省级创新平台200家左右,形成万家以上的信息领域科技型企业群体,引领带动千亿级创新型产业集群的发展。

总结点评

此次山东移动发布的智算“芯合”系列成果不仅是对当前市场需求的有效回应,也是对未来智能计算发展趋势的积极探索。它展示了山东省在技术创新方面的决心与实力,特别是在推进国产化进程中所作出的努力值得肯定。然而,尽管取得了显著成就,但面对全球范围内激烈的竞争态势,山东省仍需持续加大研发投入,深化产学研合作,进一步完善产业链条,以确保在全球智能化浪潮中占据有利位置。总之,山东的这些努力无疑为其在未来的科技版图上描绘了一幅充满希望的蓝图。

也许您对下面的内容还感兴趣:

暂无相关推荐!