华为将于8月12日在2025金融AI推理应用落地与发展论坛上,发布AI推理领域的突破性技术成果。这项成果或能降低中国AI推理对HBM(高带宽内存)技术的依赖,提升国内AI大模型推理性能,完善中国AI推理生态的关键部分。
消息面上,华为在AI推理技术上的探索早已有之。今年3月,北京大学携手华为推出了DeepSeek全栈开源推理方案。该方案融合了北京大学自研的SCoW算力平台系统与鹤思调度系统,并整合了DeepSeek、 openEuler、MindSpore及vLLM/RAY等开源组件,实现了在华为昇腾平台上的高效推理。这一合作成果不仅展示了华为在AI推理领域的深厚积累,也标志着国产算力在AI应用上的重要突破。
长城证券表示,从国内大模型的进展来看,一方面,伴随国内外大模型的持续升级,AI推理能力要求更高,对算力的需求也在持续增加;另一方面,芯片的性能不断提升也同时促进大模型等在AI产业持续取得突破。同时,随着AI模型仿真活人的能力持续提升,助力更多 Al+应用商业场景落地,基于AI的数字互动有望成为下一个互联网和游戏产业的热门赛道,算力各环节有望进一步发展。
相关研究机构表示,AI大模型训练对内存带宽需求呈指数级增长,传统DDR内存已无法满足需求。 HBM(高带宽内存)通过3D堆叠技术将DRAM芯片垂直堆叠,最新的HBM3E可实现高达819GB/s的带宽,较DDR5提升5倍以上。在AI服务器中,HBM的成本占比约为20%至30%,仅次于用于计算的AI芯片。
宏赢策略-宏赢策略官网-配资平台哪家正规-可靠股票配资提示:文章来自网络,不代表本站观点。