热搜:
太平洋建设领导同广东韶关乐昌市委副书记、市长会谈端午泉州非遗两登央视《新闻联播》上半年全国城镇新增就业695万人,下一步从五方面稳就业

快捷

logo

娱乐

(电子发烧友网报道 文/章鹰)8月12日,破解在2025金融AI推理应用落地与发展论坛上,赖A理黑华为公司副总裁、科技开源数据存储产品线总裁周越峰宣布,线月华为此次和银联联合创新,正式推出AI推理创新技术UCM(推理记忆数据管理其器)和管理系统的破解算法,这项突破性成果降低对HBM技术的赖A理黑依赖,提升国内AI大模型的科技开源推理能力。


该技术是线月一款以KV Cache为中心的推理加速套件,UCM集成了多类型缓存加速算法工具,正式实现推理过程中KV Cache记忆数据的破解分级管理,从而扩大推理上下文窗口,赖A理黑提升推理效率。科技开源“银联的线月实际案例和大量测试显示,UCM显著降低首Token的正式时延,最高降低90%,系统吞吐率最大提升22倍,上下文的推理窗口可以扩展10倍以上,这是对于AI推理系统一个巨大的进步。” 周越峰指出。

华为UCM技术已率先应用在中国银联“客户之声”、“营销策划”和“办公助手”三大业务场景,开展智慧金融AI推理加速应用试点,并且已经取得成果。华为表示,计划于2025年9月正式开源UCM,将在魔擎社区首发,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。

AI大模型推理给存储带来哪些挑战?UCM的创新之处如何解读?本文结合中国信通院人工智能研究平台与工程化部主任曹峰、华为数据存储产品线AI存储首席架构师李国杰的观点,进行详细分析。

AI大模型推理给存储带来三重挑战

“ChatGPT的访问量呈现线性增长,最新访问量达到4亿,受益于中国AI大模型DeepSeek爆发,日均调用量也在快速上升,2025年1月开始,中国AI推理的需求增长20倍,未来三年算力需求爆发。IDC表示,2024年算力需求60%是训练,40%是推理,到2027年中国用于推理的算力需求——工作负载将达到72.6%。” 中国信通院人工智能研究平台与工程化部主任曹峰分析说。

当下,AI大模型推理应用落地中,遇到推不动、推得慢和推得贵的三大挑战。首先,长文本越来越多,输入超过模型上下文窗口的内容,推理窗口小就推不动;其次,由于中美在AI基础设施的差距,中国互联网大模型首Token时延普遍慢于美国头部厂商的首Token时延,时延长度为后者的两倍;推得贵,美国大模型的推理吞吐率为中国大模型推理吞吐率的10倍。

华为公司副总裁、数据存储产品线总裁周越峰指出,AI时代,模型训练、推理效率与体验的量纲都以Token数为表征,Token经济已经到来。

在AI基础设施投资,中国和美国有差距,为了保障流畅的推理体验,企业要加大算力投入,但是如何改善AI推理的效率和体验,在推理效率与成本之间找到最佳平衡点?华为推出UCM,以KV Cache和记忆管理为中心提供全场景化系列化推理加速能力。

UCM两大关键能力和创新算法,破解HBM受困难题

HBM是解决"数据搬运"的关键技术。当HBM不足时,用户使用AI推理的体验会明显下降,导致出现任务卡顿、响应慢等问题。华为此次技术突破有望缓解这一瓶颈。

华为重磅推出UCM推理记忆数据管理器,包括对接不同引擎与算力的推理引擎插件(Connector)、支持多级KV Cache管理及加速算法的功能库(Accelerator)、高性能KV Cache存取适配器(Adapter)三大组件,通过推理框架、算力、存储三层协同,实现AI推理“更优体验、更低成本”。

UCM的创新之处,在于可以根据记忆热度在HBM、DRAM、SSD等存储介质中实现按需流动,同时融合多种稀疏注意力算法实现存算深度协同,使长序列场景下TPS(每秒处理token数)提升2至22倍,从而降低每个Token的推理成本。

“实时数据放在HBM当中,短期记忆数据放在DRAM中,其他数据就放在共享存储SSD中,极大提高系统的效率和AI推理能力。针对AI推理平衡成本和效能的挑战,华为推出UCM统一的记忆数据管理器,在两个层面以系统化的方案来解决问题。” 华为数据存储产品线AI存储首席架构师李国杰表示。

一、在底层的框架和机制上提供了多级缓存空间,构建智能管理以及智能流动的基础框架能力。在此基础之上,华为构筑了一系列创新的推理的加速算法和加速特性,包括自适应的全局Prefix Cache,降低首Token时延与单位Token成本。

二、采用动态的Training稀疏加速算法,倍数级提升长序列吞吐和体验。还有后缀检索、预测加速算法、PD检索加速和Agent原生记忆加速。

UCM将超长序列Cache分层卸载至外置专业存储,通过算法创新突破模型和资源限制,实现推理上下文窗口的10倍级扩展,满足长文本处理需求。

中国银联执行副总裁涂晓军分享说,华为与中国银联的联合创新技术试点中,在中国银联的“客户之声”业务场景下,借助UCM技术及工程化手段,大模型推理速度提升125倍,仅需10秒就可以精准识别客户高频问题,促进服务质量提升。

众所周知,目前,AI大模型训练对内存带宽需求呈指数级增长,传统DDR内存已无法满足需求。HBM(高带宽内存)是一种专用内存技术,用于 AI 处理器GPU和 HPC 系统,这些系统中带宽和能效比原始容量更为重要。HBM3 每堆栈可提供高达 819 GB/s 的传输速度,对于支持大型语言模型 (LLM)、神经网络训练和推理工作负载至关重要。

但是去年12月以来美国将HBM2E列入对中国的禁售清单,国产厂商HBM的突破还在推进中,华为推出UCM的重大意义,在于加速推进国产AI推理生态,其核心价值是推进更快的推理响应和更长的推理序列,以及更优化的成本。

中国信通院人工智能研究平台与工程化部主任曹峰认为,国产化AI推理生态建设应该加速,KV Cache已经成为架构优化的焦点,以KV Cache为核心的推理方案迭出,背后依赖的高性能存储、先进调度策略的重要性愈发显现。

李国杰还强调指出,AI是一个快速发展的行业,每6个月就会迎来新一轮的技术革新,UCM不仅定位于当下,解决AI推理问题,未来发展UCM将从KV Cache分层管理走向Agentic AI原生记忆管理和应用加速。

本文由电子发烧友原创,转载请注明以上来源。微信号zy1052625525。需入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱zhangying@huaqiu.com。

相关阅读

海外收藏我国古典红木家具的两次热潮-

2025-08-27
近年来,我国古典红木家具逐渐受到越来越多的人的喜爱,很多人开始收藏古典红木家具,但有很多古典家具流失到海外,收藏古典红木家具的外国人同样很多。 中国古典家具收藏热的两次高潮,第一次在上世纪30年代。

2023年泉州城乡医保参保缴费下月启动

2025-08-27
日前,记者从市医保局获悉,从下月起,泉州市将启动2023年城乡居民基本医保参保缴费工作,集中参保缴费时间为2022年9月1日至12月31日。在集中参保缴费期内未缴费的参保人员可在2023年1月1日至1

以品质立标杆 彪象板材登榜2025金匠榜家具板十大品牌

2025-08-27
以品质立标杆 彪象板材登榜2025金匠榜家具板十大品牌责编:小乙 时间:2025-07-11 热度:42750

商汤医疗携手新加坡IHH医疗集团助力疾病早筛

2025-08-27
在全球医疗科技不断融合发展的背景下,中国智慧医疗正在迈出坚实步伐。国家发展改革委主任郑栅洁在2025世界人工智能大会开幕式上发布了《中国智·惠世界2025)》案例集,展现中国AI技术在全球合作中的多元

喷漆骚扰堵锁跟踪恐吓 软暴力讨债该当何罪?

2025-08-27
海峡网讯 据海峡导报报道 喷漆、骚扰、堵锁、跟踪、恐吓、蹲守……他们以催债为名,实施“软暴力”,结伙任意毁损、占有他人财物,该当何罪?近日,湖里法院

上合组织政党论坛 嘉宾盛赞新疆魅力与热情

2025-08-27
2025年4月23日,上海合作组织政党论坛在乌鲁木齐市开幕。与会嘉宾在新疆,亲身感受这片土地的蓬勃生机、先进的基础设施,更被新疆人民的热情好客所打动。记者 买合木提江·吾甫尔吕伊晗外文校审 成立 侯伟

泉州新增43家零售药店纳入医保定点管理

2025-08-27
为持续提升医保服务可及性与便利性,泉州近期将43家零售药店纳入医保定点管理。此次新增的定点零售药店进一步填补了偏远乡镇农村等定点空白区域,满足偏远地区人群的购药需求,为泉州市民多渠道购药搭建起一张布局

泉州多地下暴雨 高温暂缓解 未来两天午后多雷阵雨

2025-08-27
昨日,全市气温有所降低,记者查询知天气App发现,最高温南安东田镇仅为35.9℃。昨日下午,泉州市不少地方经历了短时强天气过程,南安发布暴雨红色预警信号,安溪、德化发布暴雨黄色预警信号,安溪、永春、德

战略引领 合作共赢

2025-08-27
9月16日,中建八局与东方雨虹战略合作签约仪式在沪举行。中建八局采购管理部总经理许温锋、采购管理部副总经理周森伟,东方雨虹控股董事副总裁李建华、东方雨虹控股中建八局事业部总经理王国朝、东方雨虹控股上海

全国青少年信息学奥林匹克竞赛泉州学子获嘉奖

2025-08-27
近日,由中国计算机学会CCF)主办,华东师范大学第二附属中学承办的第39届全国青少年信息学奥林匹克竞赛NOI 2022)举行,福建代表队获得了1金8银2铜的好成绩,其中泉州学子勇摘1枚铜牌,这枚奖牌的

新的艺术品市场政策已经出台!民藏有希望了! 收藏资讯

2025-08-27
一、央 行:支持合规反对垄断,坚决打击各种逃废债行为!据央 行官微信息显示:央行党委于近日召开扩大会议,针对明年经济工作的总体要求、政策取向和重点任务,对后续政策框架、信贷投放、金融科技、债券市场、金

泉州雨水天气将持续至今日上午 注意防潮除湿

2025-08-27
27日,泉州市气象台发布“暴雨预警Ⅳ级”。昨日市区多个时间段都有降水。记者从市气象台了解到,昨日泉州大部分地区都有雨水影响,雨水天气将持续至今日上午。据市气象台分析,昨日,泉州

家具异味严重 高盛家居承诺更换品牌又反悔

2025-08-27
9月28日,本版报道“我爱我家”品牌儿童家具放置一年还有刺鼻气味一事。日前,商家高盛家居与顾客王先生进行了数次沟通,但商家关于为其更换其他品牌儿童家具的承诺并未兑现,而是将其中

泉州打造绿色金融服务新模式支持经营主体绿色发展

2025-08-27
为助力实现“碳达峰、碳中和”目标,推动经济社会和生态环境全面协调可持续发展,日前,市生态环境局、福建省农村信用社联合社泉州办事处建立沟通机制,共同打造绿色金融服务新模式,支持经

泉州雨水天气将持续至今日上午 注意防潮除湿

2025-08-27
27日,泉州市气象台发布“暴雨预警Ⅳ级”。昨日市区多个时间段都有降水。记者从市气象台了解到,昨日泉州大部分地区都有雨水影响,雨水天气将持续至今日上午。据市气象台分析,昨日,泉州

夏天甲醛暴增5倍?选对板材,家人呼吸才安全!

2025-08-27
夏天甲醛暴增5倍?选对板材,家人呼吸才安全!责编:小乙 时间:2025-07-15 热度:23619

诺瓦拉VS国际米兰:贝尔贡齐执法

2025-08-27
9月19日米兰消息:来自热那亚协会的毛罗·贝尔贡齐被指派为2011-12赛季意甲第4轮国际米兰客场与诺瓦拉比赛的主裁判。比赛将于北京时间9月21日02:45在诺瓦拉的西尔维奥·皮奥拉球场举行。贝尔贡齐

Farfetch三位前高管遭高等法院起诉

2025-08-27
近日,Farfetch的三位前高管——创始人José Neves、前总裁Stephanie Phair和前CFO Elliot Jordan,因被指控“严重管理不善”而被诉至高等法院。此消息一出,迅速

保姆偷雇主小孩26年后还回 亲妈:她是甩包袱

2025-08-27
保姆偷雇主小孩26年后还回 亲妈:她是甩包袱发布时间:2018-08-06 10:50 来源:豫都网 我要投稿[摘要]何小平穿着一件款式土气的貂毛外套,从远处走过来,朱晓娟一眼就认出她,还是一米五几的

cs里也有奇犽? 国外博主自制“电流刺激”生物外挂实现“自动扳机”

2025-08-27
海外YouTube博主"Basically Homeless"近日研发了一套神经肌肉辅助系统,通过电击刺激手臂肌肉显著提升游戏反应速度。该系统的核心是一个能实时识别《CS2》敌人的计算机视觉程序。当检
小编推荐
猜你喜欢
如果觉得快捷不错,还请把快捷分享到你的微信好友、朋友圈、微博等,万分叩谢
「**」百世一人网为你提供,,,,等 http://m.ehjpactually.xyz/
点我复制链接

俺也是有底线滴

© 2023 百世一人网 版权所有
为你提供,,,,等 http://m.ehjpactually.xyz/