IM体育官方网站 华为云推出柔性智算FlexNPU,打造弹性伸缩“算力金箍棒”


发布日期:2026-03-24 12:17    点击次数:80

IM体育官方网站 华为云推出柔性智算FlexNPU,打造弹性伸缩“算力金箍棒”

【大众网科技详尽报谈】3月20日,华为云中小企业AI处理决策发布会上推出了一项算力黑科技——柔性智算操作系统FlexNPU,将Token破坏“吞金兽”有用终结在企业预算规模内,打造面向Agentic期间的极致Token性价比,为企业级智能体的普及冲破算力瓶颈。

华为云中国区销售伙伴发展部部长、华为云中国区Marketing与处理决策销售部部长郭婷在致辞中暗意,2026年华为云将构建AI期间愈加富饶的“黑地皮”,让算力办事更柔性、更适配中小企业的轻量化需求,兑现从“调理靠拍板”到“资本算到精”的转动,处理“用不起、用不好”算力的中枢贫乏。

企业AI应用近况:一半是海水,一半是火焰

当下,“养龙虾”成为全民热门话题,为千行万业尤其是中小企业提供了诞生智能化使命经过的昭彰想路。会上,华为云SMB处理决策与抓续运营部部长刘杰用“一半是海水,一半是火焰”生动刻画了现时企业智能化转型的近况:以OpenClaw为代表的先进坐蓐力用具盈篇满籍,但AI骨子应用时常靠近着资本峻岭、技巧壁垒、场景错位等挑战。

对此,华为云发布中小企业AI处理决策,涵盖AI基础尺度层、模子办事层、智能体平台层、智能体应用层,匡助企业打造能对接ERP、能调用API、能闭环业务经过的“数字职工”。现时,华为云已长远2600多家企业、30多个行业,处理500多个AI场景化问题,成为企业AI改革路上的可靠伙伴。

刘杰先容,在AI基础尺度层,华为云提供昇腾多代系产物,以及自研的AI Infra OS,尤其是FlexNPU柔性智算技巧,一方面兴奋中小企业小模子践诺场景,另一方面通过弹性调理好像大幅晋升资源运用率;在模子办事层,华为云支抓业界主流开源模子,让企业既能字据业务需求天真聘任,也能勾通自稀有据低资本微调专属模子;在智能体平台层,华为云提供易用高效的Agent开采环境,助力开采者和中小企业面向行业勾通场景打造企业级智能体;在智能体应用层,华为云相聚伙伴长远场景,隐敝知悉分析、营销运营、协同办公、开采运维、内容制作等高频需求。

刘杰还暗意,华为云勤恳于提供AI处理决策,作念好基础尺度和平台底座,伙伴则提供AI行业处理决策、AI行业场景应用、AI专科办事委用,兑现深度共创。会上,华为云发布“加快智能化 企业快成长算作2026”,为中小企业、开采者提供从品牌、生意、技巧等全方向的支抓,共赢AI阛阓,共同加快企业智能升级。

打造算力“金箍棒”,大幅训斥算力资本

“咱们的推理池平均运用率居然不及30%,咱们破耗重金诞生、动辄数万、数十万卡的AI硬件算力池,竟有超过一半以上的算力在‘摸鱼,吃空饷’。”华为云首席架构师、华为公司Fellow顾炯炯在现场抛出了一组惊东谈主数据。他指出,Agent期间企业普遍靠近算力痛点:Agent自主蓄意、多轮迭代、长盘曲文导致Token破坏量呈指数级增长,奈何有用训斥Token资本,成为最中枢和紧要的挑战。

为此,华为云发布了黑科技——柔性智算FlexNPU,通过构筑矍铄而天果真AI Infra层算力调理技巧,大幅晋升推理池的有用算力运用率,IM体育从而以疏导AI硬件算力干涉,提供更大的Token混沌输出。

关于柔性智算FlexNPU,顾炯炯以可大可小、变化粗疏的“如意金箍棒”生动刻画,暗意FlexNPU赋予NPU/GPU算力“柔性或液态化”供继承伸缩的材干,可依据纵脱业务需求动态变化随需而动,如同金箍棒一般“可大可小、变化粗疏”,通过最大化AI算力干涉的运用率,最终兑现Token性价比的最优化。

具体而言,柔性智算FlexNPU具备极致分享、极致弹性和极致高可用3大属性:

大模子推理方面,FlexNPU通过引入基于柔性算力的PD动态混部、在离线推理混部等改革技巧,完满处理了传统PD诀别架构下Prefill和Decode集群不平衡的AI Core与显存运用率,以及推理业务潮汐变化律例所导致的多半AI算力空转破坏贫乏,将带来至少40%的Token性价比晋升起间

小模子推理方面,FlexNPU通过兑现最小粒度达1% NPU卡及128MB显存的颗粒度的AI Core时刻复用,以及显存空分复用,为小模子提供实在完满匹配其算力诉求、量文体衣的捏造NPU资源,将小模子的平均算力资本训斥2-3倍以上;

推理高可用保险方面,FlexNPU通过软硬解耦及Token级KV Cache的及时快照,使得表层推理框架不再需要感知底层的硬件故障,即可兑现故障秒级快速规复及断点续推,大大减少了Agent推管待话重狡计支拨,晋升了用户的推理体验

顾炯炯强终末追念到,FlexNPU的中枢价值体现时:无需再为大模子推理的闲置算力,以及小模子推理的独占算力破坏买单,更不再需要为斯文的故障重算买单,实在兑现了AI算力分派供给从“资源时势”到“效果时势”的范式转动,“让每分AI算力干涉迸发最大价值,让智能体的海量Token东谈主东谈主消费得起。”

长远千行万业,作念好伙伴AI改革的“黑地皮”

华为云起原的智能化基础尺度,正在成为千行万业伙伴进行技巧改革、产物研发和生意拓展的紧要撑抓。发布会现场,华为云伙伴代表分享了多个真实案例。

天宽科技有限公司CTO龚徐建先容,天宽科技基于昇腾算力平台打造制造业Agent处理决策,可兑现智能常识问答、契约智能审核、风险识别等功能,契约审核准确率达90%,审核效果晋升3倍,坐蓐数据查询时间从1小时镌汰到2分钟,将企业东谈主力从繁琐类似的使命中安静,两边后续将在阛阓知悉、材干共建、成单旅途等方面进行拓展融合。

天津宏达瑞信科技有限公司CEO丁照祥则从零卖物流行业角度,斟酌AI落地带来的宽阔价值,暗意宏达瑞信基于华为云天筹求解材干,打造AI智能旅途蓄意决策,助力商家取得商品从仓库到经销商的运载最优解,何况不错字据复杂的交通要求天真建立,排线效果晋升60倍以上,减少冗余出车次数20%,物流资本训斥5.8%。

东谈主工智能底层技巧发展,牵引Al Infra算力基础尺度、开闭源大小模子、Agent使能框架与用具等快速演进,激励更多AI改革。面向异日,华为云将秉抓“用AI解行业贫乏”的理念,在应用层、模子层、算力层种植AI算力黑地皮IM体育官方网站,联袂伙伴共进共赢,收拢AI期间的机遇。(益达)

米兰体育官方网站 - MILAN



Copyright © 1998-2026 IM体育官方网站首页™版权所有

zhongyingjx.com 备案号 备案号: 苏ICP备11032894号-1

技术支持:®IM体育  RSS地图 HTML地图