立足娱乐圈·争做八卦帝!

徽声在线

黄仁勋台北宣言引爆端侧革命,明略科技四维布局验证AI新范式

来源:未知 作者:佚名 发布时间:2026-06-02 16:16:19

6月1日,英伟达掌舵人黄仁勋在台北GTC大会上抛出一句重磅论断,为AI行业新范式定下基调——AI已突破大语言模型阶段,正式迈入具备自主观察、推理、规划及工具调用能力的Agentic AI时代。这一论断不仅引发行业震动,更预示着科技产业将迎来系统性变革。

此次演讲的核心价值不在于某款芯片或模型发布,而在于揭示了智能体对传统计算架构的颠覆性影响。从云端超算中心到个人终端设备,整个软硬件生态链都面临重构需求。黄仁勋强调,智能体正在重塑人机交互范式,未来计算将呈现去中心化特征。

为支撑这一变革,英伟达推出覆盖全场景的产品矩阵:云端部署Vera Rubin智能体超算系统,企业端提供Agent Toolkit开发套件,个人终端推出RTX Spark AI电脑,物理世界则布局Cosmos-3机器人平台。这套组合拳的核心目标,是让智能体在各类终端实现低延迟、低成本的高效运行。

在智能体经济时代,黄仁勋提出颠覆性观点:"算力即收入(Compute is Revenue)",预示着计算资源将成为新的价值创造载体。

数据主权:智能体落地的安全基石

安全性成为黄仁勋演讲的高频词。他指出,智能体作为分布式异构计算系统,由模型、框架、工具链、技能库和运行时环境构成。当这些系统深度介入企业核心业务流程——如代码开发、数据分析、工具调用时,数据安全与隐私保护就成为不可妥协的前提条件。

为此,英伟达推出开源Open Shell运行时环境。黄仁勋特别强调:"该框架确保智能体严格执行安全策略,同时保护用户隐私、数字身份和权益。"目前,Red Hat、Canonical和Microsoft等企业已采用该方案,其独特优势在于支持"云端-边缘-终端"全场景部署。

"本地甚至设备端"的安全部署能力具有战略意义。在中国《数据安全法》和《个人信息保护法》框架下,企业核心数据资产——包括客户信息、交易记录、营销效果数据、内部运营数据等——都面临严格监管要求。明略科技此前提出的端侧部署方案,恰好契合这一合规需求。

明略科技总结出三条关键路径:数据主权保障(无需上传云端即可处理敏感数据)、可审计性(开源架构支持监管审查)、人机价值协同(保护组织中个体的创造性贡献)。这些原则为智能体企业级落地提供了方法论支撑。

实践表明,数据主权问题已成为智能体商业化的核心门槛,解决此问题者方能获得企业客户信任。

端侧模型:从技术可行到商业可用

黄仁勋对端侧计算的重新定义引发行业热议。他预言:"40年后回望,Microsoft与NVIDIA将共同完成PC的第二次革命。"这场变革的深远影响,堪比功能机向智能手机的跨越式发展。

端侧算力爆发催生新命题:如何构建在本地硬件高效运行的智能体模型?这个看似技术问题,实则关乎AI商业化路径选择。

明略科技通过Mano-P模型给出创新答案。该模型采用分阶段开源策略,最新发布的Mac本地版GUI-VLA智能体,直击企业AI应用痛点——传统云端方案要求上传截图和文档,这在金融、医疗等高合规领域存在致命风险。Mano-P实现的关键突破,正是从"云端依赖"到"本地自治"的范式转换。

技术验证显示,Mano-P 72B版本在OSWorld专业评测中取得58.2%任务成功率,以13.2个百分点优势领跑全球。其4B量化版本专为端侧设计,在Apple M4 Pro芯片上实现476 tokens/s预填充和76 tokens/s解码速度,峰值内存占用仅4.3GB。这种"旗舰版验证技术上限+轻量版保障日常可用"的策略,标志着端侧模型进入成熟阶段。

与模型创新配套的是明略科技推出的Cider推理加速框架。针对Apple Silicon M5芯片的INT8算力闲置问题,Cider通过W8A8全量化推理技术,直接调用芯片硬件指令集。实测数据显示,其Prefill速度较主流MLX框架提升1.79倍,内存占用降低40%,且精度损失可忽略不计。

对比实验更具说服力:在M5 Pro运行Qwen3-8B模型时,MLX原生W8A16量化方案耗时221.3秒(甚至慢于FP16的179.9秒),而Cider W8A8方案仅需123.5秒,困惑度指标仅比FP16高0.03。这种权重量化与激活量化的协同优化,解决了端侧推理的性能瓶颈。

黄仁勋在介绍Nemotron 3 Ultra时强调的"全盘接收即用"理念,与明略科技的技术路线不谋而合。当前模型竞争已从"规模竞赛"转向"效率竞赛",推理速度、资源消耗、专业精度成为新的评价维度。

端侧生态:构建完整技术闭环

黄仁勋提出的RTX Spark概念重新定义了PC价值,但真正的端侧AI革命需要完整生态支撑。这既包括芯片与模型的协同优化,也涉及智能体协作机制和线下数据采集体系的创新。

明略科技近期开源的Octo系统,通过连接人类用户、数字分身Agent、Runtime Agent和外部工具,构建起组织级数字劳动力网络。其独特的MoA(Mixture of Agents)协作架构引入对抗机制——不同Agent在协同工作中相互验证、交叉检验,最终输出比单一模型更可靠的结果。这种设计灵感与黄仁勋强调的"智能体技能工具库"理念形成呼应。

黄仁勋将CUDA-X库开放为智能体技能工具时指出:"这些库的利用效率已超越人类专家。"Octo系统进一步深化这个思路,通过多智能体协同实现"群体智能"优势。在金融风控、医疗诊断等复杂场景,这种协作模式展现出独特价值。

硬件创新方面,明略科技5月发布的Octic设备开创了会议场景新范式。不同于传统录音笔的事后处理模式,Octic在会议进行时实时分析陈述内容,自动比对公开数据验证事实准确性,并在逻辑矛盾时即时提醒用户。其分层记忆架构可持续积累用户数据,逐步构建个性化Personal AI助手。

至此,明略科技形成完整的端侧AI产品矩阵:Mano-P负责本地化智能决策,Cider优化推理效率,Octo实现多智能体协作,Octic完成线下数据采集。这个从模型到硬件的全栈方案,全部采用开源或开放策略,构建起技术护城河。

从数据洞察到价值创造

黄仁勋提出的"Token经济"理论揭示了智能体时代的价值逻辑。当AI产出开始用Token计量时,每次端侧推理节省的云端调用成本,都直接转化为企业利润。这种商业模式变革,正在重塑AI产业的价值分配格局。

明略科技创始人吴明辉在2025年提出的预言正在成为现实:"通用大模型将演变为公共基础设施,专业小模型将深耕细分领域。"Mano-P、Cider、Octo、Octic等产品矩阵,正是这一战略的具体实践。这些创新帮助企业跨越"数据理解"到"价值实现"的鸿沟。

财务数据印证了转型成效:2025年明略科技实现营收14.26亿元,经调整净利润实现扭亏为盈。其中Agentic Services业务收入突破1亿元,新增大客户中超30%来自该领域。吴明辉在2026年3月总结道:"我们完成了从数据服务商到结果服务商的关键跃迁。"

当黄仁勋在台北宣布"AI将直接理解人类意图"时,明略科技的Mano-P已在Mac终端实现这一愿景——自动识别屏幕内容、解析用户需求、操作应用软件,且全程数据不出本地域。这种技术突破与商业模式的双重创新,正在定义端侧AI的新标准。

端侧AI革命已拉开帷幕。掌握验证过的端侧模型、推理引擎和完整产品矩阵的企业,将在这场变革中占据先发优势。随着更多场景被智能体渗透,一个去中心化的AI新生态正在崛起。

    责任编辑:
    湖人0-4遭雷霆横扫,詹姆斯41岁倾尽全力,资本博弈下的传奇落幕

    2026-05-15

    2026年5月11日,随着终场哨声在球馆内回荡,大屏幕上的比分定格在了110–115——雷霆以一场酣畅淋漓的胜利横扫湖人,不仅击碎了紫金军团本赛季的夺冠梦想,更标志着一个统治NBA长达 ... [详细]

    转会市场风云变幻:乌尊、格雷罗等球星未来何去何从?

    2026-04-08

    夏季转会窗口即将开启,乌尊、格雷罗等球星转会传闻不断。多特蒙德、拜仁等豪门积极引援,沙尔克04、曼城等队则面临核心离队。转会市场风起云涌,谁将成为最大赢家? ... [详细]

    粤超烽火重燃!欧文亲临越秀山,草根足球盛宴再掀高潮

    2026-05-16

    粤超联赛第三轮即将开战,东区榜首之争、西区卡位战、潮汕德比等精彩对决轮番上演,英格兰传奇球星欧文将亲临现场助阵,为赛事增添无限星光。 ... [详细]

    2027亚洲杯抽签揭晓:中国队C组迎战伊朗等强敌

    2026-05-12

    2027年亚足联亚洲杯抽签仪式在沙特利雅得举行,中国队分入C组,将先后对阵伊朗、叙利亚和吉尔吉斯斯坦。赛事门票将于5月13日凌晨开售。 ... [详细]

    曼联4800万欧元接近签下埃德森

    2026-05-28

    曼联正在就签下亚特兰大中场埃德森进行深入谈判,这有望成为红魔今夏的首笔引援。多个消息源告诉BBC体育,转会已接近完成,26岁的巴西中场埃德森的转会费可能达到4800万欧元。曼 ... [详细]

    图酷

    图说天下

    资讯排行

    首页 - 娱乐圈事 - 体育圈事 - 两性情感 - 星座命运 - 奇闻怪事 - 历史故事 - 科技资讯 - 图说天下 - 知识百科 - 图酷 - 娱乐八卦
    电脑版 | 移动端
    Copyright © 2002-2019 徽声在线 版权所有
    删帖请联系邮箱:[email protected]