2026-04-04
2026年中国电影市场年度票房突破120亿,清明档22部新片涵盖六大类型,艺术电影与纪录片破亿成常态,口碑驱动长线放映机制成熟。 ... [详细]
|
近日,徽声在线从明略科技获悉,该公司已正式对外开源其自主研发的GUI感知智能体模型——Mano-P 1.0。这款模型集成了GUI感知、深度理解、智能规划、精准操作以及结果验证五大核心能力,能够仅凭视觉输入就理解并操控桌面软件、网页界面乃至复杂的图形化工作流,且支持在Apple M4芯片设备上实现本地化运行。 Mano-P的问世,标志着AI技术突破了“仅观不作”的传统局限,能够直接在真实的图形界面环境中跨平台执行复杂任务。该项目遵循Apache 2.0协议开源,代码完全公开透明,不仅支持商业用途,还鼓励二次开发创新。 通过提供纯视觉理解与本地执行能力,Mano-P为个人开发者及企业组织提供了构建低成本、个性化AI的强大工具,在确保数据主权的前提下,引领大家正式步入“私有化”个人AI的新纪元。 纯视觉驱动,开启智能交互新篇章 打通复杂业务流的“终极关卡” 在当前技术架构下,自动化操作往往受限于底层API接口、CDP协议或网页HTML解析的束缚,面对非标准应用或跨系统协作时显得力不从心。Mano-P以纯视觉理解为核心,摆脱了对外部接口与协议的依赖,能够直接理解并操控桌面软件、3D应用及各类专业工具,从根本上打破了传统基于浏览器的生态限制。 同时,Mano-P为现有Agent生态提供了坚实的执行能力支撑。目前,该模型可通过skill形式无缝集成至OpenClaw等AI Agent中,实现多窗口系统与跨应用工作流的顺畅穿梭,轻松执行点击、文本输入、窗口切换及视觉验证等闭环操作。 这一创新解决了长期困扰Agent工作流的人工干预难题,使模型不仅能够胜任全自动应用的构建与测试,更能向复杂的商业场景延伸,实现复杂任务的全程自主执行。 13个榜单登顶,刷新GUI专用模型性能纪录 树立端侧GUI Agent性能新标杆 为确保前沿技术能够在端侧设备上得到广泛应用,Mano-P采用了双版本交付架构:72B完整模型用于探索技术上限,同时提供4B量化模型(w4a16)以满足极致的端侧部署需求。 Mano-P 1.0的72B参数量完整模型版本,在全球多模态领域的13个权威基准测试榜单中,实现了针对小尺寸模型的全面领先,刷新了GUI专用模型的性能纪录。其能力矩阵全面覆盖了GUI Grounding、CUA(计算机使用代理)、多模态感知认知、视频理解以及长上下文学习等关键领域,为端侧GUI Agent树立了性能新标杆。 图片来源:明略科技 在业界权威的OSWorld专有模型基准测试中,Mano-P 72B模型以58.2%的任务成功率位居全球榜首,领先第二名opencua-72b(45.0%)多达13.2个百分点。此外,在ScreenSpot-V2、MMBench、UI-Vision等评测体系中,Mano-P同样以显著优势夺冠。 卓越的性能背后,是底层技术的不断创新。Mano-P引入了SFT(监督微调)、离线强化学习与在线强化学习的三阶段渐进式训练架构,并配合专有的GSPruning视觉Token剪枝技术,实现了端侧推理效率的质的飞跃。 在配备Apple M4 Pro芯片的设备上,4B量化模型可实现高达476 tokens/s的预填充速度与76 tokens/s的解码速度,峰值内存占用仅为4.3GB,完美适配主流边缘设备的算力与存储限制。 端侧本地部署,守护数据安全防线 实现物理隔离级数据保护机制 随着AI技术深入核心业务流,数据隐私与合规性已成为企业决策的关键考量因素。Mano-P支持本地端侧部署,数据零上云,通过“纯视觉理解+本地执行”的架构设计,实现了数据处理与外部网络的物理隔离。 在本地模式下,模型可直接在Mac mini/MacBook(M4芯片及以上,32GB+内存)上运行,或使用Mano-P算力棒连接(通过USB 4.0)。系统的屏幕截图、业务流转数据及任务指令均在本地闭环处理,从源头上消除了面向云端服务器的传输风险。 同时,Mano-P具备强大的离线长任务自主规划能力。在无网环境下,Mano-P同样能够自主推进复杂业务流程,并完成过程中的决策与纠错。这一特性不仅重塑了人机交互的信任边界,更使得端侧AI能够真正进入高安全性、高隐私要求的企业级生产环境。 全面开源战略,加速Personalized AI生态繁荣 共筑AI技术新未来 技术的真正价值在于广泛的应用与生态的共建。Mano-P遵循Apache 2.0协议正式开源,完整客户端代码全面公开并支持严格审计,允许商业化应用与二次开发。 为降低企业与个人用户的接入门槛,Mano-P设计了三种开箱即用的使用形态,精准覆盖不同技术栈的用户群体。无需繁琐配置复杂的API密钥,用户即可轻松构建专属的高性能GUI智能体。 按照既定的开源规划,明略科技本次率先开源Mano-CUA核心技能,用户可将其便捷配置到OpenClaw或Claude Code中,以构建更智能的CUA任务工作流程,并克服人工干预带来的瓶颈。 图片来源:明略科技 Mano-CUA本地模型和SDK组件预计将于本月内正式开源,以满足具有高安全性需求的开发者的期待。届时用户可直接调用本地化部署的GUI-VLA模型来构建自定义技能与工具,所有CUA操作都将在本地Mac设备上执行,确保数据不上传至外部服务器。 未来,明略科技还将全面开源Mano-P模型底层的训练方法、Token剪枝技术与混合精度量化方案,助力开发者打造符合自身业务需求的专属本地GUI-VLA模型。 面向未来,从技术突破到生态共建,Mano-P将GUI感知、视觉操作、本地运行与开源生态紧密结合,不仅为端侧智能体提供了坚实的技术支撑,更为“Personalized AI”的发展铺就了一条清晰的现实路径。无论是独立开发者还是对安全要求严苛的企业组织,都能以更低的门槛、更高的可控性,打造个性化AI。明略科技正以开放之姿,让“人人可以创造专属AI”的愿景逐步变为现实。 |
汽车自动驾驶技术会让那一批人失业?自动驾驶来临还需要考驾照吗
淘宝闪购“外卖接力”新模式引领电商新风尚
徽声在线:谷歌掌门人预测2027年AI将深刻改变生产模式
徽声在线:4月首周全国新能源乘用车零售8.6万辆,同比下滑24% 2026-04-04
2026年中国电影市场年度票房突破120亿,清明档22部新片涵盖六大类型,艺术电影与纪录片破亿成常态,口碑驱动长线放映机制成熟。 ... [详细]
2026-04-06
4月6日最新消息,任天堂与知名动画制作公司照明娱乐(Illumination)再度携手推出的年度巨制《超级马力欧银河大电影》(The Super Mario Galaxy Movie)正以惊人的票房表现震撼影坛。 ... [详细]
2026-04-11
这位纳瓦拉中场将继续效力奥萨苏纳俱乐部至2030年。虽然过程一波三折,但I.穆尼奥斯的续约大戏终于落幕。奥萨苏纳俱乐部已通过其各数字平台宣布,与出身于比利亚夫兰卡的这位球 ... [详细]
2026-03-21
Netflix《刺客信条》真人改编剧集正式开拍,故事背景设定在公元64年古罗马,豪华卡司阵容曝光,制作团队强大,值得期待。 ... [详细]
2026-04-06
湖人队在NBA常规赛中不敌独行侠,八村垒表现出色成唯一亮点,詹姆斯体能问题凸显,艾顿态度低迷,雷迪克用人策略受质疑。 ... [详细]
啥病人看了这个都得好啊! 副标题 这胸是真的! 副标题 你赢了! 副标题 我是关心这是在哪里
乞丐装的最新境界! 副标题 买家你确定你不是阿宝?? 副标题 这裤子不敢坐下啊! 副标题 颜值
这鼠标垫你看到了什么?邪恶了吧! 副标题 毫无违和感! 副标题 小卖部的这女孩真会选呀! 副
女人真的不容易,怀孕后,内脏被挤压的严重,挺着大肚子干啥都不方便!近日,刘嘉姵和闺蜜集体拍
锤哥的替身也是辣么的帅气! 副标题 锤哥的替身好多啊! 副标题 你杀了你的替身,你可就没替
《权力的游戏》这档美国经典的系列电视剧已经告别我们有一段时间,但是剧中的一些经典画
很多有关佛教的影视剧上都会出现一个名词,舍利子。我们都知道舍利子是五彩色的晶体,集齐
英国王室最令人津津乐道的当属查尔斯王子和戴安娜王妃以及卡米拉之间的三角恋情,作为英