立足娱乐圈·争做八卦帝!

徽声在线

对话智象未来CEO梅涛:AI竞争焦点转向产品与场景落地,世界模型尚需时日

来源:未知 作者:佚名 发布时间:2026-05-20 21:04:16

每经记者:可杨 徽声在线编辑:杨翼

随着人工智能技术的持续演进,众多AI企业纷纷将“世界模型”纳入其技术发展蓝图,视频生成领域正迎来新一轮的热潮与关注。

5月19日,智象未来创始人兼CEO梅涛在接受包括《每日经济新闻》记者在内的多家媒体采访时,多次重申,当前行业距离真正意义上的世界模型尚有较长的路要走。“截至目前,我们不会宣称智象未来已成为一家世界模型公司。在我看来,目前市场上所有自称世界模型的,说实话,都还为时尚早。”

据公开资料,智象未来作为一家多模态生成式人工智能企业,自2023年成立以来便备受瞩目。其创始人兼CEO梅涛不仅是加拿大工程院的外籍院士,还曾担任京东集团副总裁。近期,智象未来宣布成功完成新一轮亿元级融资,吸引了深创投、金浦投资等多家知名机构的参与。

在访谈中,梅涛就视频生成、原生全模态模型、具身智能以及AI商业化等热点问题,深入阐述了他对行业技术路径、创业公司机遇以及AI产业分层的独到见解。

在梅涛看来,多模态生成技术远未达到成熟阶段,而AI企业的竞争焦点也正从单纯的模型能力转向产品能力与场景化落地的深度融合。

“世界模型并非单一模型”

近年来,世界模型成为AI行业的热门话题,但梅涛指出,行业对于这一概念的理解存在明显偏差。

“我发现很多人误以为世界模型就是一个模型,这其实与我们所理解的世界模型相去甚远。世界模型有多种实现路径,未来也不可能是全球只有一个模型,而是存在多种可能性。”梅涛强调,真正的世界模型需要同时具备三大能力:对物理规律的深刻理解与建模、对长上下文因果关系的精准处理,以及与物理世界的多模态感知交互能力,包括触觉、关节点运动、三维空间自由度等。“我们必须对世界模型的定义、应用场景和科学规律保持敬畏之心。”

梅涛通过一个具体场景来阐述当前的技术差距:让一个机器人进入房间,能够识别主人喜欢喝茶还是咖啡,并自主完成取瓶、拧盖、倒水、送杯等一系列动作。“今天的机器人,距离这一目标还非常遥远。”

安全性,即在真实场景中的稳定运行,也是梅涛强调的现实挑战之一。他认为,机器人在工厂或家庭环境中运作,目前需要极高的安全保障。如果安全性无法达到百分之百,就像自动驾驶一样,“进入家庭后如何保证人身安全、如何避免损坏贵重物品,这还需要相当长的时间来研究和解决”。

对于通往世界模型的路径,梅涛认为,目前世界模型的架构尚不明确,未来可能并非由一家公司独自承担,而是不同公司在各自的垂直场景中开发出相对通用但实际上高度专用化的模型。“会开车的、会捡东西的、会跑步的机器人,都应该是非常垂直的模型。”

“未来在通往世界模型的道路上,每个公司都可以宣称自己是世界模型公司,我也不会反对。但每个公司都不会做特别通用的事情。”梅涛补充道。

对于具身智能领域与视频模型的关系,梅涛曾公开表示,“很多具身智能公司低估了视频模型的重要性”。

梅涛指出,当前具身智能公司普遍采用的模型参数量“大概几十亿,不超过100亿”,而这个量级远不足以支撑复杂场景下的泛化能力。

“如果真要做到世界模型,你需要完成很多工作,怎么可能是一个小模型就能搞定?怎么可能仅采集一些数据就能达到要求?”梅涛认为,没有足够强大的底座模型,具身智能很难真正实现泛化。


“多模态生成领域技术尚未成熟”

对于当前的技术路径演进,梅涛认为,多模态生成领域的技术尚未成熟,“这为创业公司提供了宝贵的机会。如果技术完全成熟,统一采用DiT框架,我们也就没有必要继续做了,因为无法与大厂竞争”。

据公开资料,DiT架构,全称Diffusion Transformer,是一种将Transformer架构作为骨干网络应用于扩散模型的生成式人工智能架构,主要用于图像和视频生成任务。

“算法、数据、算力,三者都至关重要。”梅涛认为,当算法框架固定后,数据和算力的重要性才会凸显,竞争才会真正转变为资源的比拼。但当算法出现新的突破时,既有的数据积累优势会被部分稀释。这意味着,只要技术路线尚未确定,就仍然存在以算法创新换取相对优势的空间。“如果算法和架构发生变化,或者有新的架构与算法出现,数据的重要性会有所降低。”

对于当前视频生成领域的竞争格局,梅涛将其分为三层:拥有流量入口的平台型企业;做底层基座大模型的公司;以及大量做Agent(智能体)和行业应用的公司。

梅涛表示,智象未来在第二层和第三层之间布局,既打造特色差异化模型,也开展行业应用。智象未来不与大型模型厂商正面比拼底座模型,因为该领域投入成本极高。基于当前体量,公司选择聚焦特色领域,例如基于全新一代原生全模态架构Unified Transformer(UiT)打造的图像生成模型HiDream-O1-Image。其次,在视频生成领域则专注于与商业场景紧密相关的内容,如商业营销、影视创作等垂类场景应用的视频生成模型。

梅涛认为,大模型提供的原子能力并不等同于最终产品体验。用户,尤其是非开发者,无法直接调用模型接口,中间必须存在一个由API、技能封装再到智能体构成的中间层。

梅涛进一步将AI公司的商业价值分为三层:最底层是算力价值(芯片、基建等),中间层是Token(词元)价值;“大模型的费用,从长远来看一定会像水电、基建一样,价格非常公开、透明,也会越来越便宜;最上层是应用落地带来的商业价值,这取决于公司的商业模式。”梅涛认为,创业公司如果仅卖平台或Token,无法与大厂比拼资源与流量,必须把应用层做厚,与客户共创价值,才能在竞争中建立壁垒。

对于创业公司与大厂的竞争,梅涛表示,大厂不可能覆盖所有领域。“现在,没有一家模型公司能够满足客户的所有需求,这是行业共识。”

对于智象未来的自身定位,梅涛表示,公司长期目标是探索并构建世界模型,但在当下,智象未来更严谨地将自己定义为一家原生多模态大模型公司,在迈向世界模型的过程中还是会先聚焦在图像、视频、3D交互这些多模态数据的生成、理解与建模上。

梅涛认为,原生多模态一定会通往世界模型,但中间还有很长的路要走。“世界模型一定有清晰定义,包括其能力边界、技术内涵和应用目标。否则,相关讨论容易停留在概念层面,不加定义的话说得不好听就是‘耍流氓’,难以指向一个具备统一认知和构建能力的世界模型。”

    责任编辑:
    辛纳成就六站硬地大师赛全冠伟业,创纪录比肩网坛传奇

    2026-03-21

    北京时间今日清晨,辛纳在印第安维尔斯决赛力克梅德维德夫夺冠,达成全部六站硬地大师赛冠军纪录,成为最年轻达成者,还达成大师赛100胜,书写网球新历史。 ... [详细]

    切尔西深陷进球荒:连续4轮零封创37年最差纪录,客战布莱顿能否破局?

    2026-05-03

    英超第34轮切尔西客战布莱顿,蓝军近4轮67脚射门0进球,创1988年以来最差进攻表现,历史交锋3连败背景下能否打破魔咒? ... [详细]

    刘强东章泽天商业版图再扩张 宿迁三企同步注册引关注

    2026-04-16

    刘强东章泽天夫妇近期在宿迁连续注册三家企业管理公司,注册资本总额超千万元,形成集团化运营布局。 ... [详细]

    广东队为何不敌山西?奎因直言不讳揭露输球真相,句句戳心

    2026-04-23

    CBA常规赛第41轮,广东队客场不敌山西队,奎因赛后直言球队细节和执行力不足,揭示输球核心问题。 ... [详细]

    点球大战福冈黄蜂6-5京都不死鸟,埃利亚斯破门,布朗扳平

    2026-05-07

    北京时间5月6日日本职业联赛J1 西区 第15轮,福冈黄蜂主场对阵京都不死鸟。福冈黄蜂萨尼-布朗破门。京都不死鸟拉斐尔-埃利亚斯破门,双方进入点球大战。点球大战,福冈黄蜂5-4京 ... [详细]

    图酷

    图说天下

    资讯排行

    首页 - 娱乐圈事 - 体育圈事 - 两性情感 - 星座命运 - 奇闻怪事 - 历史故事 - 科技资讯 - 图说天下 - 知识百科 - 图酷 - 娱乐八卦
    电脑版 | 移动端
    Copyright © 2002-2019 徽声在线 版权所有
    删帖请联系邮箱:[email protected]