2026-04-02
2025-26赛季德罗赞面对猛龙砍下28分,生涯总得分超越威尔金斯升至历史第17位,距离第16位罗伯特森仅差41分。 ... [详细]
|
《科创板日报》4月10日讯(记者 李明明)智谱发布其迄今最智能的模型。 近日,智谱发布并开源新一代旗舰模型GLM-5.1。据介绍,其是唯一达到8小时级持续工作的开源模型,在最接近真实软件开发的SWE-bench Pro基准测试中,GLM-5.1实现国产模型首次超越Opus 4.6。 OpenRouter显示,伴随此次发布,智谱GLM再度提价10%。 《科创板日报》记者从相关方获悉,与过去一年行业主旋律“降价”截然相反,智谱本次提价,编码场景定价首次追平海外头部厂商Anthropic。这也寓示着国产大模型从价格战、低价换量转向性能溢价。 实测GLM-5.1 关于GLM-5.1的智能水平,智谱团队告诉《科创板日报》记者,GLM-5.1提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。 代码能力是模型智能水平进一步提升的关键。据悉,在业内最具代表性的三个代码评测基准的平均结果中,包括衡量模型专业软件开发工作的SWE-Bench Pro、操作命令行解决问题的Terminal-Bench 2.0、从零构建完整代码仓库的NL2Repo,GLM-5.1取得全球模型第三、国产模型第一、开源模型第一。 这也代表了大模型演进到现在的趋势之一,过去两年,行业用Benchmark衡量模型有多智能。上述智谱团队向《科创板日报》记者判断,下一阶段的衡量标准应该是“能工作多久”,即模型在Long-Horizon Task中的表现,能独立完成多长时间的人类任务。 业内也形成了共识,2025年3月,AI安全研究机构METR提出了一个改变行业认知的指标:任务完成时间线(Task-Completion Time Horizon)——不再衡量模型"多聪明",而是衡量它能独立完成多长时间的人类任务。研究显示,前沿模型的时间线每7个月翻一倍。这条指数曲线被MIT Technology Review称为"AI领域最重要的一张图",Sequoia Capital据此在2026年初宣告"这就是AGI"。 在长程任务中保持稳定输出,模型面对的不只是更大代码量,而是一连串复杂的工程决策点:主动跑benchmark、定位瓶颈、修改方案、再跑测试。这对模型提出更高的要求,需要像人类工程师一样,形成“实验→分析→优化”的完整闭环,而不是写完代码停下来等人打分。 《科创板日报》记者用开发者工具实测了GLM-5.1,测试案例如下:有一个专门考验AI编程能力的测试,任务是让AI做出一个能快速检索海量数据的系统,当时最强的成绩是Claude Opus 4.6创造的。 实测显示,智谱GLM-5.1在持续进行六百多次优化、六千多次操作后,性能还在不断提升,最终速度达到了之前最好成绩的6倍。 据了解,GLM-5.1也刷新了国产开源模型的成绩。 长期以来,全球大模型赛道始终存在一条难以逾越的鸿沟:开源模型与顶尖闭源模型之间存在肉眼可见的能力代差,而中国开源模型更是长期被贴上追赶者的标签,在国际公认的通用能力榜单上,始终与Claude、GPT系列的顶级闭源产品有明显差距。 而在最贴近真实软件开发场景的SWE-bench Pro基准测试中,GLM-5.1实现国产模型对Claude Opus 4.6的首次超越。 智谱GLM再度提价10% 性能提升的同时,智谱在价格层面也与海外厂商看齐,这也是国产模型价格首次对齐海外,模型聚合平台OpenRouter显示,智谱GLM再度提价10%。调价后,GLM-5.1在Coding场景的缓存命中Token价格已接近Anthropic旗下Claude Sonnet 4.6。 这不是智谱第一次涨价,此前,智谱2月12日发布GLM Coding Plan 价格调整函称, GLM Coding Plan市场需求持续强劲增长,用户规模与调用量快速提升。公司决定对GLM Coding Plan套餐价格进行结构性调整,整体涨幅自30%起。 《科创板日报》记者此前独家获悉,海外版GLM-5定价涨幅高于国内:Coding plan订阅价格提高30%-60%,API调用价格提升67%-100%。 此举为国产大模型2026年以来首次大幅提价。 一年前,行业还深陷“价格战”,普遍降价九成以上争夺份额。智谱为何敢于反向操作? 从核心动因看,需求端爆发是直接推手。GLM Coding Plan聚焦开发者代码生成、编程辅助场景,市场需求持续旺盛,用户规模、接口调用量双双快速攀升,平台长期处于高负载运行状态,对算力调度、服务稳定性、响应效率的要求显著提高,需求增速超出原有资源规划与承载能力。 在智谱2025年业绩说明会上,智谱CEO张鹏对《科创板日报》记者介绍,一季度智谱的API调用定价提升83%,即便如此,市场依然呈现出供不应求的情况,调用量增长400%。当前,智谱已成为国内付费Token消耗量最高的厂商之一。 关于涨价,张鹏此前在中关村论坛上回应称,长期依赖低价竞争不利于行业发展,调价旨在将价格拉回正常的商业价值区间。“完成一个长程任务所需要的Token量可能是回答一个简单问题时的十倍甚至百倍,价格调整本质上是价值变化的自然结果。” 据张鹏介绍,智谱已经实现了Token在全球范围内的价值变现。目前,GLM模型已全面部署于Google Vertex AI、AWS Bedrock等全球云服务商,并入驻OpenRouter、Vercel等国际主流模型聚合平台。 智谱MaaS商业化方面,MaaS API平台实现ARR 约17亿元(约2.5亿美金),同比提升60倍。 此外,《科创板日报》记者注意到,2026年开年以来,国内AI行业已从过去的“价格战”转向“价值定价”,一些底层算力与模型服务集体调价,主要包括: 腾讯云:3月11日对自研混元HY2.0系列模型大幅调价, 4月9日再次宣布5月9日起AI算力、容器服务等产品统一上调5%。 阿里云:3月18日宣布4月18日起,AI算力相关产品价格上调5%-34%,智算版存储产品上涨30%。 百度智能云:3月18日发布AI算力、存储等产品调价公告,AI算力相关产品服务上调5%-30%,并行文件存储价格上调约30%。 (科创板日报记者 李明明) |
中兴通讯今年或推创新龙虾手机,引领设计新潮流
长安天枢智能机器人公司盛大成立
我国科技新突破:首台商用12兆伏串列加速器下线
MOVA割草机器人出货量突破30万台,引领智能园艺新潮流
中国多久实现无人驾驶汽车?司机还要多久被无人驾驶取代
比亚迪一季度新能源汽车销量突破70万辆,市场表现强劲 2026-04-02
2025-26赛季德罗赞面对猛龙砍下28分,生涯总得分超越威尔金斯升至历史第17位,距离第16位罗伯特森仅差41分。 ... [详细]
2026-03-30
东方卫视晚间黄金时段的招牌栏目“东方剧场”,始终以匠心独运的剧集品质搭建起与观众心灵对话的桥梁。该剧场坚守“都市气质、品质至上、创新多元”的核心理念,深耕现实主义题 ... [详细]
2026-03-26
3月28日,微短剧《西施重生》将在石首桃花山启动拍摄筹备并同步开启群演选拔。无论年龄、职业、颜值,只要热爱表演,就有机会成为剧中一员,还有精美礼品相送。快来加入我们,共同书写这段传奇故事! ... [详细]
2026-03-25
我叫曾女士,今年55岁,来自湖南长沙。回顾我的人生,婚姻之路可谓坎坷不平,经历了三次婚姻的波折,最终都未能长久维系,以离婚告终。这三次婚姻的失败,让周围的人对我产生了质疑,认为我 ... [详细]
啥病人看了这个都得好啊! 副标题 这胸是真的! 副标题 你赢了! 副标题 我是关心这是在哪里
乞丐装的最新境界! 副标题 买家你确定你不是阿宝?? 副标题 这裤子不敢坐下啊! 副标题 颜值
这鼠标垫你看到了什么?邪恶了吧! 副标题 毫无违和感! 副标题 小卖部的这女孩真会选呀! 副
女人真的不容易,怀孕后,内脏被挤压的严重,挺着大肚子干啥都不方便!近日,刘嘉姵和闺蜜集体拍
锤哥的替身也是辣么的帅气! 副标题 锤哥的替身好多啊! 副标题 你杀了你的替身,你可就没替
喜当爹虽然和恭喜当爹就差一个字,但是意义可是差了十万八千里,当然这个词也是因为一个特
和尚也就是大家口中的僧人、出家人,据说在兴起之初,和尚是一个尊称,意思为师的意思,和为三
于震寰结婚的消息这几天都挂在网上引发热议,更多的人不解,这是谁,干什么的,结婚是啥大事吗