美股
基金
外汇丶加密货币
沪丶深港通
港股
 
 
 
 
 
 
新闻分享
如欲分享新闻,请填写收件人及阁下之电邮,再按「送出」。*必需填写
收件者电邮*
请用分号「;」分隔不同电邮地址,例子:a@a.com; b@b.com
阁下之电邮*
分享内容
明略科技(2718.HK)大模型再获世界级突破!Mano以72B参数获 OSWorld 榜单Specialized 模型第一
明略科技(2718.HK)自研大模型Mano再获世界级突破!据OS-WorldE2E官方榜单最新数据(截至2025年10月),明略科技自研的GUI智能体大模型Mano以54.0%的任务成功率刷新纪录,...
重设
送出
视窗将於5秒内关闭
明略科技(2718.HK)大模型再获世界级突破!Mano以72B参数获 OSWorld 榜单Specialized 模型第一
有连云新闻
推荐
0
利好
0
利淡
0
 
 

明略科技(2718.HK)自研大模型Mano再获世界级突破!

据OS-WorldE2E官方榜单最新数据(截至2025年10月),明略科技自研的GUI智能体大模型Mano以54.0%的任务成功率刷新纪录,位列Specialized模型第一、模型总榜第二,仅次于Anthropic最新发布的Claude 4.5。

Mano以72B参数在OSWorld-Verified榜单的FoundationE2EGUI评测总榜位列第二。

与今年9月首次提交的数据相比,Mano的参数规模从7B扩展至72B(约720亿),任务完成率从40.1%提升到54.0%,性能实现了显著提升。这也标志着专用智能体在真实操作任务中的执行能力达到新高度。

Mano以72B参数在OS World-Verified榜单的Foundation E2E GUI&Specialized Model评测中位列第一。

从语言到行动:智能体的下一阶段

OSWorld是目前全球最具权威的“操作智能”评测体系,涵盖10类应用、369个跨应用任务。它要求模型在真实的桌面和浏览器环境中执行连续操作——例如打开电子表格、搜索信息、整理数据、完成填报。这类任务远比问答生成复杂,因为每一步都需要模型既理解内容,又理解“界面结构”,并能在多次操作中保持逻辑连贯。

在此前的测试中,即便是顶级的通用大模型,在OSWorld上的成功率也常停留在30%–40%区间。而Mano72B的最新成绩——54.0%的端到端任务成功率——不仅刷新了中国模型的最高纪录,也让“专用智能体”第一次在这个“AI操作考场”中站上了前列。

这背后的技术路线也与传统语言模型截然不同。明略科技在最新版技术报告《ManoTechnicalReport》(报告链接:https://arxiv.org/abs/2509.17336)中系统阐述了其方法:模型的训练并不是基于单纯的文本对话,而是在高保真的模拟电脑环境中反复尝试与学习。可以理解为,Mano被放进了一个巨大的虚拟操作系统,在其中学习如何移动光标、点击按钮、识别菜单、输入数据,并通过反复试错掌握任务完成的最佳路径。

技术原理:让模型在“真实环境”中学习

Mano的训练框架包含三个阶段:监督微调(SFT)、离线强化学习(OfflineRL)和在线强化学习(OnlineRL)。简单来说,SFT阶段相当于“老师教范例”,模型学习基础操作方法;离线强化学习阶段让模型通过过去的任务经验学会“举一反三”;而在线强化学习阶段则是在真实环境中持续练习、发现新策略。

明略科技还引入了一个名为“Think–Act–Verify”的执行闭环:模型在操作时,会先判断当前界面状态(Think),再执行具体动作(Act),最后验证结果是否正确(Verify)。如果执行出错,模型会自动调整步骤重新尝试。这让Mano在面对复杂、多变的操作场景时,能够实现自我修正和容错。

举个通俗的例子:当你让智能体“下载一份财务报表”时,通用大模型可能只会给出一段操作说明,而Mano会真的打开浏览器、登录账户、识别下载按钮、选择正确的日期范围,并在出现错误提示时重新登录、重试。这种能力的获得,正是通过强化学习与高保真训练环境协同实现的。

根据论文数据,Mano在加入在线强化学习后,模型平均任务完成率提升了约14个百分点,尤其在多步骤任务(multi-turntask)中表现稳定。研究团队指出,这种“在环境中学习”的方式,是实现操作智能的关键:模型不再依赖静态语料,而是通过持续交互获得反馈,从而具备“学习如何行动”的能力。

专用智能体的竞争力

长期以来,大模型的性能评估主要集中在语言理解、知识问答或内容生成任务上。而GUI智能体的出现,让AI的边界从“文字世界”延伸到了真实的操作系统中。与通用大模型相比,专用智能体的核心优势在于——它们不追求覆盖所有知识,而是致力于在特定任务上实现更高的执行深度与稳定性。

Mano的成绩正是这一趋势的体现。通过结构化的任务数据、针对性的强化学习和验证机制,模型在界面识别、动作规划和过程稳定性方面表现出了持续进步。OSWorld官方评述指出,这一成果“展示了专用智能体在真实任务执行中的潜力,也标志着多模态智能体研究的工程化进展。”

对明略科技而言,Mano不仅是一项研究成果,也正逐步成为企业智能系统的底层技术。公司正在探索如何将Mano的操作智能嵌入到数据分析、营销自动化、合规管理等具体场景,使模型能在实际业务流程中承担“数字助理”的角色。研究团队同时提到,未来的方向包括提升推理效率、减少交互步长,并推动端侧轻量化部署,让智能体在普通硬件环境中也能稳定运行。

从7B到72B,从40.1%到54.0%,Mano的进化历程不仅是一次参数增长,更是一种能力迁移——从语言理解到操作智能的跨越。明略科技技术团队在报告中表示,未来Mano将继续优化推理效率与任务泛化能力,并探索端侧部署与行业级落地路径,使智能体能力真正融入企业生产流程。当模型不再只“输出答案”,而是真正“完成任务”,人工智能才开始具备通往真实世界的执行力。

新闻来源 (不包括新闻图片): 有连云
 
网站地图
支援电邮: support@aastocks.com
阿斯达克网络信息有限公司 (AASTOCKS.COM LIMITED) 版权所有,不得转载
免责声明
阁下明确同意使用本网站/应用程式的风险是由阁下个人承担。

AASTOCKS.com Limited、香港交易所资讯服务有限公司、中国投资信息有限公司、深圳证券信息有限公司、Nasdaq, Inc.、其控股公司及/或该等控股公司的任何附属公司、或其资讯来源及/或其他第三方数据供应商均竭力确保所提供资讯的准确和可靠度,但不能保证其绝对准确和可靠,且亦不会承担因任何不准确或遗漏而引起的任何损失或损害的责任(不管是否侵权法下的责任或合约责任又或其他责任)。

AASTOCKS.com Limited、香港交易所资讯服务有限公司、中国投资信息有限公司、深圳证券信息有限公司、Nasdaq, Inc.、其控股公司及/或该等控股公司的任何附属公司、或其资讯来源及/或其他第三方数据供应商均对资讯不作任何明示或隐含的要约、陈述或保证(包括但不限于可销售性及特殊用途合适性的资讯保证) 。

AASTOCKS.com Limited、香港交易所资讯服务有限公司、中国投资信息有限公司、深圳证券信息有限公司、Nasdaq, Inc.、或其控股公司及/或该等控股公司的任何附属公司、或其资讯来源及/或其他第三方数据供应商不会就任何原因导致的中断、不准确、错误或遗漏或因此而造成的任何损害赔偿(不论直接或间接、相应而生、惩罚性或惩戒性)对任何人承担责任。

AASTOCKS.com Limited不负责,亦不承担任何由于不可抗力的事故或在AASTOCKS.com Limited不可合理控制的情况下导致的损失或损害,如台风、暴雨、其他自然灾难、政府或有关机构的限制、骚动、战争、病毒爆发,网络故障或电信故障,引致AASTOCKS.com Limited不能履行协议内的责任或提供服务。

Morningstar免责声明:版权所有©2020 Morningstar,Inc。保留所有权利此处包含的资料,数据,分析和意见(“信息”):( 1)包含Morningstar及其内容提供者的专营资料;(2)除特别授权外,不得复制或转载;(3) 不构成投资建议;(4)仅供参考,(5)并未为所载资料的完整性,准确性及时间性作出保证.Morningstar对于阁下使用任何相关资料而作出的任何有关交易决定,伤害及其它损失均不承担 任何责任。请在使用所有资料前作出核实,并且在咨询专业投资顾问意见前勿作任何投资决定。过往业绩并不代表将来表现,任何投资项目的价值及所得收入皆可升可跌。

本网站/应用程式包含的内容和信息乃根据公开资料分析和演释,该公开资料,乃从相信属可靠之来源搜集,这些分析和信息并未经独立核实和AASTOCKS.com Limited并不保证他们的准确性、完整性、实时性或者正确性。

在本网站/应用程式的资料、金融市场数据、报价、图表、统计数据、汇率、新闻、研究、分析、购买或者出售评分、财金教学及其他资讯仅作参考使用,在根据资讯执行证券或任何交易前,应咨询独立专业意见,以核实定价资料或获取更详细的市场信息。AASTOCKS.com Limited不应被视为游说任何订户或访客执行任何交易,阁下须为所有跟随在本网站/应用程式的资料、评论和购买或出售评分执行的交易负责。

AASTOCKS.com Limited之信息服务基于「现况」及「现有」的基础提供,网站/应用程式的信息和内容如有更改恕不另行通知。AASTOCKS.com Limited有权但无此义务,改善或更正在本网站/应用程式的任何部分之错误或疏漏。

用户在没有AASTOCKS.com Limited明确的书面同意情况下,不得以任何方式复制、传播、出售、出版、广播、公布、传递资讯内容或者利用在本网站/应用程式的信息和内容作商业用途。

投资涉及风险。 阁下可自行决定利用本网站的财金教学作学术参考用途,但 AASTOCKS.com Limited不能并不会保证任何在本网站/应用程式现在或未来的购买或出售评论和讯息会否带来赢利。 过往之表现不一定反映未来之表现,AASTOCKS.com Limited不可能作出该保证及用户不应该作出该假设 。

AASTOCKS.com Limited也许连结订户或访客至其有兴趣的网站,但AASTOCKS.com Limited只提供此服务给订户或访客并不为此安排负责。

AASTOCKS.com Limited对于任何包含于、经由、连结、下载或从任何与本网站/应用程式有关服务所获得之资讯、内容或广告,不声明或保证其内容之正确性或可靠性。对于阁下透过本网站/应用程式上之广告、资讯或要约而展示、购买或取得之任何产品、资讯资料,本公司亦不负品质保证之责任。

AATV是AASTOCKS.com Limited所属的视频网站平台。

阁下确认:(i)AATV只为提供资讯,而不是为了任何交易目的;(ii)AATV节目内容及其提供的资料本身并不构成任何AASTOCKS为售出任何证券。 (iii)AATV并非并存的人或法律实体,在其他司法管辖区或国家使用,而在某处可能因该使用或分发而违反当地法律或法规。

AASTOCKS.com Limited不对任何其他人进行评论,也不会代表AASTOCKS.com有限公司。 (i)AATV的不准确,错误或遗漏,包括但不限于报价和财务数据;(ii)AATV中的节目传输的流量,错误或中断;(iii)阁下由AATV中部节目内容招致任何损失。

我们保留的权利不时更改本免责声明和并存于本网站/应用程序程序的版本更新版本。阁下必须定期定期查阅于本网站/应用程序声明该信息,并确保您及时知悉任何有关的费用。更新后仍可以继续使用本网站/应用程序,即代表代表阁下同意接受更改后的本免责声明的约束。

本免責聲明應受中華人民共和國香港特別行政區(「香港」)法律管限。閣下同意接受香港法院的專屬司法管轄權管轄。

本免责声明的中英原文如有任何岐异,一切以英文原文为准。

更新日期为: 2023年1月6日