阿里 WebShaper 开源,GAIA 评测超越 Claude 与 GPT-4o

阿里通义实验室近日发布了一款名为 WebShaper 的智能体,它采用形式化驱动的创新方法来生成结构化的训练数据。在权威的 GAIA 评测中,该系统表现亮眼,以 60.19 分的成绩超越了 Claude 3.5 和 GPT-4o,创下了开源模型在这一评测中的新纪录。

为了推动行业发展,WebShaper 已将代码与数据集开源,并提供了交互演示功能,助力开发者们进一步优化模型性能,共同探索人工智能技术的更多可能。

.

说明:本站所有内容均收集于互联网,如果有不妥之处,敬请谅解。如有侵权内容,请联系我们删除。内容并不能代表产品厂家,或者是第三方的观点,非专业技术类人员,请勿对服务器设备进行操作,以免造成设备不可使用或数据丢失。同时凯铧互联小编建议用户定期对云服务器数据进行备份保存! 北京凯铧互联科技有限公司(简称凯铧互联)由多名前阿里云资深技术专家创立,核心员工来自阿里云、腾讯云等,作为阿里云重要的合作伙伴,专注于为企业用户提供云计算及云计算的解决方案,高端网站建设,设计及维护服务,设计开发经验丰富,用户认可率高. 今天的分享就到这里啦,若您需要帮助, 可以直接扫描添加我们客服微信号,阿里云代理商凯铧互联专业技术团队为您提供全面/便捷/专业的7x24技术服务。