阿里通义实验室近日发布了一款名为 WebShaper 的智能体,它采用形式化驱动的创新方法来生成结构化的训练数据。在权威的 GAIA 评测中,该系统表现亮眼,以 60.19 分的成绩超越了 Claude 3.5 和 GPT-4o,创下了开源模型在这一评测中的新纪录。
为了推动行业发展,WebShaper 已将代码与数据集开源,并提供了交互演示功能,助力开发者们进一步优化模型性能,共同探索人工智能技术的更多可能。
.

阿里通义实验室近日发布了一款名为 WebShaper 的智能体,它采用形式化驱动的创新方法来生成结构化的训练数据。在权威的 GAIA 评测中,该系统表现亮眼,以 60.19 分的成绩超越了 Claude 3.5 和 GPT-4o,创下了开源模型在这一评测中的新纪录。
为了推动行业发展,WebShaper 已将代码与数据集开源,并提供了交互演示功能,助力开发者们进一步优化模型性能,共同探索人工智能技术的更多可能。
.