9月25日,OpenAI发布一项新基准测试,旨在评估其人工智能(AI)模型在各类行业及职业中与人类专业人士的表现差异。这项名为GDPval的测试,是该公司为了解自身系统在 “高经济价值工作” 上与人类表现的接近程度所做的初步尝试 —— 而实现这一目标,正是OpenAI成立使命中 “研发通用人工智能(AGI)” 的关键组成部分。OpenAI表示,研究发现其GPT-5模型及Anthropic公司的Claude Opus 4.1模型 “在工作质量上已接近行业专家水平”。

发布时间:2025年9月26日 01:07 来源:鹰瞳 分类:要闻
9月25日,OpenAI发布一项新基准测试,旨在评估其人工智能(AI)模型在各类行业及职业中与人类专业人士的表现差异。这项名为GDPval的测试,是该公司为了解自身系统在 “高经济价值工作” 上与人类表现的接近程度所做的初步尝试 —— 而实现这一目标,正是OpenAI成立使命中 “研发通用人工智能(AGI)” 的关键组成部分。OpenAI表示,研究发现其GPT-5模型及Anthropic公司的Claude Opus 4.1模型 “在工作质量上已接近行业专家水平”。

Copyright © 2025 北京逻辑回归科技有限公司

京ICP备2021000962号-9 地址:北京市通州区朱家垡村西900号院2号楼101

小程序二维码

微信扫码体验小程序