Sia Siberia

GDPVAL

互联网 2025-10-05 18:12:43

GDPval 是 OpenAI 推出的全新评估框架,用在衡量 AI 模型在真实经济价值任务上的表现。GDPval 从美国 GDP 贡献最大的 9 个行业中选取 44 种职业,设计 1320 个真实任务(开源版本包含 220 个),涵盖软件开发、法律文书、机械工程、护理计划等多个领域。任务由平均有 14 年经验的专业人士设计,经过多轮审核,确保贴近实际工作场景。GDPval 的目标是通过真实任务评估 AI 的经济价值,帮助人们更好地理解 AI 在现实世界中的应用潜力。