游戏小漫书游戏小漫书
  • 首页
  • 游戏产业观察
    游戏产业观察
    聚焦大厂财报、并购投资、版号下发解读及海外市场分析…
    Show More
    Top News
    智能赋能云端脱险 Agent Empowered Cloud Escape | OPENAIGC开发者大赛高校组优秀作品
    1年 ago
    特朗普:OpenAI成立新公司Stargate,投资5000亿美元!
    1年 ago
    中国烟草总公司重庆市公司,私有化部署低代码平台建设项目,中标候选人公示
    4年 ago
    Latest News
    重磅!OpenAI开源首个Agent SDK,反击Manus
    1年 ago
    云计算巨头AI战略分化:谁将定义企业级AI的未来规则?
    1年 ago
    DeepSeek创造历史!登顶全球AI应用第2名,豆包排名第10
    1年 ago
    2025“赋能开发者”高峰论坛即将启幕,诚邀您报名参加!
    1年 ago
  • 活动与社群
    活动与社群
    最新活动,包含线上研讨会、技术预测峰会、线下峰会、…
    Show More
    Top News
    厂商征集 | 2022年金融科技卓越影响力评选
    3年 ago
    申报倒计时 | 2022年卓越影响力榜单-中国产业创新奖评选
    3年 ago
    2022年卓越影响力榜单 | 中国产业创新奖评选
    3年 ago
    Latest News
    2024第五届ISIG产业智能大会,四大科技峰会共掀数字化创新浪潮
    1年 ago
    参赛者必看 | 拯救者杯OPENAIGC开发者大赛最全攻略指南来啦~
    2年 ago
    2024第四届ISIG产业智能大会(RPA超级自动化、AIGC大模型、低代码/零代码、流程挖掘)
    2年 ago
    超自动化·智启高效运营|艺赛旗2023年春季产品发布会成功举办
    3年 ago
  • 关于低码时代
    • LowCode原创研究
Reading: 刚刚,OpenAI发布CoT监控,增强AI Agent自主能力
Share
Notification Show More
Latest News
30部佳作突围!2025 AI视听创作嘉年华晋级名单揭晓,总决赛11月25日启幕
未分类
《2025 AI 大模型开发生态白皮书》正式发布 | 算泥社区
未分类
“AI幻想·未来亦城”2025AI视听创作嘉年华作品征集来了!
未分类
120万奖池,寻找最具想象力的AI创意开发者!2025骁龙人工智能创新应用大赛正式启动!
未分类
2025-10-21
未分类
Aa
游戏小漫书游戏小漫书
Aa
  • 游戏产业观察
  • 活动与社群
  • 首页
  • 游戏产业观察
  • 活动与社群
  • 关于低码时代
Have an existing account? Sign In
  • LowCode低码时代
Copyright©2015-2022 北京企智未来科技有限公司 All Rights Reserved.
游戏小漫书 > Blog > 未分类 > 刚刚,OpenAI发布CoT监控,增强AI Agent自主能力
未分类

刚刚,OpenAI发布CoT监控,增强AI Agent自主能力

孙婷婷-LowCode低码时代
Last updated: 2025/07/16 at 10:12 上午
孙婷婷-LowCode低码时代 8月 ago
Share
SHARE

今天凌晨,OpenAI发布了最新技术论文思维链(CoT)监控,用来监督AI Agent等AI系统使得它们的自主性更强。

有网友表示,针对生产环境中的AI Agent而言,这一点至关重要。几个月来,我们一直在运行Mario和Erika两款AI智能体,而黑箱问题确实存在。例如,当Mario做出一个有问题的销售决策时,我需要看到它的推理过程而不仅仅是输出结果。

思维链可监控性的重要意义是:调试智能体的故障;合规审计尤其是在金融、医疗领域与对AI决策持怀疑态度的利益相关者建立信任。

所以,OpenAI发布这个研究非常明智,随着智能体的自主性越来越强,可解释性将成为一项业务要求,而不仅仅是一个可有可无的功能。

思维链监控似乎是让人类能够理解AI认知过程的关键一步,尤其是如果它能成为智能体的标准配置的话。透明度与可解释性相结合,就能产生信任。

思维链监控不仅仅是一项技术升级,更是构建安全且透明的AI的蓝图。随着智能体不断发展,我们需要能够洞察它们的推理过程。很高兴看到OpenAI在这一前沿领域处于领先地位。

为什么需要监控CoT

在某些复杂的任务中,AI必须通过链式思考来完成推理过程。这是因为这些任务需要大量的序列化推理步骤,而这些步骤必须通过链式思考来实现。

以Transformer架构为例,这种架构是目前大多数前沿AI模型的基础,它通过自回归采样逐步生成输出。在Transformer架构中,任何足够长的序列化推理过程都必须通过链式思考来完成。

当AI需要完成复杂的任务,如多步规划或高级推理时,它必须利用链式思考作为工作记忆。例如,用AI Agent解决一个复杂的数学问题或进行多步规划时,它需要将中间结果存储在链式思考中,以便后续步骤可以使用这些结果。这种必要性确保了在处理足够复杂的任务时,AI的链式思考中必然包含其推理过程的一部分信息。换句话说,对于这些任务,AI无法在不通过链式思考的情况下完成推理。

仅仅存在必要性并不足以保证链式思考的可监控性。虽然链式思考中包含推理过程的信息,但这些信息能以一种人类难以理解的方式呈现。例如,AI可能会使用一些特殊的符号或编码来表示其推理过程,而这些符号或编码可能无法被人类直接解读。因此,链式思考的可监控性还依赖于AI是否以人类可理解的方式展示其推理过程。

即使对于不需要链式思考的任务,AI也可能倾向于通过自然语言展示其推理过程。这种倾向性虽然不如必要性那样可靠,但在某些情况下仍然可以提供有用的信息。

在训练过程中,AI通常被优化以产生自然语言输出,这意味着它们可能会自然地展示其推理过程。例如,当AI被训练以回答问题时,它会通过逐步展示其推理过程来生成答案。这种倾向性使得研究人员可以通过监控链式思考来获取AI的内部信息。

有效CoT监控方法

OpenAI在研究论文中分享了一些有效的CoT监控方法,可以开发用于测试CoT可读性的工具。例如,利用另一个大型语言模型来评估CoT的清晰度和连贯性;也可以进行潜在推理能力的评估,这将测试大型语言模型在不外化推理过程的情况下进行推理的能力。

还可以开发用于测量CoT因果相关性的方法,例如,通过扰动CoT并检查其是否影响最终输出来评估CoT的重要性。也可以进行端到端的监控有效性评估,直接测量CoT监控在检测AI智能体行为异常方面的有效性。

需要注意的是在当前的AI模型训练中,优化目标通常是让模型产生正确的输出,而不是优化其推理过程。这种训练方式可能会导致模型的CoT与最终输出之间的关系变得模糊,从而降低监控的有效性。

例如,直接监督CoT的训练方法可能会使模型的CoT更短、更符合逻辑,或者避免包含不当内容。虽然这些优化目标可能会提高模型的对齐性,但同时也可能会使CoT不再真实反映模型的决策过程。

因此,需要研究这些优化压力对CoT监控的影响,以便在提高模型对齐性和保持CoT监控有效性之间找到平衡。

此外,当前的CoT监控方法大多依赖于对模型输出的直接分析,但这种方法可能无法捕捉到模型内部的复杂推理过程。因此,需要开发更先进的监控技术,这些技术可以深入到模型的内部结构,以更全面地理解模型的决策过程。

例如,可以开发基于推理模型的监控器,这些监控器可以利用模型内部的推理过程来检测潜在的恶意行为。此外,还可以开发允许监控器在测试时进行计算的方法,例如通过让监控器向模型提问来获取更多信息。这种方法不仅可以提高监控的有效性,还可以增强监控系统的鲁棒性。

对抗性训练也是提高监控系统鲁棒性的一种有效方法。通过让监控系统与模型进行对抗,模型试图隐藏其恶意行为,而监控系统则试图发现这些行为。通过这种方式,监控系统可以不断学习和改进,以更好地应对模型的隐藏行为。

本文素材来源OpenAI,如有侵权请联系删除

You Might Also Like

30部佳作突围!2025 AI视听创作嘉年华晋级名单揭晓,总决赛11月25日启幕

《2025 AI 大模型开发生态白皮书》正式发布 | 算泥社区

“AI幻想·未来亦城”2025AI视听创作嘉年华作品征集来了!

120万奖池,寻找最具想象力的AI创意开发者!2025骁龙人工智能创新应用大赛正式启动!

孙婷婷-LowCode低码时代 2025-07-16
Previous Article
Next Article 头部企业都在学!7月30日上海线下,零基础也能上手的 AI 工具实战课
Leave a comment

发表回复 取消回复

您的电子邮箱地址不会被公开。 必填项已用*标注

about us

关注中国低代码(LowCode)无代码/零代码领域,包括行业研究、市场报告、技术选型和媒体报道,推进低代码的技术普及、生态建设发展和产业应用,重塑IT开发和自动化的未来。

  • 游戏产业观察
  • 活动与社群
  • 联系我们
  • RPA中国
  • 数字金融网
  • 信创中国
  • Xverse元宇宙

最新专家访谈

游戏小漫书游戏小漫书

Copyright©2015-2022 北京企智未来科技有限公司 All Rights Reserved.
京ICP备19023145号-8

  • LowCode低码时代
订阅最新动态!

订阅最新低代码/零代码市场报告、研究咨询、分析师趋势以及市场活动

Zero spam,可随时取消订阅.

Removed from reading list

Undo
欢迎回来!

登录你的账号

Lost your password?