最佳体验请使用Chrome67及以上版本、火狐、Edge、Safari浏览器 ×

创建银行
创建开票

    蚂蚁集团:让AI助手变得更"听话"的神奇配方——动态目标边距让机器人学会分辨好坏建议

    作者: 张亮@ 勾股业务 阅读592 2025/06/12 09:21:25 文章 原创 公开

    在我们日常使用ChatGPT、文心一言等AI助手时,你是否想过一个问题:这些机器人是如何学会给出"好"回答而避免"坏"回答的?就像教育孩子一样,我们需要告诉AI什么是对的,什么是错的。然而,现实中的"对错"往往并不是非黑即白的,有时候答案的好坏就像在灰色地带中摸索。最近,来自蚂蚁集团、上海数据科学重点实验室和新加坡国立大学的研究团队,发表了一项突破性研究,为这个难题提供了一个巧妙的解决方案。

    这项研究由蚂蚁集团的孙洁、伍俊康等研究人员领导,于2025年6月发表。有兴趣深入了解的读者可以通过GitHub仓库(https://github.com/sunjie279/gammaPO)获取完整的研究代码和详细资料。研究团队面临的核心挑战就像训练一位厨师:当食客给出的评价模糊不清时,厨师该如何改进自己的手艺?


    声明:本网站部分内容来源于网络,版权归原权利人所有,其观点不代表本网站立场;本网站视频或图片制作权归当前商户及其作者,涉及未经授权的制作均须标记“样稿”。如内容侵犯了您相关权利,请及时联系责任编辑(Advertisement)
    蒋建
    @ 勾股业务 ,版权号:B000007034034
    成员
    • 成交数 --
    • 成交额 --
    • 应答率
    聊天 收藏 点赞
    赏
    ¥0.77¥3.85¥7.69¥38.46¥76.92
     0  0
    
    
    分享

    微信扫一扫:分享

    微信里点“+”,扫一扫二维码

    便可将本文分享至朋友圈。

        0
      推荐商品
      验证
      二维码支付