谷歌公布模型训练框架ASPIRE，可让AI自我判断输出内容正确性

谷歌公布模型训练框架ASPIRE，可让AI自我判断输出内容正确性 - 果核剥壳

2024年1月23日上午11:32 • 圈内新闻

【氮气AI】果核旗下AI聚合聊天工具，支持GPT4.0等多种模型和绘画【免费体验】

1 月 23 日消息，谷歌日前发布新闻稿，介绍了一款专为大语言模型设计的 ASPIRE 训练框架，该框架号称可以增强 AI 模型的选择性预测能力。

谷歌提到，当下大语言模型在自然语言理解和生成内容方面发展迅速，已被用于构建各种创新应用，但要应用于高风险决策类场合依然不妥。这是由于模型预测具有不确定性及“幻觉”可能，因此谷歌开发了一款 ASPIRE 训练框架，为系列模型引入了“可信度”机制，即 —— 模型会输出一系列答案，每个答案都会具有正确概率评分。

在技术层面，网友注意到该训练框架主要分为三阶段，分别为“特定任务调整”、“答案采样”和“自我评估学习”。

其中“特定任务调整”阶段是对已接受过基础训练的大型语言模型进行深入训练，专注于强化模型的预测能力。研究人员主要为模型引入一系列可调参数，在特定任务的训练数据集上微调预训练语言模型，从而提升模型预测性能，让模型能够更好地解决特定问题。

第二阶段为“答案采样”，经过特定微调后，模型可以利用先前学习到的可调参数，为每个训练问题生成不同的答案，并创建用于自我评估学习的数据集，生成一系列可信度较高的答案。研究人员同时使用 “集束搜索（Beam Search）”方法及 Rouge-L 算法来评估答案的质量，并将生成的答案及评分重新输入给模型开启第三阶段。

而在第三阶段“自我评估学习”中，研究人员为模型添加一组可调参数，专门用于提升模型自我评估能力。该阶段的目标是让模型学会“自己判断输出的答案准确性”，从而让大语言模型在生成答案时，还会附上答案的正确概率评分。

谷歌研究人员使用 CoQA、TriviaQA 和 SQuAD 三个问答数据集来验证 ASPIRE 训练框架的成果，据称“经过 ASPIRE 调整的 OPT-2.7B 小模型，表现远超更大的 OPT-30B 模型”。而这项实验结果也同时表明，只要经过适当的调整，即使是小语言模型，在部分场景下也可以超越大语言模型。

研究人员总结称，ASPIRE 框架训练能够显著提升大语言模型输出准确率，即使是较小的模型，也可以在经过微调后进行“准确且有自信”的预测。

如果您喜欢本站，点击这儿不花一分钱捐赠本站

这些信息可能会帮助到你：下载帮助 | 报毒说明 | 进站必看

修改版本安卓软件，加群提示为修改者自留，非本站信息，注意鉴别

发表回复

立刻 2024年7月27日

我现在用flix

评论于 LocalSend(传输工具) v1.15.2 绿色版
你就拿这个考验干部 2024年7月26日

新版本有中文了吗？不是win 客户端只有英文语言吗

评论于 Bitwarden(密码管理器) v2024.6.4
爱学习的人 2024年7月26日

秒点远控骗子软件已经卷款跑路了

评论于【果核视频】不好意思，这款远控软件，我称他为神器
andi 2024年7月26日

不会突然跑路吧

评论于流量卡牛逼哄哄的无限流量卡
simmy 2024年7月26日

太感谢了，这个能直接拖放备份，爽！

评论于 AirExplorer Pro v4.0.1 便携修改版
609686489 2024年7月26日

录制war3的时候，24-25分钟左右就崩溃，不如以前版本还没以前版本的备份了，难受

评论于 Bandicam v7.1.2.2451 便携特别版
5284 2024年7月26日

想学习下python,这个看起来不错

评论于 (新版)Python分布式爬虫与JS逆向进阶实战
mumm1 2024年7月26日

官网也没有测试版的入口啊

评论于 PixPin(截图工具) v1.8.20.0
什么都想知道先生 2024年7月26日

这种博眼球的臭傻逼是真的该死

评论于使用 AI 软件生成未经证实假新闻，一网民被处以行政处罚
Oly 2024年7月26日

视频不全，有的是大小为0的文件

评论于黑马精品Java架构师实战训练营第4期

谷歌公布模型训练框架ASPIRE，可让AI自我判断输出内容正确性 - 果核剥壳

相关推荐

发表回复