OpenAI训练新模型给ChatGPT找茬

i黑马 • 3天前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

当地时间6月27日，OpenAI 宣布基于 GPT-4 训练了一个名为#CriticGPT# 的模型，用于查找 ChatGPT 聊天机器人输出内容中的错误。它可以撰写评论，强调 ChatGPT 生成答案中不准确的地方。

据介绍，CriticGPT 旨在协助人类 AI 训练员完成工作 —— 使用一种名为“从人类反馈中强化学习（Reinforcement Learning from Human Feedback，RLHF）”的技术来训练、改进 GPT-4 的回答。然而随着 ChatGPT 的准确性日益提升，错误越来越隐蔽，导致 AI 训练员的工作越来越“难做”。