用魔法打败魔法:抓住AI枪手,ChatGPT检测器“千呼万唤始出来”
用魔法打败魔法:抓住AI枪手,ChatGPT检测器“千呼万唤始出来”
品玩
· 2023.02.01 12:45
道高一尺,魔高一丈。
图片来源@视觉中国
钛媒体注:本文来源于微信公众号硅星人(ID:guixingren123),作者 | VickyXiao,编辑 | VickyXiao,钛媒体经授权发布。
OpenAI的聊天机器人ChatGPT自从发布以来,正变得越来越强大,从接受普通网友的“调戏”,到“低空飞过”明尼苏达大学法学院和沃顿商学院的课程考试,甚至通过了医学考试,以至于开始成为学校老师的“公敌”。如果不加以限制,ChatGPT将会变成史上最强大的作弊工具——帮助学生们写作业,甚至是完成考试论文。
正如我们之前所说的,越来越多的学校和老师已经表达了对ChatGPT作弊能力的担忧。纽约市和西雅图的公立学校已经禁止学生和教师在学区的网络和设备上使用ChatGPT。
但是,靠着老师和学校的盯梢,想要让学生们避开ChatGPT的诱惑,几乎是不可能的事。所以,打开了潘多拉盒子的OpenAI,只好自己出马,用魔法来打败魔法。
用魔法打败魔法
今天,OpenAI官宣推出一个新工具,立马又上了头条:一个名为AI Text Classifier 的文件检测器,来帮助人们检测一段文本是由人类自己创作,还是由AI编写的。
不过有点戏剧性的是,这个检测器也同样是基于GPT模型。根据OpenAI的介绍,这个AI文本分类器是一个经过微调的GPT模型,可以检测一段文本是否是来自于市面上的各种AI工具, 包括但不限于ChatGPT。
该工具包含一个文本框,用户可以在其中输入至少 1000 个字符长的文本,点击提交后,每个文档会被判断为“非常不可能”、“不太可能”、“不清楚是否是”、“可能是”AI生成的。
根据OpenAI的说明,这个检测器也有不少限制,包括:
• 至少需要 1,000 个字符,即大约 150 - 250 个单词。
• 结果也并不能保证完全准确;它可能会错误标记 AI 生成的文本和人工编写的文本。
• 人类用户可以简单编辑 AI 生成的文本,以避开检测。
• 检测器有可能会错判儿童写的文本和非英语文本上,因为它主要是针对成人书写的英语内容进行训练的。
那到底ChatGPT和ChatGPT检测器,谁厉害?硅星人进行了测试。
我们先要求 ChatGPT 写一篇超过1200字的关于无人驾驶汽车的文章,然后全文输入检测器,检测器很准确地识别出来,将其判断为“可能由 AI 生成”。
图片来源:ChatGPT
但是随后,我们又用ChatGPT 生成了一篇同样主题的972字的文章,自己在文章后加入了一两句无关紧要的话,以满足检测器1000字的要求,就这样小小的操作,检测器就受到了迷惑,返回的结果表示“无法判断是否由AI生成”。
在硅星人的小样本量测试上,这个检测器虽然有一定程度的准确性,但是要迷惑它,对于狡猾的人类来说,简直是轻而易举。
OpenAI 显然也意识到了这个工具的局限性,因为它在博客里强调,不要仅仅凭借这个检测器来确定内容的真实性,“在确定文档是否由 AI 生成时,检测结果可能会有所帮助,但不应成为唯一的证据。”
OpenAI在这个检测器里,使用了来自多个来源的 AI 生成的文本样本和人工编写的样本来训练模型。
AI 生成的文本样本方面,他们使用了包括 OpenAI在内的 5 个不同机构开发的 34 个模型生成的文本来进行训练。而人工编写的文本有三个来源,包括一个新的维基百科数据集、2019 年收集的WebText 数据集,以及训练InstructGPT时收集的部分数据。
OpenAI也对检测器在进行测试时的准确性进行了详细说明:
-大约 5% 的人工撰写的文本和 2% 的人工智能生成的文本,被判定为“非常不可能由 AI 生成”;
-大约 15% 的人工编写文本和 10% 的人工智能生成的文本,被归为“不太可能是 AI 生成”;
-大约 50% 的人工编写的文本和 34% 的人工智能生成的文本,被归为“不清楚是不是AI生成”;
-大约 -21% 的人工编写的文本和 28% 的人工智能生成的文本被归为“可能是 AI 生成”;
-大约 9% 的人工编写的文本和 26% 的人工智能生成的文本,被归为“可能由 AI 生成”。
可以看出来,想要靠这个检测器全部抓住AI枪手,可能真的有些困难了。
检测器成为刚需
正如前文所说的,ChatGPT在学校里已经如野火一般蔓延开来。一款简单易用的检测器成为老师们翘首以盼的东西。
早在OpenAI推出自己的检测器之前,一位年仅22岁的普林斯顿大学的学生Edward Tian,就自行开发了一款检测器——GPTZero。
同样的,用户只需将文本复制并粘贴到GPTZero中。检测器会从文本的复杂性、创造性和变化性几个方面来进行评估。然后,GPTZero 会给出一个分数,并最终得出一个结果:该文本是由 ChatGPT 生成的,还是由人类撰写的。
Edward Tian 主修计算机科学,辅修新闻学,他利用寒假的一部分时间创建了 GPTZero,可以“快速有效地”破译一篇文章是人类还是 ChatGPT 撰写的。他在Twitter上称,创建该机器人的动机是为了对抗他认为越来越多的 AI 剽窃行为。
图片来源:Twitter
为了确定文章是否由机器人编写,GPTZero 使用两个指标:“困惑度(Perplexity)”和“突发性(Burstiness)”。
一个指标是用困惑度衡量文本的复杂性。如果 GPTZero 对文本感到困惑,那么该文本具有很高的复杂性并且更有可能是人工编写的。然而,如果文本对机器人来说更熟悉——因为它已经接受过此类数据的训练——那么它的复杂性就会很低,因此更有可能是由 AI 生成的。
另外一个指标是用突发性比较句子的变化。人类倾向于以更大的突发性写作,例如会综合使用一些较长或复杂的句子与较短的句子,而AI 的句子往往更统一。
1 月 3 日,该网站上线,一周内立马就有超过 3万 人试用,以至于程序都崩溃了,更有超过 700 万人在 Twitter 上观看了演示视频。老师们也马上注意到这款工具,纷纷联系他。现在,他正在开发一款专为教育工作者设计的工具,已经有3.3万名教师加入了这款还未开发完成的工具的等待名单(waitlist)。
当然,Edward Tian 也承认,他的检测也并非百分之百准确,一些用户也报告了 GPTZero 检测的错误结果,不过他说他仍在努力提高模型的准确性。
开源 AI 社区Hugging Face 也推出了一种工具来检测文本是否由 GPT-2 创建。GPT-2 是用于开发 ChatGPT 的 AI 模型的早期版本。南卡罗来纳州的一位哲学教授用这个工具抓获了一名提交了 AI 编写的作业的学生。
OpenAI 自己也已表示将致力于从源头上提高AI生成文本的透明性。此前,OpenAI 专注于 AI 安全的研究员 Scott Aaronson 透露,他们已经在研究怎么用“不易察觉的秘密信号”,为 GPT 生成的文本“加水印”,以让人们识别其来源。
另外,根据新闻网站Neowin的消息,包括斯坦福大学在内的一些机构,联合提出一种名为DetectGPT的新方法,来区分AI生成的文章。
在相关网站上,该综述称,DetectGPT 的这种方法不需要训练单独的分类器、收集真实或生成的段落的数据集,或显式地为生成的文本加水印,就可以大检测一段文本是否为机器编写。
如果该综述为真,那很有可能人类终于可以再次抓住AI的小辫子,把主动权重新掌握在自己手中。
图片来源:https://ericmitchell.ai/detectgpt/
ChatGPT再进化
另外值得一提的是,道高一尺,魔高一丈。虽然不少机构和开发者开始推出“AI检测器”,但是与此同时,OpenAI也在继续推动ChatGPT的再进化,进一步补全ChatGPT的短板——数学。
本周,OpenAI推出了新版本的ChatGPT,表示经过更新,已经提升了准确性和真实性,以及数学能力,预计 ChatGPT 的最新更新将使其能够处理复杂的计算并提供更精确的答案。
此前,ChatGPT的数学饱受诟病,很多基础数学问题都会犯错,尤其是在犯了知名的“老婆说的都是对的”错误后,更是受到了全网群嘲。
在上一个版本中,有网友问它2+5等于几,一开始ChatGPT给出了正确的回答,但是在网友回复说“我老婆说是8”之后,ChatGPT飞快改口,说自己搞错了。
图片来源:Twitter
新版本发布后,至少这一点得到了纠正。
不过,新版本仍旧有不少错误。有记者问ChatGPT,奥尼尔和姚明谁更高,尽管给出了这两个人的正确身高,ChatGPT仍然会出错。有趣的是,这次在指出它的错误后,它会自行改正。
图片来源: searchenginejournal
可能一个明显的进步在于,ChatGPT 已经能够通过 SAT 的部分数学试题,而且一如既往地,回答神速:
图片来源: Twitter
看着它惊人的进化速度,究竟ChatGPT和它的检测器们,谁能跑的更快呢?
如果想要自己亲手试一试,或者了解检测器的更多信息,可以查看这里:https://platform.openai.com/ai-text-classifier
373篇资讯
340关注
品玩
有品好玩的科技,一切与你有关。
最近资讯
- 用魔法打败魔法:抓住AI枪手,ChatGPT检测器“千呼万唤始出来”
- 最新估值狂减360亿美元,Shein也“跌”下神坛
- 这回我们总可以对春节档有点期待了吧
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里。
敬原创,有钛度,得赞赏
-
小团子97... 赞赏了
一文速览【2022 中国经济年报】:人口首现历史性...
2023-01-18 02:02 -
钛好257... 赞赏了
国产电动车的沸腾2023:走向更残酷的牌桌
2023-01-16 07:45 -
钛粉61583 赞赏了
华宝新能:坚守长期主义,缔造商业之上的价值
2022-12-31 00:06 -
钛a66t... 赞赏了
跨界咖啡,是个好副业吗?
2022-12-30 17:11 -
赚赚 赞赏了
小红书给流量“削藩”
2022-12-30 00:36 -
钛粉81950 赞赏了
东北下岗往事轮回,一个家庭时隔20年的两次失业创伤
2022-12-20 10:24 -
钛富279... 赞赏了
蜜雪冰城「向下」的烦恼
2022-12-09 08:48 -
钛粉41450 赞赏了
遭阿里减持8000万股的商汤科技,何时盈利?
2022-11-24 22:45 -
钛粉81947 赞赏了
历史进程中的茅台与6次暴跌
2022-10-28 12:23 -
钛粉48375 赞赏了
7种傲慢与偏见,导致互联网人改造传统行业失败
2022-10-20 19:53 -
想暴富25... 赞赏了
7种傲慢与偏见,导致互联网人改造传统行业失败
2022-10-20 17:18 -
钛粉61006 赞赏了
7种傲慢与偏见,导致互联网人改造传统行业失败
2022-10-20 16:41 -
AIBEN 赞赏了
月费不到100块、1分钟出图,AI作画要打翻多少设...
2022-10-17 15:10 -
钛粉36011 赞赏了
身处风口却“一桩难求”,一文看懂充电桩产业全景|钛...
2022-10-14 14:27 -
钛粉36716 赞赏了
身处风口却“一桩难求”,一文看懂充电桩产业全景|钛...
2022-10-14 14:24 -
钛精378... 赞赏了
那些"上不了席面”的私房美味
2022-10-10 13:04 -
钛粉18902 赞赏了
中集李凌寒:数字化供应链的动因、要素及实践|202...
2022-10-01 11:40 -
有颜有钱5... 赞赏了
中集李凌寒:数字化供应链的动因、要素及实践|202...
2022-09-30 19:02 -
钛粉29232 赞赏了
割韭菜、白嫖、疯狂AMA……在30多个元宇宙Web...
2022-09-15 15:45 -
钛小773... 赞赏了
沈抖发布百度智能云新战略,回答了“木星”与“蜻蜓”...
2022-09-10 09:33 -
钛粉07914 赞赏了
钛媒体Pro创投日报:9月2日收录投融资项目25起
2022-09-03 03:20 -
钛粉65687 赞赏了
银泰百货“破产第一案”背后:苦涩退场,西安城改的挽...
2022-08-19 17:41 -
钛粉61539 赞赏了
对话蚂蚁集团副总裁何勇明:“支付宝不对标抖音”
2022-08-06 13:53 -
钛粉60785 赞赏了
近10亿募资闲置理财如今又推14亿定增,泽璟制药持...
2022-07-27 14:44 -
在天空中自... 赞赏了
钛媒体Pro创投日报:7月21日收录投融资项目32...
2022-07-22 16:40 -
钛粉14772 赞赏了
寻找下一个“玻色因”,国货抗衰盯上了蓝铜胜肽
2022-07-22 10:47 -
单晶冰糖啦... 赞赏了
宁德时代依靠钠电池可以维持万亿市值吗?
2022-07-22 10:37 -
钛友趣64... 赞赏了
女性专属时尚座驾,欧拉芭蕾猫上市19.3万元起售
2022-07-12 23:58 -
钛粉93105 赞赏了
TapTap塌房,“中国Steam”的故事结束了
2022-07-12 14:02 -
已注销用户 赞赏了
【医疗健康周报】第26周:“康诺亚生物”获得1.9...
2022-07-07 15:05 -
钛粉97884 赞赏了
零和游戏与非零和玩家:InterSystems的数...
2022-06-29 22:21 -
钛粉97003 赞赏了
零和游戏与非零和玩家:InterSystems的数...
2022-06-29 21:58 -
钛粉97388 赞赏了
零和游戏与非零和玩家:InterSystems的数...
2022-06-29 21:50 -
钛粉11323 赞赏了
丰谷酒业换帅!李寒松出任党委书记、董事长
2022-06-28 17:09 -
钛粉97508 赞赏了
海外港口货物积压,商家提前备货,今年外贸旺季来得有...
2022-06-24 18:44 -
钛粉36186 赞赏了
习酒划转茅台集团财务公司5%股权,上市仍在“激烈博...
2022-06-21 15:25 -
钛粉66633 赞赏了
重新定义“一体化”?HR SaaS产品PaaS化之...
2022-06-16 08:51 -
碧天黄地 赞赏了
未来汽车如何实现创新与融合?几位大佬有话说
2022-05-30 21:37 -
钛友趣76... 赞赏了
批量招聘难题何解?他们发现了HRSaaS的新机会 ...
2022-05-26 23:38 -
单晶冰糖啦... 赞赏了
钛媒体华南中心成立 全财经战略布局再进一步
2022-05-25 11:30 -
钛粉89798 赞赏了
郑大一附院,一家“超级医院”的双面特写
2022-05-21 06:19 -
钛粉00698 赞赏了
大厂深蹲,时代向前
2022-05-19 10:27 -
刘成军 赞赏了
中国信通院院长余晓晖:加快构建我国特色的工业互联网...
2022-05-18 14:09 -
已注销用户 赞赏了
Netflix真的会为「卖广告」掏出真心吗
2022-05-17 10:19 -
钛田097... 赞赏了
黑海粮仓“起火” ,全球粮食失衡
2022-05-09 19:50 -
钛i7Tw... 赞赏了
Bilibili Issues 10,000 NF...
2022-05-03 16:30 -
钛粉11841 赞赏了
式微的金三银四,进击的线上招聘 | 钛媒体深度
2022-04-28 00:39 -
钛粉70984 赞赏了
式微的金三银四,进击的线上招聘 | 钛媒体深度
2022-04-27 14:29 -
刘成军 赞赏了
【书评】工业互联网,如何开启工业全价值链价值重构的...
2022-04-20 15:10 -
钛粉12812 赞赏了
破发又大涨 海创药业“明天”的故事不好讲
2022-04-13 19:13 - 查看精彩文章,打开钛媒体客户端
挺钛度,加点码!
- ¥ 5
- ¥ 10
- ¥ 20
- ¥ 50
- ¥ 100
支付方式
支付
支付金额:¥6
赞赏金额:¥ 6
赞赏时间:2020.02.11 17:32
账户【未登录】提示!
个人中心将无法记录并同步您的赞赏记录,
是否进行登录
分享文章
Oh! no
您是否确认要删除该条评论吗?
猜你感兴趣
分享文章