用AI识别AI：西湖大学一项研究可高效检测AI生成文本--CYQY-生活与科技

虚假新闻、恶意产品评论、剽窃……ChatGPT、 GPT-4等AI大语言模型的应用带来便利，但其误用也带来一系列问题。西湖大学工学院张岳教授的“文本智能实验室”日前发布的一项研究提出一种高准确率、高速、低成本、通用的新文本检测方法——Fast-DetectGPT，无需训练即可识别各种AI大语言模型生成的文本内容。

Fast-DetectGPT演示网页。

据了解，该研究的论文5月发表在2024年国际表征学习大会上。第一作者、西湖大学文本智能实验室博士鲍光胜6月28日告诉记者，Fast-DetectGPT针对GPT3.5生成的文本识别率可达96%，对GPT4生成的文章的识别率达90%。与斯坦福大学2023年提出的DetectGPT检测方法相比，Fast-DetectGPT 的检测速度提高340倍，检测准确率相对提升75%，在对目前被广泛使用的ChatGPT 和GPT-4 生成文本的检测上，准确率均超过商用系统 GPTZero。

“我的研究方向是自然语言处理，注意到AI大语言模型的应用在多个领域提升了生产力，但其误用也带来了诸如虚假新闻、恶意产品评论、学术不端等问题，去年启动了这项研究，历时约半年完成。” 鲍光胜介绍，AI生成的文本内容流畅连贯，往往难以辨别，这项研究则引入了能区分机器生成文本和人类撰写文本特征差异的统计量——条件概率曲率。

“Fast-DetectGPT的操作基于一个前提：人类和机器在文本生成过程中倾向于选择不同的词汇，人类的选择比较多样，机器则更倾向于选择有更高模型概率的词汇，因为在大规模语料库上预训练的AI模型反映的是人类的集体写作行为，而非个体行为。” 鲍光胜解释，“具体而言，两种文本在词汇使用、句子结构、语法复杂度、语义连贯性等方面有所相同，我们提取覆盖这些区别特征的统计量，分析它们在两种不同文本的分布，当某个文本的统计特征值主要落在机器生成文本的分布中，模型就会判断为AI大语言模型生成的。”

鲍光胜同时表示，Fast-DetectGPT不能完全准确地识别文本是否由机器生成，只是提供概率，在Fast-DetectGPT演示网页的对话框输入一段文本，结果会显示“文本有2%的概率是机器生成”。“当被测文本混合了机器生成文本和人工撰写文本，检测会更难。” 他说，“构建一个更好的内容环境还需要各方的努力。”

	日本新增76人疑因服用小林制药红曲保健品死亡
	网友赞“古城墙能御敌又能防汛”，杭州建德市水利局：系后修的水利工程
	用AI识别AI：西湖大学一项研究可高效检测AI生成文本
	会计法完成修改，2024年7月1日起施行
	日本石川县能登半岛地震遇难者人数修正为281人
	首次使用！胡塞武装公开画面
	日照观海红日跃出彩霞漫天美不胜收
	1—5月份，全国社会物流总额同比增长5.9%
	今年各地中考有啥“新动作”
	我国有了农村集体经济组织法

相关推荐

评论