如何识别AI生成的伪原创文章
内容简介: 本文总结了6点AI生成内容的缺点。
总结成一句话,就是:AI生成的伪原创文章看似流畅,实际空洞、缺乏深度和原创性及情感表达,冰冷无趣。
还有一句话比较有意思:AI写出垃圾文章的一个原因可能是:它的训练材料本身就是一堆网上的标题党文章。
原作者:Paul Is Positive,medium。编译:叶赛文
推荐阅读原因:总结的挺全、挺好;文章高赞(有8700个赞)
原贴地址: https://medium.com/illumination/how-to-detect-an-ai-written-article-b4b33ecba3a7
(图片由Midjourney生成)
正文:
随着AI技术的发展,AI生成的伪原创文章也越来越多,充斥在互联网上。这些文章看似流畅,却缺乏深度和原创性,让人难以辨别真伪。
例如:下列这段简短的内容就是由AI生成的:
在互联网的蛮荒西部,一种新型”枪手”悄然崛起:AI内容创作者。这些机器人文字工匠以惊人的速度批量生产文章、博客,甚至是完整网站,模糊了人工和机器生成内容的界限。但别担心,识货的读者,作为文本侦探的我们会教你一些技巧,像猎犬追踪兔子一样嗅出AI创作的踪迹。
本文总结了识别AI生成的伪原创文章的7个技巧。
文章目录
1. 内容空洞,缺乏深度和原创性
首先要注意是内容缺乏深度和原创性。
AI生成的文本往往泛泛而谈,没有实质内容。
我总觉得AI写作机器人是用标题党文章训练出来的,因为它们似乎只会生产这种东西!
2. 语言浮夸,过度戏剧化
“在互联网的蛮荒西部,一种新型枪手崛起了”
这活像是某部三流B级片的开头台词。夸张做作的句子往往表明内容不仅出自AI之手,而且还经过了某个对写作一窍不通的人的”审核”。
我能想象这个创作者会说:”哇,看起来太棒了!我也要自己写个故事。”
3. 重复用词,关键词堆砌
AI生成的文章为了提高搜索引擎排名,经常会重复使用大量的关键词,读起来让人感到枯燥乏味。
例如:
“人工智能会一直这样做。如果你想要人工智能为你工作,就必须给它正确的提示。然后人工智能才会为你工作。”
这样的句子中“人工智能”一词重复出现了三次,明显是AI生成的痕迹。
4. 公式化结构,缺乏灵活性
AI生成的文章通常遵循固定的公式结构,例如使用标题、列表、项目符号等来组织内容。
这种结构虽然清晰明了,但却显得刻板僵硬,缺乏灵活性。
我自己也曾使用”5大秘诀”这类格式,后来发现AI也喜欢这一套,就戒掉了这种写法。
“总而言之……”这样的结尾虽然是人类作者的常用手法,但如果配合其他线索,你很可能会意识到这篇文章是机器人写的!
5. 语法错误,逻辑混乱
AI生成的文章虽然语法上基本正确,但偶尔会出现一些奇怪的词语搭配或逻辑混乱的句子。
例如:
“那是一个寒冷多风的黑夜。一声巨响把他惊醒,还是他还在睡觉,这一切都只是一个梦?”
这样的句子中,“还是他还在睡觉”与“这一切都只是一个梦”前后矛盾,明显是AI无法理解人类语言的复杂性造成的。
6. 缺乏情感表达,冰冷无趣
我想大多数人都会同意,AI很难捕捉到人类的真实感受和情感。
读起来冰冷而缺乏人情味,像是一本由讨厌该学科、迫不及待想糊弄完事的人写成的教科书。
有内容,但没有激情。
7.AI检测器
AI检测工具虽然不能做到100%准确,但也相当靠谱了。
如果你怀疑一篇文章出自AI之手,可以用免费的检测器试试。
再加上你自己的判断力,基本就能断定它到底是人是鬼。
这里推荐一个网站: gptzero。 月访问量有150万。
测试了一下,这个网站,对英文内容的检测效果挺好,但对中文内容的检测效果非常不好。
8.结束语
AI生成的伪原创文章看似流畅,却缺乏深度和原创性,可以通过内容空洞、语言浮夸、重复堆砌、结构僵硬、语法错误、情感缺失等特征进行识别。
9.彩蛋
针对文中反应的AI创作问题,在让AI生成文章的时候,可以把下面的要求,发送给AI。让它生成更自然的语言。
例如:
我需要你生成一篇文章,内容要求:
1.Focus on providing original insights and in-depth analysis of the topic, not just surface-level generalizations. (专注于提供话题的原创见解和深入分析,而不仅仅是表面层次的概括。)
2.Use natural, conversational language and tone. Avoid overly dramatic, hyperbolic or cliched phrasing. (使用自然、对话式的语言和语调。避免过于戏剧化、夸张或陈词滥调的措辞。)
3.Vary sentence structures and word choices to keep the writing fresh. Don’t simply repeat the same keywords and phrases. (变换句子结构和词语选择,保持写作的新鲜感。不要简单重复相同的关键词和短语。)
4.Use formatting like bold, italics, lists sparingly and only when it genuinely enhances the readability and flow of the piece. (谨慎使用加粗、斜体、列表等格式,仅在它们真正增强文章的可读性和流畅性时使用。)
5.Organize information in a logical but natural way, as a human writer would. Avoid rigid, robotic formulas and structures. (以人类作家的方式逻辑而自然地组织信息。避免刻板、机械的公式和结构。)
6.Carefully proofread and edit to eliminate any grammatical mistakes, awkward phrasing, or unnatural word choices a human wouldn’t make. (仔细校对和编辑,消除任何语法错误、笨拙的措辞或人类不会做出的不自然词语选择。)
7.Strive to understand and empathize with the human experience and infuse that authentic emotion and passion into the writing. (努力理解和同情人类经历,并将真实的情感和激情注入到写作中。)
发表评论