详细内容

Research papers are increasingly being written by artificial intelligence.Credit: Yagi Studio/Getty
究竟有多少科学文献是由人工智能生成的呢?针对人工智能在各类学术文献中所占比例的研究表明:在学术期刊、预印本存储库以及经过同行评审的论文中,人工智能所贡献的文献比例各不相同。这一情况表明,相关数据正在迅速变化,目前还难以准确把握其具体情况。
研究界许多人担心的是,大型语言模型产生的质量低劣或完全虚假的研究成果,可能会超出现有质量控制系统的检测能力,从而污染学术界的研究成果。
“我们脚下的土地正在以我们完全无法预料的方式发生变动,”科罗拉多大学博尔德分校的计算机科学家玛丽亚·安东尼娅克说道。
“我们正处于一场日益激烈的‘军备竞赛’中”,新加坡南洋理工大学的干细胞生物学家理查德·谢这样说道。“这场竞赛的参与者,是一方那些不择手段利用人工智能的人,另一方则是那些试图限制或监测人工智能发展的人。”

AI检测器
人们对科学文献中由人工智能生成的内容所占比例的担忧,其实反映了更广泛的在线趋势。据加州旧金山的一家名为Graphite的私营公司对55,000篇新发布的网页进行的分析显示,3月底时,由人工智能生成的论文数量已经超过了人类撰写的论文数量。这项分析结果被分享给了《自然》杂志。
人工智能在科学文献的撰写方面有着潜在的用途,能够加速研究进展。不过,由人工智能生成的内容也可能带来问题,因为这些内容可能被用来制作虚假或质量低劣的论文。
为了解决这个问题,研究人员开始利用人工智能检测工具来评估这一现象的严重程度。不过,现有的某些检测工具无法区分那些仅经过人工智能处理过的文本,与那些完全由人工智能生成的文本。此外,这些工具在界定“人工智能生成”的文本标准方面也存在差异,因此有可能将人类撰写的文本误判为人工智能生成的文本。
不过,它们还是能够为我们提供一些关于人工智能应用趋势的线索。
暴风雨中的雨滴
在4月27日发表的一项研究中,研究人员使用了纽约市Pangram Labs开发的工具,对2021年1月至2026年2月期间提交给《组织科学》期刊的近7,000篇论文摘要以及约8,000份同行评审报告进行了分析。据研究人员称,这是首次有研究尝试估算某本学术期刊在评审过程中所使用的由人工智能生成的内容的比例。
研究显示,自2022年11月ChatGPT作为首个向公众开放的大型语言模型问世以来,提交的稿件数量增加了42%。研究指出,这一增长趋势主要是由人工智能技术推动的。研究人员还估计,到今年2月时,那些包含超过70%由人工智能生成的文字的稿件数量,比2024年初的水平增加了一倍多。此外,有超过30%的同行评审报告也包含了部分由人工智能生成的文字。
包括谢和安东尼克在内的其他研究人员也在试图统计目前网络上由人工智能生成的研究内容的总量。不过,由于涉及的文章数量庞大,这项任务几乎不可完成。谢利用Pangram的人工智能检测工具,对去年发表在《科学》、《自然》和《细胞》等期刊上的约5,000篇生物医学学论文进行了筛查。
他的分析结果发表在1月份的一篇预印本中。研究显示,有六篇论文被确认为完全由人工智能生成,而八分之一的文章中包含了人工智能生成的文字内容。
她预计,未来几年利率会上升。“我们正处于这个新时代的起步阶段。我们现在所看到的,不过是即将到来的风暴的最初迹象而已。”他说道。
在1月份发表的另一篇预印本研究中,Antoniak和她的同事们使用了两种人工智能检测方法,对2020年至2025年间上传到arXiv的124,000多份手稿进行了分析。他们发现,在计算机科学领域中,含有人工智能生成内容的预印本比例从2023年的约7%上升到了2025年的43%。而同一时期内,该领域中不含人工智能生成内容的手稿中,含有此类内容的比例也从约3%上升到了23%。
安东尼娅克的研究没有区分那些完全由人工智能生成的文本与那些仅包含部分人工智能生成内容的文本。她指出,该研究也没有对相关作品的质量进行任何评价。
最佳猜测/最有可能的答案
一个更普遍的问题是:目前缺乏准确可靠的方法来确定在所有科学文献中,有多少内容其实是人工智能生成的。
“这是个非常复杂的问题。一方面,我们需要找到一种可靠的方法来量化这些比率,但由于我们没有相应的基准数据,这就很难实现。另一方面,使用人工智能的方式也有多种不同之处。”安东尼亚克说道。
谢表示,为了跟上不断进步的AI技术的发展,检测手段也需要不断升级和完善。“人们会想出越来越多的方法来让文本看起来更像人类所写的文字,从而逃避检测器的识别。”他补充道。
除了人工智能检测技术之外,“水印”之类的方法也有助于在未来发现那些未被披露的人工智能应用。最近,某大型人工智能会议采用了创新的“水印”技术,来识别那些在提交给会议的论文的同行评审意见中由人工智能生成的文字。结果,有497篇论文因此被拒收。
伊利诺伊州芝加哥市西北大学费恩伯格医学院的研究伦理与诚信问题专家穆罕默德·霍塞尼表示:“这类工具目前仍处于发展初期。在它们能够让我们更轻松地区分出哪些文本是由人工智能生成的,哪些是经过人工智能处理的之前,我们仍应对那些试图评估当前有多少文献或互联网内容是由人工智能产生的研究持谨慎态度。”
(文章来源于 Nature : https://www.nature.com/articles/d41586-025-03504-8 ,如有侵权请联系删除)