Nature发文揭露某期刊发表机器改写论文！其中不乏中国作者

来源：Nature 编辑：Priscilla 好困

【新智元导读】近日，Nature刊登了一篇有关「捏造」研究论文的文章，研究小组发现某些期刊上发表的论文并没有使用标准术语，经过GPT检测器后发现，有的论文居然连参考文献都是合成的。

「仿制意识」

「深刻神经组织」

「巨信息」

说人话好不啦！？

这些词语竟然会出现在期刊文章里！

是机翻软件翻车？

还是论文作者试图掩盖自己论文剽窃的事实？

抑或是直接用GPT模型替自己写论文？

CS论文出现奇怪的短语

前段时间，有些计算机科学期刊论文中出现了一系列让人摸不着头脑的术语。

明明已经算是非常普遍的术语，但就是不好好说。

来一起感受一下：

深度神经网络：profound neural organization（深刻神经组织）

https://www.ijraset.com/fileserve.php?FID=36960

请问这个organization它究竟哪里profound了？

行，DNN不够常见，换一个常见一点的术语：人工智能总知道了吧？

counterfeit consciousness（仿制意识/虚伪意识）……

大数据不说big data，说colossal information（巨信息）

haze figuring（霾运筹）猜到是说什么了吗？

云计算

还有用flag commotion表示signal to noise，irregular esteem表示random value，leftover vitality表示remaining energy……

真是「辣眼睛」。

nature都看不下去，发文报道了这一批学术期刊的「假」论文。

https://www.nature.com/articles/d41586-021-02134-0

法国图卢兹大学的纪尧姆·卡巴纳克（Guillaume Cabanac）带领的研究小组上个月在arXiv上发表了论文预印本。

论文表示，现在的期刊里已经出现了一种新型的合成论文。

https://arxiv.org/pdf/2107.06751.pdf

但意想不到的是，这种情况在计算机科学论文中可能比比皆是。

于是作者到引文数据库Dimensions中，用这些奇怪的短语（tortured phrases）对期刊文章进行了检索。

连「显卡」都要换，太丧心病狂了吧

GPU：designs preparing unit（设计准备器），CPU：focal preparing unit（焦点准备器）。

他们发现860多篇出现类似词汇的论文中，有500多篇刊登在了《微处理器与微系统》期刊中。

于是研究小组下载了在2018-2021年间发表在《微处理器与微系统》（Microprocessors and Microsystems）上的所有论文进行分析。

在2017-2019年间，在《微处理器与微系统》上刊登论文最多的国家和单位前五名

他们发现，还有一部分论文具有相同的提交、修订和接受日期，其中大部分出现在该期刊的特刊中。

作者怀疑，这可能是因为特刊通常是由针对特定研究领域，由客座编辑审核。

除了《微处理器与微系统》这个期刊，在其它35种期刊中，作者同样发现了用这些奇怪词汇的论文。

对于任何熟知这个领域的研究人员来说，他不可能用非标准术语来指代这个领域中众所周知的概念。

这些奇怪的词在知网上也能找到。

GPT检测器识别「假」论文

研究团队采用了一种最新的文本生成检测器，区分真实文本和合成文本。

这是一种基于RoBERTa的「GPT-2输出检测器」。

https://github.com/openai/gpt-2-output-dataset/tree/master/detector

该检测器能够给输入文本打分，显示文本的合成概率。

主要针对那些作为学术论文来说不能被接受的缺陷：

复用别人的文本、图像却没有声明
引用不存在的文献
引用不存在的公式定理等
无法理解的句子

其中，一些检测率高的文本甚至和对应的图在内容上甚至都是不相关的。

（b）为被「参考」的论文原文，其中介绍了一个漏水检测器的逻辑图。

然而通过大量修改，不仅能骗过机器查重，也让人根本读不懂这段话在说什么。

deep learning method——profound learning strategies

convolutional neural networks（CNN）——Cable News Network

natural language processing（NLP）——Neuro-Linguistic Programming

上面这些改写比之前举出的例子有过之无不及。

用GPT生成摘要和正文也就罢了，没想到连参考文献都逃不掉。

参考文献列表中包含不存在或无法识别的论文条目。

提供的超链接要么是错的，要么指向不相关的出版物。

网友讨论

paraphrase论文可能是不少人写论文的「必经之路」。

但这些论文的作者却将paraphrase的工作交给了机器。

从原始论文中复制了一堆文本之后，用诸如quillbot这类的转述机器人对文字进行了改写。

也有网友分析这显然是为「伪原创同义词替换工具」开发出了新用途。

看不见「云」，只看得到「霾」。

学者也有KPI，这在学术系统内部很常见：

为了文凭、终身职位等，你必须要发表一篇论文。

有人读过这些吗？没有，当然没有。有哪个知名的论文会引用它们吗？没有。
筛选出那些发表在一级期刊/会议上，但引用次数<1的论文，会是一个更大的问题。
这些类型的论文也确实有抄袭和数据伪造现象，但它不那么明显。

把gate（门）换成door，把complex（复杂）换成complicated。

印度的一位学生表示，他们想要毕业就必须发表一篇关于他们最后一年的项目的「论文」。

而这样的「期刊」有几十种之多，在收取一定的费用之后就会进行发表。

除了一些抄袭检查外，不会对内容进行审查。

这可能就是由大学和这些所谓的期刊组成的一个骗局。

但是，这些没有可信度的论文对于学术界来说根本没有存在的意义。

不仅可能会断送论文作者的前途，还会坏了出版社苦心经营的名声。

论文还是要认真对待的，要是太水了，

会被拉去沙漠治沙的。

参考资料：

https://www.nature.com/articles/d41586-021-02134-0

https://arxiv.org/abs/2107.06751

—完—

欢迎点赞~ 关注新智元及时了解人工智能新动态~

展开阅读全文

页面更新：2024-05-22

标签：期刊作者论文检测器微处理器人工智能特刊发文参考文献中国术语文本奇怪小组意识

1 2 3 4 5

跑分全球第4！王思聪「随手」装了台服务器，网友：壕无人性

来源：B站编辑：Priscilla 好困【新智元导读】最近王校长砸钱装了台服务器，跑分世界第四、亚洲第一！他和GEEK的差别可能就只有金钱了。现在，一起来站在有钱人的肩膀上看看都有什么「高级」的配置吧…… 王校长随随便便就跑了

不「偷窥」用户对话也能精准投放广告？Facebook研发同态加密技术

来源：外媒编辑：Priscilla 好困【新智元导读】Facebook曾计划在其社交软件上应用端到端加密技术，但这一技术「过于」安全，让Facebook陷入两难境地：要保护用户隐私的话，我怎么打小广告？于是，Facebook近日决定开始招人，开发「更

数十亿行代码训练！OpenAI升级Codex，将书面语言转为计算机代码

来源：Open AI编辑：小匀 Priscilla【新智元导读】刚刚，OpenAI 发布Codex的改进版本，将把API以私有测试版的形式发布。Codex是可以将自然语言转换为代码的AI系统，也就是那个为 GitHub Copilot提供「马达」的模型。口头命令令

1780亿个参数，这个语言模型的诞生只为挑战王者GPT-3？

来源：AI21 Labs编辑：Priscilla 好困【新智元导读】最近，AI21 Labs正计划发布一个比GPT-3更大的模型，名叫「Jurassic-1」，可以识别25万个词条，参数达到1780亿个！目的是要挑战自问世以来就占领了NLP主导地位的GPT-3，Jurassic-1

92岁武大原校长逝世！曾称「没有现代数学就不会有现代的文化」

来源：网络整理：小匀【新智元导读】近日，武汉大学发布公告，我国著名数学家、教育家，武汉大学原校长齐民友逝世，享年 92 岁。不知道学过微分方程的你可否注意到，那个曾出现在许多教材上的名字——齐民友。无比痛心！近日，武汉

假老黄才是假的！黄仁勋没有骗了全世界英伟达「元宇宙」验明正身

来源：网络编辑：好困 su【新智元导读】这两天，英伟达发布了一个视频，揭秘4月份在GTC发布会上出现的「黄仁勋」数字人。不过，老黄只是用了14秒假身而已。做一个「假老黄」使用的技术倒是没有那么新颖，不过这波Omniverse的宣传

黄仁勋身价暴涨跻身千亿富翁！英伟达5080亿美元市值创纪录

来源：外媒编辑：Priscilla 好困【新智元导读】经过2020下半年的不断波动，英伟达市值终于一路攀升，创下5080亿美元记录，位居半导体行业第二位，而英伟达联合创始人、CEO兼总裁黄仁勋的身价也涨至190亿美元。但闹得沸沸扬扬的Ar

单核媲美Zen3，能效远超 x86 CPU！AMD 副总裁竟大赞苹果 M1 芯片

来源：网络编辑：小匀、su【新智元导读】近日，AMD 公司副总裁对苹果自研的 M1 芯片表示大赞。他认为 M1 芯片的单线程性能足以媲美 Zen 3 CPU，不过，对于自家公司的未来路线图，他自信满满地说道，会更有竞争力！「我想说，Apple 为

雷军大秀新宠「铁蛋」！打滚握手会空翻，这个机器狗只要9999

来源：网络编辑：yaxin、su【新智元导读】昨晚小米发布会上，雷军现场遛狗。这是小米第一代仿生四足机器人，名叫「铁蛋」，能跑、能跳、还能后空翻。价格只要9999元，限量700台，发烧友们的福利来了。没想到，发布会上，雷军竟在台上

国科大提出首个CNN和Transformer双体基网模型准确率高达84.1%

来源：arxiv 编辑：好困 Priscilla【新智元导读】Transformer和CNN在处理视觉表征方面都有着各自的优势以及一些不可避免的问题。因此，国科大、鹏城实验室和华为研究人员首次将二者进行了融合并提出全新的Conformer模型，其

阿里女员工8000字长文曝光被P7领导性侵！CEO：震惊、气愤、羞愧

来源：weibo编辑：yaxin【新智元导读】8000字长文，阿里女员工自述受P7领导性侵事件。事发十多天，找领导搪塞，找HR拖延，被逼食堂发传单。阿里巴巴董事局主席兼CEO张勇表示，震惊、气愤、羞愧。阿里新瓜。 P7 领导（花名曲一）要求女

GitHub惹毛开源社区！不免费的Copilot只会抄？不能忍

来源：FSF编辑：Priscilla 好困【新智元导读】GitHub Copilot自从发布以来就风波不断，近日又「惹毛」了自由软件基金会FSF。FSF为捍卫用户的权益，宣布资助500美元发布白皮书，讨论Copilot生成的代码是否侵权等一系列问题。 G

暂缓上市！小马智行SPAC赴美上市计划推迟，自驾IPO路漫漫

来源：路透社编辑：Isabel【新智元导读】今日，消息传小马智行暂缓赴美上市。公司回应称：公司并未确认过上市计划抑或上市时间线，目前自动驾驶行业处于快速发展期，小马智行发展非常健康，对市场消息不予置评。自动驾驶IPO风云莫

略显潦草的苹果秋季新品发布会芯片成最大亮点

北京时间今天凌晨1点，苹果秋季新品发布会在线上举行，这也是今年以来苹果第一次就硬件新品举行专门的发布会。和之前的一些传言一样，今次发布会并没有发布新款iPhone产品，这也是近年来苹果第一次没有在9月的秋季新品发布

速度与质感！iQOO 5 Pro传奇版开箱

上个月，iQOO举办了下半年的新品发布会，并带来了iQOO 5和iQOO 5 Pro两款新品。相比之前我们评测过的iQOO 5，iQOO 5 Pro采用了120Hz的超视感3D曲面屏，搭载了120W超快闪充，并且把后置摄像头模组中的13MP人像镜头换成了8MP的

上滑加载更多 ↓

Nature发文揭露某期刊发表机器改写论文！其中不乏中国作者

【新智元导读】近日，Nature刊登了一篇有关「捏造」研究论文的文章，研究小组发现某些期刊上发表的论文并没有使用标准术语，经过GPT检测器后发现，有的论文居然连参考文献都是合成的。

CS论文出现奇怪的短语

GPT检测器识别「假」论文

网友讨论

跑分全球第4！王思聪「随手」装了台服务器，网友：壕无人性

不「偷窥」用户对话也能精准投放广告？Facebook研发同态加密技术

数十亿行代码训练！OpenAI升级Codex，将书面语言转为计算机代码

1780亿个参数，这个语言模型的诞生只为挑战王者GPT-3？

92岁武大原校长逝世！曾称「没有现代数学就不会有现代的文化」

假老黄才是假的！黄仁勋没有骗了全世界英伟达「元宇宙」验明正身

黄仁勋身价暴涨跻身千亿富翁！英伟达5080亿美元市值创纪录

单核媲美Zen3，能效远超 x86 CPU！AMD 副总裁竟大赞苹果 M1 芯片

雷军大秀新宠「铁蛋」！打滚握手会空翻，这个机器狗只要9999

国科大提出首个CNN和Transformer双体基网模型准确率高达84.1%

阿里女员工8000字长文曝光被P7领导性侵！CEO：震惊、气愤、羞愧

GitHub惹毛开源社区！不免费的Copilot只会抄？不能忍

暂缓上市！小马智行SPAC赴美上市计划推迟，自驾IPO路漫漫

略显潦草的苹果秋季新品发布会芯片成最大亮点

速度与质感！iQOO 5 Pro传奇版开箱

宜家中国的2021财年：继续加码中国为百姓带去更多美好

人工智能创新应用大赛启动，国家级平台+百万奖金+就业机

清华校友、香港科技大学准博士ICCV顶会论文被爆公然抄

华人博士获INFOCOM 2021 最佳论文奖！北邮校友，师从IEEE

单张人像生成视频！中国团队提出3D人脸视频生成模型，实现

中国芯破局！芯片大赛英雄帖发布，400万奖金池邀你「论剑

中国首次！2021年图计算挑战赛揭榜，华中科技大团队夺冠

马斯克又吹牛！一年超越波士顿动力，先赢了中国小姜再说

90后斯坦福博士论文登Science封面！AI算法准确预测RNA三

亚洲首获奖！清华大学团队获ACM SIGCOMM 2021唯一最佳学