编者注:今天的文章由Saikiran Chandha撰写。赛基兰是SciSpace- - - - - -唯一可以发现、阅读、撰写和发表研究论文的综合研究平台。
研究表明企业越来越依赖人工智能(AI)在过去的几年里。组织在至少一个职能或业务部门中嵌入的人工智能功能的平均数量从2018年的1.9个增加到2022年的3.8个。
不仅仅是企业;甚至普通大众也开始注意到这一点。人工智能模型GPT-3,DALL-E,ChatGPT,Alphacode一直以来镇上的话题在社交媒体上。因此,生成式人工智能的进步现在也对科学和学术界产生了影响也就不足为奇了。一位研究人员用GPT-3写一整篇论文简单的提示。这篇论文最初在评审后被一家期刊拒绝,但随后被另一家期刊提交并接受——ChatGPT被列为作者之一——这一趋势越来越多常见的这些天。
GPT-3或生成式预训练Transformer 3,是一个大型语言模型,它使用预训练的数据根据提示生成输出。它已经接受了近570g文本的训练,这些文本主要由来自各种来源的互联网内容组成,包括网页、新闻文章、书籍,甚至到2021年为止的维基百科页面。
所以当你用自然语言输入一个提示时,它会使用训练数据来发现模式,然后给你最合适的回应。你可以用它来完成句子,起草引人注目的文章,做基本的数学,甚至写计算机代码。
在本文中,我们将讨论GPT-3和相关模型对研究的影响,潜在的问号,以及学术出版商可以采取的措施来保护他们的利益。
GPT-3对学术研究的影响
从那时起,这个模型就一直存在2020它已经被用于开发一系列新的应用程序,如聊天机器人、翻译工具和搜索引擎等。
也许人们谈论最多的功能是它的功能拟人论文。你可以用一个基本的提示来生成一篇原创文章,比如“起草一篇约800字的关于人工智能如何影响学术界的学术论文”。
GPT-3的深度学习算法允许它从头开始写作,自动完成句子,并在你已经写好的基础上进行构建。微软计划整合这一模式它的办公套件包括Word、Powerpoint和Outlook。到目前为止,他们已经在Edge浏览器、必应搜索和协作工具Teams中添加了该模型的一个版本。谷歌和亚马逊等其他科技巨头也在人工智能领域推进。谷歌被设置为启动吟游诗人这是一种对话式人工智能服务,而亚马逊网络服务则是与人工智能初创公司“拥抱脸”合作为客户创造具有成本效益的人工智能应用。
现在,这只是GPT-3故事的一小部分。自其发布以来开放的API世界各地的研究实验室和公司都在开发基于该模型的新应用程序。ChatGPT它是GPT-3的兄弟模型,正在彻底改变我们与机器交互的方式。它基于对话框的方法已经吸引了公众,因为它使他们能够用简单的语言完成提示和问题——从菜单、按钮和预定义命令的改变。
这些发展肯定会改变写作工作流程。确定谁写了什么——人类还是人工智能——将变得具有挑战性。在人工智能的帮助下,将想法和想法完全变成文件上的充实点将与以前不同。
将这项技术引入学术界引发了复杂的问题。GPT-3可以被列为作者吗?版权在其中扮演了怎样的角色?这种用法的伦理问题是什么?
从好的方面来看,非英语母语者会更容易克服语言障碍吗。他们将能够写出高质量的研究论文,而不用担心语法或句法问题。此外,人工智能辅助写作可以帮助研究人员节省时间,使他们能够专注于完善他们的想法,更好地组织他们的论点,并进行更深入的分析。
此外,您甚至可以命令模型以某种方式格式化输出。排版是一项通常需要14小时一篇。
简而言之,这些能力使研究人员能够更快地完成他们的手稿,并更快地与世界分享突破。
这导致了一系列全新应用的诞生:从开发电子表格公式和创建Python代码来编写SQL-所有这些都来自简单的文本提示。这还不是全部,你也有工具来帮助你的文献搜索和阅读过程。
在这一点上,我想宣布我竞选SciSpace。我们最近为我们的研究论文库添加了一个人工智能助手。它有助于分解、总结和翻译研究论文,以及解释数学、表格和文本。我们并不孤单。还有其他工具可以帮助从研究论文中提取更多信息。
除此之外,还有一些模型DeepMind的AlphaFold可以预测蛋白质结构OpenAI的法典这可以解决复杂的大学数学问题或提供编码协助。
警惕GPT-3的原因
GPT-3的批评者对该模型产生的输出提出了许多问题,从抄袭、偏见到缺乏可靠性。这是理所当然的。
一个2021年调查发表在微处理器和微系统透露该杂志发表了近500篇可疑文章。该研究表明,它们包含了破碎的引用,科学上不准确的陈述和无意义的内容,使得这些论文不可复制。调查人员认为,作者可能使用了GPT和反向翻译软件来隐藏抄袭和放大他们的手稿。
另一个问题是GPT-3产生的输出可能存在偏差。该模型是在非结构化网络数据上训练的。因此,它可以很容易地借用现有的对各种亚群体的刻板印象和信念,比如种族、政治意识形态、宗教或性别。过去的调查揭示了严重的偏见,导致进攻输出。因此,为了研究目的使用这些模型有可能用歧视性的语言和毫无根据的同质化来污染科学。
该模型是在2021年的数据上训练的,所以除非你在提示中提供了所有正确的信息,否则它可能会为你提供过时的输出。另外,GPT-3倾向于产生幻觉,这意味着它产生了一个没有意义或不正确的输出。例如,当你问一个关于特定理论的问题以及它为什么被推导出来时,模型可能会回答一些完全无关或毫无意义的东西。
为什么会发生这种情况?归根结底,互联网包含了我们的思想、数据和事实,但没有推理、逻辑或上下文来真正理解它们。所以,GPT-3没有办法知道什么是正确的,什么是正确的,或者为什么事情是这样的。模型最终会产生概率输出,而不理解问题的背景。
避免此问题的一种方法是使用思维链提示技术,包括为模型提供示例和说明,帮助将问题分解为更小的步骤,最终导致正确的答案。
还有其他伦理和道德问题。什么时候用人工智能写论文对吗发表论文被用作研究人员能力、任期和晋升的晴雨表?此外,如果作者使用人工智能工具写论文,这是否意味着工具应该归功于工作,而不是作者?
学术出版商能做些什么?
首先,必须认识到:
- 学术界的很大一部分处于“不发表就灭亡”的模式
- 造纸厂和掠夺性期刊不会消失
- 英语主导着学术和科学论述
GPT-3和其他人工智能模型正在发展,对学术界具有巨大的潜力。然而,与写作相关的人工智能技术并不新鲜——谷歌Docs、MS Word和移动键盘已经提供了单词和短语建议、拼写检查和语法更正。gpt -3支持的写作工具现在更进一步:它们使人工智能能够有概率地预测和完成整个句子和段落,而不是提供一个单词列表供选择。
但与此同时,学术出版商需要保护其期刊的完整性,不受操纵、虚假信息、剽窃和偏见的影响。
面对GPT-3带来的变化,发行商可以采取以下一些步骤来确保自己的持续成功:
- 使用AI工具进行质量控制:集成AI工具进入您的内部筛选工作流程,作为质量控制的第一线。使用它们来确定论文是否符合期刊的范围,检测文本重叠和抄袭,检测格式和语法错误,并评估实验设计的适当性。它应该帮助编辑和同行审稿人处理大量的投稿,减少他们的工作量,并专注于最相关的论文。
- 建立一个清晰的框架:围绕人工智能工具的使用制定政策。它应该概述可接受的研究方法,作者必须遵守的道德标准,以及不遵守的后果。此外,如果发行商计划在他们的工作流程中使用AI工具,那就告诉他们找到相关的同行审稿人,那么他们必须清楚地概述如何在这个过程中减少偏见或偏见的风险。
- 监测现有文件:寻求研究诚信专家的帮助,AI侦探,以及AI图像检测工具,以确保发表的文章不存在图像复制欺诈、无意义内容等折磨的短语。撤回不符合期刊标准的论文。
- 作者:教育撰写和提交研究论文是一项乏味的活动。通常情况下,研究人员可能需要帮助。创建一个博客或YouTube频道,并用它来解决这些知识差距和歧义。此外,利用它来建立对造纸厂、掠夺性期刊的认识,以及使用人工智能工具的伦理和道德影响。利用现有的资源由组织,如新利18luck在线娱乐网应对和CSE,他们就出版道德提供实用的建议和协助,以确保提交的作品符合公认的标准。
- 提供额外服务:由于大多数论文都是用英语发表的,不讲英语的人为了学术上的成功被迫用英语写作。许多人认为这是一种负担,使得交流新想法和新见解变得困难。出版商可以求助于人工智能翻译工具,比如DeepL为了捕捉语言中最微妙的细微差别,并在翻译中保留这些细微差别。这将使他们能够收到更多的投稿,更快地准备好出版物,并确保非英语论文忠实于最初的意图。
- 鼓励开放获取:敦促作者将他们的预印本存档到存储库中,比如ArXiv或者共享他们的数据集Zenodo将有助于提高透明度和公开性。更大的可见性将导致更多的呼叫和暴露任何可疑的行为。对于付费论文,出版商应该有一个专门的内部团队来验证原始数据,寻求读者反馈,并监控网络上的评论,以确保准确性和可信度。
- 检查提交文件的完整性:确保积压中的所有论文都经过审核GPT探测器。它应该有助于识别使用人工智能来塑造其手稿核心理论的作者。此外,使用数据库维,斯高帕斯,科学网检测虚假或编造的引用——这在GPT-3生成的论文中很常见。AI经常引用不存在或与主题无关的论文。
通过遵循这些步骤,出版商将更好地识别潜在问题,并制定政策,确保其出版物的完整性。
最终的想法
考虑到发展的速度,人工智能工具在科学研究和交流中的作用只会越来越大。影响有多好或多坏,目前还没有定论。
一方面,它可以使研究和知识民主化。另一方面,它可能会加剧信息过载,使更多人能够利用我们教育系统的缺陷,我们的教育系统往往奖励量化成就。
学术出版商和其他利益相关者需要仔细评估人工智能工具的影响,并采取必要措施,确保其使用不会导致欺诈活动或不道德的研究实践。
讨论
关于“GPT-3写了一篇关于自己的完整论文”的3个想法。出版商应该担心吗?"
另一个建议:提前决定你是打算为你的作品申请版权还是将这些材料用于专利申请。人工智能的使用可能会使这一过程复杂化,甚至被禁止。特别是当使用没有文件证明的时候。
亲爱的。当然,科学出版商尤其应该极度关注出版中的两个基本原则:由于版权和其他法律问题,责任必须在人身上,其次是与此相关的抄袭(在上面的文章中已经提到过)。WAME采取的行动是适当的,因为它规定使用GPT撰写/发表论文是非法的。在格式和语法方面都很完美,但在内容方面却很垃圾,GPT还有很长的路要走。
我很欣赏这篇及时的文章,以及在我们进入这个新时代时所提供的技巧和资源。新利18luck在线娱乐网我给GPT-4提供了一个关于物理主题的简短摘要和一些参考文献,并要求GPT根据这些输入撰写一篇完整的文章。然后我让GPT-2 Output Detector和GPTZero评估完全生成的部分,这两个工具都报告内容完全是人工生成的。事实上,GPT-2输出检测器对完整生成的文本进行了99.97%的真实评分。然后我直接问ChatGTP它生成的文本是人写的还是人工智能写的。他们的回答是“这篇文章可能是人类写的”,并附上了一段解释原因的理由。