🐷Im体育官方版app下载(官方网站)·IOS/安卓/App Store

搜索
你想要找的

# 热门搜索 #

建党100周年70周年校庆卓越育人学术育人不言之教幸福之花

当前位置: 首页 / 新闻栏目 / 媒体关注 / 正文

AI创作出百万字小说,“人人皆能写长篇”不再是梦——Im体育官方版app下载教授王峰谈《天命使徒》

2024年07月06日

  人工智能在短篇文学尤其是诗歌创作上有所建树,但超长文本创作一直未能实现。这几年人工智能技术突飞猛进地迭代,人工智能文学创作也在不断打开新的可能。

  近日,Im体育官方版app下载教授王峰团队取得一项重大突破——他们成功创作出一部百万字的人工智能小说《天命使徒》,标志着人工智能在长篇文学创作方面迈出重要一步。

  《天命使徒》采用“国内人工智能大语言模型(以下简称“大模型”)+提示词工程+人工后期润色”的方式完成,整部小说超过110万字。一个勤奋的网络作家写作如此篇幅的小说大约需要一年,而人工智能机写仅用了一个半月。王峰团队的下一个目标是将这一时间缩短为两至三周。

  “文学正经历着飞速的变化。我们在畅想未来的时候,很可能也正在见证某些奇迹的发生。”王峰如是表达着人工智能网络文学创作的前景。

  记者:《天命使徒》讲了什么样的故事?它是怎样被创作出来的?

  王峰:《天命使徒》描写了修仙者周青不断发现自我,在黑暗和光明两极间摇摆,最后牺牲自我,不再做孤独的守护者,而要做一个与所爱之人共享平凡日常的普通人的故事。人工智能小说,不是全部脱离人,而是人机协作,整体结构由人决定,细节描写由人工智能完成,这是一种新的创意写作方式。在创作时,我们首先对网络小说的结构进行了深入研究,分析情节脉络,撰写大量提示词,然后在人工智能大模型中批量生成内容,形成整体线索连贯的长篇小说。后期通过人工介入,对大模型生成的小说进行修改,删除重复、累赘的部分,为情节跳跃的部分撰写连接语句,最终打磨成型。

  记者:小说呈现了什么样的风格,是否实现了预期效果?

  王峰:小说整体线索能够保持一致,语言具备了一定的文学性,比如开头这样写道:“他紧张地握紧了手中的武器,指尖在冰冷的金属中寻找一丝安慰。他的心跳如同在狂风中的鼓点,敲击着他的胸膛。仪式即将开始,他需要做的,就是走向山谷中心的火光处。”但是,在细节方面还存在大量跳跃和重复之处,需要人工修改。比如,大模型对每个提示词的生成内容都是有始有终的,会为每次生成内容添加一个结尾,我们称之为“光明的尾巴”,这个就需要后期调整。在语言上,人工智能小说表现出一种愣呼呼的风格,不少大模型生成的作品都是论文腔,我们只能不断微调本地大模型来提升表达水平。下一步我们会训练出一个专注于文学(小说)创作的大模型,让“人人皆可写作长篇”成为可能。

  记者:人工智能会根据提示词顺利生成适合的内容吗?创作过程中做了哪些调整?

  王峰:提示词被业界亲切地称为“耳语者”,要提供情节、环境、人物情绪及事件等信息。一开始,我们希望大模型能够生成符合我们期望的文本结果,但现实是大模型的生成结果往往显得有些“失控”。我们努力进行控制,但很快发现,几乎所有的控制都无法完成任务。提示词长了不行,短了也不行。将提示词输入大模型时,每次生成的内容都不一样,如果重复输入六七次,所生成的内容就开始重复出现了,这让我们感到有些手足无措。后来我们领悟到:既然无法完全控制大模型的输出,何苦一味追求符合自己完美构想的结果呢?这或许正是大模型本身的特点。“失控”不是它的缺点,而是它的变量,试图让它按照我们的期望产生完美的文本结果几乎是不可能的。所以,我们不断调整提示词内容,只为小说提供一个大致走向,使情节保持连续性,而具体故事细节就交给了大模型。

  记者:为什么说超长文本输出仍是人工智能的局限?未来的人工智能小说创作将是什么样的图景?

  王峰:目前,人工智能创作仍是一问一答的形式,无法实现持续输出,我们要源源不断提供提示词。对每个提示词,国内大模型平均会生成500字的内容,所以创作100万字的小说,就要提供2000个提示词。其实,大模型的长文本处理能力主要体现在其阅读理解能力上,它首先要理解我们的创作意图,然后生成连贯性的语句。

  技术是快速迭代的,随着更多大模型的研发应用,超长文本输出和人工智能阅读理解能力将不是问题。举个例子说,我大约在三年前开始组建团队,探索智能写作的方法。当时,邀请了计算机、文学、语言、哲学、古籍、数学、地理等多个领域的研究者共同探讨,基于当时的大模型技术制定了创作方案。但是,2022年底,国外某个大模型的换代升级给我们先前的设计带来巨大冲击,曾经的很多问题不再是问题。眼下人工智能技术如龙卷风般迭代,我相信现在的很多困惑和难题将来都会迎刃而解。

  目前,人工智能在文艺创作上主要影响网络文学,因为网络文学写作模式化、类型化比较强,写作者可以借助大模型的帮助进行各个部分的细节写作,比如人物生成、物品生成、人物关系图谱生成、段落写作等。这些功能都已经实现,只是质量还不高,留有相当大的探索空间。

  记者:很多人担心人工智能创作的版权问题。您怎么看待这个问题?

  王峰:关于人工智能创作的版权问题,业界正在探讨。我个人理解大致可分为两个方面:一是训练语料的问题,二是生成产品的归属问题。前者目前是最主要的瓶颈,首先我们需要获得公开语料,并对其进行进一步加工,这在研究范围内是允许的。如果进行商业化运作,就存在备案等问题,我认为一定要寻找大模型发展与语料权利保护的平衡点。至于后一个问题,生成的产品著作权到底是部分归智能平台部分归个人,还是全部归个人,要看具体的约定。这些都是未来智能写作无法避开的问题,需要研究者和实践者共同探讨。


阅读原文


记者丨刘江伟

来源丨光明日报

编辑丨王蓝萱

编审丨戴琪



XML 地图