欢迎光临
我们一直在努力

朱嘉明:智能数字新时代,AIGC与ChatGPT的13个关键问题

原标题:朱嘉明:智能数字新时代,aigc与chatgpt的13个关键问题

本文摘自朱嘉明老师为中译出版社出版的《aigc:智能创作时代》所作代序言,原文标题是“aigc和智能数字化新时代:媲美新石器时代的文明范式转型”。瞭望智库首发,原标题为“颠覆性挑战!你想象不到的一个新领域强势崛起”。

数字时代:“代码即法律”(code is law)

——劳伦斯·莱斯格(lawrence lessig)

智能时代:向量和模型构成一切(vector and models rule it all)

—— 朱嘉明

2022年,在集群式和聚变式的科技革命中,人工智能生成内容(aigc,ai generated content)后来居上,以超出人们预期的速度成为科技革命历史的重大事件,迅速催生了全新的科技革命系统、格局和生态,进而深刻改变了思想、经济、政治和社会的演进模式。

第一,aigc的意义是实现人工智能“内容”生成。人们主观的感觉、认知、思想、创造和表达,以及人文科学、艺术和自然科学都要以具有实质性的内容作为基础和前提。所以,没有内容就没有人类文明。进入互联网时代后,产生了所谓专业生产内容(pgc),也出现了以此作为职业获得报酬的职业生产内容(ogc)。 与此同时,“用户生成内容”(ugc)的概念和技术也逐渐发展,由此形成了用户内容生态。

内容生产赋予了web 2.0的成熟和web 3.0时代的来临。相较于pgc和ogc、ugc,aigc通过人工智能技术实现内容生成,并在生成中注入了“创作”,意味着自然智能所“独有”和“垄断”的写作、绘画、音乐、教育等创造性工作的历史走向终结。内容生成的四个阶段(见下图):

图0-1 内容生成的四个阶段

第二,aigc的核心技术价值是实现了“自然语言”与人工智能的融合。自然语言是一个包括词法、词性、句法、语义的体系,也是不断演进的动态体系。代表aigc最新进展的是由openai公司开发的chatgpt(generative pre-training)。它完成了机器学习算法发展中,自然语言处理领域的历史性跨越,即通过大规模预训练模型,形成人工智能技术理解自然语言和文本生成能力,能完成脚本编写、文案撰写、翻译等任务。

这是人类文明史上翻天覆地的革命,开启了任何阶层、任何职业都可以以任何自然语言和人工智能交流,并且生产出从美术作品到学术论文的多样化内容产品。在这样的过程中,aigc“异化”为一种理解、超越和生成各种自然语言文本的超级“系统”。

第四,aigc实现了机器学习的集大成。21世纪的机器学习演化到了深度学习(deep learning)阶段。深度学习可以更有效地利用数据特征,形成深度学习算法,解决更为复杂的场景挑战。2014 年生成对抗网络(gan)的出现,加速了深度学习在aigc领域的应用。aigc实现了机器学习的集大成(见下图):

图0-2 机器学习常用算法

第五,aigc开创了“模型”主导内容生成的时代。人类将跑步进入传统人类内容创作和人工智能内容生成并行的时代,进而进入后者逐渐走向主导位置的时代。 这意味着传统人类内容创作互动模式转换为aigc模型互动模式。2022年是重要的历史拐点(见下图):

图0-3 人类生成内容向aigc转换趋势

在自然语言处理(nlp)系统中,“transformer”是一种融入注意力机制和神经网络模型领域的主流模型和关键技术。transformer具有将所处理的任何文字和句子 “向量”或者“矢量”化,最大限度反映精准意义的能力。

总之,没有transformer,就没有nlp的突破;没有大模型化的aigc,chatgpt升级就没有可能。多种重要高效transformer的集合(见下图):

图0-4 多种重要高效transformer的集合模型

第六,aigc开放性创造力的重要来源是扩散模型。扩散(diffusion)模型的概念最早在2015年的论文《利用非均衡热力学的深度非监督学习》(deep unsupervised learning using nonequilibrium thermodynamics)中被提出。2020年,论文《去噪扩散概率模型》(denoising diffusion probabilistic models)中提出ddpm模型用于图像生成。 从技术的角度来看,扩散模型是一个潜在变量(latent variable)模型,通过马尔可夫链(markov chain)映射到潜在空间。

一般来说,aigc因为吸纳和依赖扩散模型,而拥有开放性创造力。

2021年8月,斯坦福大学联合众多学者撰写论文将将基于 transformer架构的等模型称为“基础模型”(foundation model),在翻译时也常译作大模型。transformer推动了ai整个范式的转变(见下图):

图0-5 基础模型“transformer”

第七, aigc的进化是参数以几何级数扩展为基础。aigc的训练过程,就是调整变量和优化参数的过程。所以,参数的规模是重要前提。chatgpt聊天机器人的问世,标志着aigc形成以transformer为架构的大型语言模型(large language mode,llm)机器学习系统,通过自主地从数据中学习,在对大量的文本数据集进行训练后,可以输出复杂的、类人的的作品。

aigc形成的学习能力决定于参数的规模。gpt-2大约有15亿个参数,而gpt-3最大的模型有1750亿个参数,上升了两个数量级。而且,它不仅参数规模更大,训练所需的数据也更多。 根据媒体报道但还未被证实的消息,gpt-4 的参数可能将达到100万亿规模(见下图):

图0-6 gpt-4的参数规模

根据学界经验,深度神经网络的学习能力和模型的参数规模呈正相关。人类的大脑皮层有 140多亿个神经细胞,每个神经细胞又有3万多个突触。所以,大脑皮层的突触总数超过100万亿个。所谓的神经细胞就是通过这些突触相互建立联系。假设gpt-4实现100万亿参数规模,堪比人的大脑,意味着它达到与人类大脑神经触点规模的同等水平。

第八,aigc的算力需求呈现显著增长。 数据、算法、算力是人工智能的稳定三要素。根据openai分析,自2012年以来,6年间ai算力需求增长约30万倍(见下图):

图0-7 从alexnet到alphago zero:30万倍的运算量增长

在可以预见的未来,在摩尔定律(moores law)以走向失效的情况下,ai模型所需算力被预测每100天翻一倍,也就是“5年后ai所需算力超100万倍”。造成这样需求的根本原因是ai的算力不再是传统算力,而是“智能算力”,是以多维度的“向量”集合最为算力基本单位的。

第九,aigc和硬技术相辅相成。从广义上讲,aigc的硬技术是ai芯片,而且是经过特殊设计和定制的ai芯片。ai芯片需要实现cpu、gpu、fpga和dsp共存。随着aigc的发展, 使得计算技术的发展不再仅仅依靠通用芯片在制程工艺上的创新,而是结合多种创新方式,形成智能计算和计算智能技术。 例如,根据应用需求重新审视芯片、硬件和软件的协同创新,即思考和探索新的计算架构,满足日益巨大、复杂、多元的各种计算场景。期间,量子计算会得到突破性发展。

第十,aigc将为区块链、nft、web3.0和元宇宙带来深层改变。aigc不可枯竭的创造资源和能力,将从根本上改变目前的nft概念生态。web3.0结合区块链、智能合约、加密货币等技术,实现去中心化理念,而aigc是满足这个目标的最佳工具和模式。

没有悬念,在web3.0环境下,aigc内容将出现指数级增长。元宇宙的本质是社会系统、信息系统、物理环境形态通过数字所构成了一个动态耦合的大系统,需要大量的数字内容来支撑,人工设计和开发根本无法满足需求,aigc可以最终完善元宇宙生态的底层基础设施。

随着aigc技术的逐渐成熟,传统人类形态不可能进入元宇宙这样的虚拟世界。未来的元宇宙主体将是虚拟人,即经过aigc技术,特别融合chatgpt技术,以代码形式呈现的模型化的虚拟人。

简言之,区块链、nft、web3.0,将赋予aigc进化的契机。aigc的进化,将加速广义数字孪生形态与物理形态的平行世界形成。

第十一,aigc催生出全新产业体系和商业化特征。aigc利用人工智能学习各类数据自动生成内容,不仅能帮助提高内容生成的效率,还能提高内容的多样性。文字生成、图片绘制、视频剪辑、游戏内容生成皆可由ai替代,并正在加速实现,使得aigc进而渗透和改造传统产业结构。 “在产业生态方面,aigc领域正在加速形成三层产业生态并持续创新发展,正走向模型即服务(maas)的未来”(见下图):

图0-8 aigc产业结构

伴随aigc生成算法的优化与改进,aigc对于普通人来说也不再是一门遥不可及的尖端技术。aigc在文字、图像、音频、游戏和代码生成中商业模型渐显。2b(to b的简称)将是aigc的主要商业模式,因为它有助于b端提高效率和降低成本,以填补数字鸿沟。

但可以预见,由于aigc“原住民”的成长,2c(to c的简称)的商业模式将接踵而来。根据有关机构预测,2030年的aigc市场规模将超过万亿人民币,其产业规模规模生态(见下图):

图0-9 aigc产业规模生态分布

现在,aigc,特别是在语言模型领域的全方位竞争已经开始。所以,发生了微软对openai的大规模投资,因为有这样一种说法:“微软下个十年的想象力,藏在chatgpt里。”近日,谷歌表宣布推出基于“对话应用语言模型”(lamda)的bard,实现其搜索引擎将包括人工智能驱动功能。

chatgpt刺激谷歌开始“创新者困境”突围。 未来很可能出现bard和chatgpt的对决或共存,也就是lamda和gpt-3.5的对决和共存,构成aigc竞争和自然垄断的新生态。

在这样的新兴产业构造和商业模式下,就业市场将会发生根本性改变:其一,专业职场重组,相当多的职业可能衰落和消亡;其二,原本支持it和ai产业的码农队伍面临严重萎缩。因为aigc极大刺激全球外包模式并取代码农。

第十二,aigc的法律影响和监管。虽然aigc这样的新技术提供了很多希望,但是将给法律、社会和监管带来挑战。在中国,继2022年1月国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合发布《互联网信息服务算法推荐管理规定》后,2022年11月,国家互联网信息办公室再次会同工业和信息化部、公安部联合发布《互联网信息服务深度合成管理规定》。该规定的第五章第二十三条,对“深度合成技术”内涵做了规定:“利用深度学习、虚拟现实等生成合成类算法制作文本、图像、音频、视频、虚拟场景等网络信息的技术。”但可以预见,因为aigc的技术日趋复杂和高速发展,国家很难避免监管缺乏专业性和滞后性。

第十三,aigc正在引领人类加速逼近“科技奇点”。现在,人工智能已经接管世界;世界正在经历一波人工智能驱动的全球思想、文化、经济、社会和政治的转型浪潮。aigc呈现指数级的发展增速,开始重塑各个行业乃至全球的“数字化转型”。说到底,这就是以aigc为代表,以chatgpt为标志的转型。这一切,在2023年会有长足的发展,特别是在资本和财富效益领域。

如果说,2022年8月的ai绘画作品《太空歌剧院》(théatre d’opéra spatial)推动aigc进入大众视野,那么,chatgpt的底层模型gpt-3.5是一个划时代的产物。它与之前常见的语言模型(bert/ bart/ t5)的区别几乎是导弹与弓箭的区别。现在,呼之欲出的gpt-4,很可能通过图灵测试。

如果是这样,不仅意味着gpt-4系统可以改造人类的思想和创作能力,形成人工智能超越专业化族群和大众化趋势,而且意味着这个系统开始具备人类思维能力,并有可能在某些方面和越来越多的方面替代人类。

特别值得关注的是被称为“人工智能激进变革先锋”的bloom(大型开放科学获取多语言模型)的诞生。 从2021年3月11日到2022年7月6日,60个国家和250多个机构的1000多名研究人员,在法国巴黎南部的超级计算机上整整训练了117天,创造了bloom。这无疑是一场意义深远的历史变革的前奏。

斯坦福大学心理学和计算机科学助理教授丹尼尔·亚明斯(daniel yamins)说过:“人工智能网络并没有直接模仿大脑,但最终看起来却像大脑一样,这在某种意义上表明,人工智能和自然之间似乎发生了某种趋同演化。”

2005年,雷·库茨维尔(ray kurzweil,1948—)的巨著《奇点临近:当计算机智能超越人类》(the singularity is near: when humans transcend biology)出版。该书通过推算奇异点指数方程,得出了这样一个结论: “在2045年左右,世界会出现一个奇异点。

这件事必然是人类在某项重要科技上,突然有了爆炸性的突破,而这项科技将完全颠覆现有的人类社会。它不是像手机这种小的奇异点,而是可以和人类诞生对等的超大奇异点,甚至大到可以改变整个地球所有生命的运作模式。”

现在处于狂飙发展状态的aigc,一方面已经开始呈指数形式膨胀,另一方面其“溢出效应”正在改变人类本身。在这个过程中,所有原本看来离散和随机的科技创新和科技革命成果,都开始了向aigc技术的收敛,人工智能正在形成自我发育和完善的内在机制, 加速人类社会超越数字化时代,进入智能数字化时代,逼近可能发生在2045年的“科技奇点”。

参考文献:

1.sohl-dickstein et al (2015), “deep unsupervised learning using nonequilibrium thermodynamics”, doi: https://doi.org/10.48550/arxiv.1503.03585.

2.ho et al (2020), “denoising diffusion probabilistic models”, doi:10.48550/arxiv.2006.11239.

3.anne trafton (2021), “artificial intelligence sheds light on how the brain processes language”, https://news.mit.edu/2021/artificial-intelligence-brain-language-1025.

4.新智元《5年后ai所需算力超100万倍》,2023.1.31. 发表于北京

5. 程序员zhenguo(2023),“梳理机器学习常用算法(含深度学习)”

6. tay et al (2022), “efficient transformers: a survey”, doi: 10.48550/arxiv.2009.06732

7. bommasani et al (2022), “on the opportunities and risks of foundation models”, doi: 10.48550/arxiv.2108.07258

8. openai (2018),“ai and compute”, https://openai.com/blog/ai-and-compute/

9. 腾讯《aigc发展趋势报告》,2023年1月31日发布

新书速递

当当购买链接 京东购买链接

《aigc:智能创作时代》

杜雨 张孜铭 著

中译出版社

2023年2月

文 | 朱嘉明 经济学家、横琴新区数链数字金融研究院学术与技术委员会主席

编辑丨王乙雯 瞭望智库返回搜狐,查看更多


责任编辑:

不会自己注册chagpt账号或者太麻烦,可以直接购买一个成品chagpt账号,直接使用!一人一号,独立使用!直接购买联系qq465693115 定制个人邮箱,非共享号码实时帮你接收验证码,非常快速

赞(1)
未经允许不得转载:梦马网络 » 朱嘉明:智能数字新时代,AIGC与ChatGPT的13个关键问题
分享到

登录

找回密码

注册