（报告出品方/作者：华西证券，刘泽晶）

AI纪元，ChatGPT

ChatGPT：AI的旷世巨作

ChatGPT是一种聊天机器人软件: 全名为Chat Generative Pre-Trained Transformer，是OpenAI于 2022年11月推出的聊天机器人，该软件使用方便快捷，只需向ChatGPT提出需求，即可实现文章创作、代码创作、回答问题等功能。

ChatGPT功能强大: ChatGPT目前仍以文字方式互动，而除了通过人类语言交互外，还可以用于相对复杂的语言工作，包括自动文本生成、自动问答、自动摘要等在内的多种任务。如：在自动文本生成方面，ChatGPT可以根据输入的文本自动生成类似的文本，在自动问答方面，ChatGPT可以根据输入的问题自动生成答案。还具有编写和调试计算机程序的能力。此外， ChatGPT有望一定程度上替代搜索引擎。

ChatGPT: 前景广阔，打开海量应用场景

ChatGPT关注度较高: 截至于2022年12月4日，上线仅5天，OpenAI估计 ChatGPT已经拥有超过100万用户。此外，根据《纽约时代》报道， GPT 的下一个版本GPT-4有望于 2023 年某个时候推出。

ChatGPT打开海量应用场景: ChatGPT应用场景广泛，拥有潜在空前蓝海，其功能覆盖各个板块，我们将其分成生成应用和布局、搜索和数据分析、程序生成和分析、文本生成、内容创作、一般推理和其他七部分。我们认为基于其庞大的算力和算法分析，领域有望覆盖教育、科研、游戏、新闻等多重板块并有望持续拓展，市场潜力较大。

ChatGPT的前世今生

我们认为，ChatGPT经历了人工智能发展的三大趋势。机器学习: 2012年左右，随着基础算力的提升，全球已经开启人工智能热潮即大数据时代。政策、资本先行，应用场景逐渐丰富。机器学习是AI的一种技术方向，无论是自然语言处理还是机器视觉都是机器学习的应用。神经网络: 2015年左右开始繁荣爆发，神经网络是实现AI深度学习的一种重要算法，是通过对人脑的基本单元神经元的建模和链接，探索模拟人脑系统功能的模型，并研发出的一种具有学习、联想、记忆和模式识别等具有智慧信息处理功能的人工系统。 Transformer算法: 2017年左右，是图型神经网络的一种，Transformer开始广泛应用于机器翻译之中，逐步取代循环神经网络(RNN)，不再使用递归，而是采用了注意力机制进行优化，通过自我监督学习或无监督方法进行训练，优点在于建模能力强，通用性强，可扩展性强，能够更好的进行运算。而ChatGPT则是在该算法上不断迭代、演进、升级最后生成的一种算法。

从算法模式的版本上，ChatGPT已经经历了四个版本，未来有望生成新版本即GPT-4。 GPT-3是GPT系列第三代语言预测模型，是OpenAI创建的GPT-2的继任者: GPT-3的应用包括帮助Viable公司快速理解客户反馈、帮助 Fable Studio 完成VR角色的虚拟人物生成，实现与自然人对话、帮助Algolia实现快速予以、论文搜索等(算法准确率高达91%，准确率是BERT算法四倍)。我们认为，InstuctGPT可以理解成是GPT-3的微调版本: InstructGPT由GPT-3语言模型提供支持，是一种对齐语言模型以遵循指令， InstuctGPT模型比GPT-3 更擅长遵循指令，且回答更真实，且有害情绪输出大幅下降例如暴力情节。

我们认为，ChatGPT可以理解成是GPT-3.5的微调版本: ChatGPT 是从GPT-3.5 系列中的一个模型进行微调，相较于InstructGPT， ChatGPT效果更加真实(拥有非常强的泛化能力和生成能力)，模型的无害性实现些许提升(生成带有有害、歧视、偏见等情况的有问题样本的概率本身就会很低)，编码能力更强(在GPT3.0积累的大量Coding代码基础上，部分OpenAI内部员工参与了数据采集工作)。

GPT-4有望打开海量应用: OpenAI 首席执行官称，GPT-4有望成为多模态的人工智能，根据openAI 创始人Altman消息，参数预计更大，计算模型优化有望实现更优化，且GPT-4将是纯文本模型(不是多模态)，我们认为GPT-4的推出潜在商业价值巨大，模型更具备“拟人化” 的功能，文本生成和内容创作有望更加丰富，并有望进入文字工作的相关领域，例如新闻、金融等相关行业。

CHATGPT的一小步,AI的一大步

ChatGPT与InstructGPT的相同点：使用来自人类反馈的强化学习(RLHF) 来训练该模型。 ChatGPT与InstructGPT的不同点：数据收集设置略有不同、并加入了强化学习近端策略优化，可以理解成在“人脑思维”的基础上加入了“人类反馈系统”，是一种奖励模型。因此效果更佳真实、模型的无害性实现些许提升，编码能力更强。

ChatGPT的背后: 强大的AI公司OpenAI

全球AI的“领军企业”OpenAI： OpenAI 是美国一个人工智能研究实验室，是促进和发展友好的人工智能，使人类整体受益。OpenAI成立于2015年底，组织目标是通过与其他机构和研究者的“自由合作”，向公众开放专利和研究成果。此外根据新浪消息，埃隆·马斯克为公司的创始人，但于2018 年提出离职，原因是特斯拉与AI的关联越来越深，外界担忧特斯拉将运用OpenAI的技术实现升级。

根据Insider消息，ChatGPT于2022年11月发布后，OpenAI 估值已涨至290亿美元；此外根据新浪科技消息，OpenAI最近告诉投资者，预计2023年营收将会达到2亿美元，2024年将达到10亿美元。

OpenAI不仅仅是ChatGPT: Open AI的业务不仅仅局限于 ChatGPT领域，还包括Dall·E2、Whisper等项目。DALL·E2 可根据自然语言的描述创作逼真的绘画作品，Whisper是一种语言识别系统，其鲁棒性和准确性极高，支持多种语言的转录并翻译成英文。

OpenAI的商业模式

OpenAI的商业模式即API接口收费: 客户可以通过OpenAI的强大AI模型构建应用程序，例如访问执行各种自然语言任务的 GPT-3、将自然语言翻译成代码的 Codex 以及创建和编辑原始图像的 DALL·E。公司按照不同项目的AI模式和不同需求进行收费，对于AI图像系统按不同的图片分辨率定价；对于AI语言文字系统按字符单价收费，对于调整模型和嵌入模型按照文字单价收费，并根据不同的调用模型区别定价。目前DALL·E 方面，已有超过 300 万人在使用，每天生成超过 400 万张图像。其API具备快速、灵活、可拓展等性质。

我们认为OpenAI的商业模式属于底层模型开放性标准化SAAS服务模式: 公司通过提供相关AIGC代码，提供自动图形模型或语言模型生成等产品，用户通过其API接口接入，并支付平台费用获取相关图像、语言、代码调整服务，OpenAI可获得付费订阅式的SAAS费用，我们认为该商业模式用户粘性极强。目前我国AIGC商业仍处于初期阶段，部分文本、图像等生成的公司仍处于初期阶段，以辅助生成内容服务为主，部分公司已经进入AIGC开发阶段，但仍处于免费试用、获取流量阶段，我们认为未来相关公司SAAS模式有望形成。

AIGC，星星之火可以燎原

ChatGPT促使AIGC快速商业化发展

AIGC的含义: AIGC(AI Generated Content)即人工智能自动生成内容可以在创意、表现力、迭代、传播、个性化等方面，充分发挥技术优势，打造新的数字内容生成与交互形态。我们认为，GPT系列是AIGC的一种商业化方向。

AIGC有望打开海量空间

AIGC也被认为是继UGC、PGC/UGC之后的新型内容生产方式: UGC是用户生成内容，起源于Web2.0时代，例如博客、视频分享、Youtube等应用方案；PGC/UGC分别指专业生产内容与职业生成内容，例如视频创收平台优酷、土豆平台节目《暴走漫画》、《万万没想到》、或是抖音、快手等用户生产内容。我们认为AIGC在创作成本上具有颠覆性，而且具备降本增效的多重优势，并且有望解决目前PGC/UGC创作质量参差不齐或是降低其有害性内容传播等问题，同时创意激发，提升内容多样性，此外价格上OpenAI最贵的AIGC语言模型达芬奇为每0.02美元750个单词，AIGC图型模型价格仅为0.020美元一张。

AIGC有望赋能“千行百业”，我国已有应用案例: 2022年，随着“两会时间”开启，依托百度AIGC技术的数字人主播度晓晓正式“上岗”，成为全国两会报道中一道独特的风景线。此外，冬奥会期间，百家号TTV技术验证了AIGC的发展潜力。来自人民网、中国青年网等多家媒体通过百家号TTV技术进行内容生产，持续发布实时赛况等题材的短视频作品，单条播放量超70万。

梳理AIGC的受益厂商

我们认为AIGC的出世会产生革命性的影响，同时有望赋能千行百业，随着AI写作、AI作图、AI底层建模、AI生成视频和动画技术逐渐成熟，AI有望进入新纪元，带来空前蓝海，同时对现有娱乐、传媒、新闻、建模等应用具有颠覆性的创新。

具备自研AI处理器的厂商可以为AIGC的神经网络提供算力支撑:人工智能的本质及数据的海量运算，相较于AI算法，数据才是重中之重。算力作为数据加速处理的动力源泉，其重要性不言而喻。AI处理器芯片可以支持深度神经网络的学习和加速计算，相比于GPU和CPU拥有成倍的性能提升，和极低的耗电水平。因此，人工智能芯片将发挥大量作用。

具备AI商业算法落地的厂商具备相关算法的领先性: AI算法的龙头厂商在自然语言处理、机器视觉、数据标注方面都具有先发优势。算法上，数据标注属于AIGC算法的生成关键步骤，而在自然语言处理、机器视觉等方面，AIGC已经对此方向应用产生深远影响，例如已经实现的虚拟人与自然人的对话、AI作图、AI底层建模，随着技术的进一步成熟，AIGC势必对该方向应用产生革命性影响。

AIGC相关技术储备的应用厂商有望打开海量市场:相关娱乐、传媒、新闻、游戏、搜索引擎等厂商具备海量文本创作、图片生成、视频生成等需求，随着AIGC的逐渐成熟，相关AI算法不断成熟完善，并结合相关应用，我们认为相关厂商在降本增效的同时，有望提升其创作内容的质量、减少有害性内容传播等问题，实现创意激发，提升内容多样性，AIGC有望极大推动相关厂商商业化的发展，从而打开海量空间。

投资分析

科大讯飞: 自然语言处理的全球龙头厂商

科大讯飞于2022年初正式发布了“讯飞超脑 2030 计划”，其目的是向“全球人工智能产业领导者”的长期愿景迈进。该计划是公司的核心战略，目的是构建基于认知的人机协作、自我进化的复杂系统，即让机器人感官超越人类，具备自主进化的能力，打造可持续自主进化的复杂智能系统，助力机器人走进千家万户。其计划分为三个阶段性里程碑:第一阶段(2022-2023):推出可养成的宠物玩具、仿生动物等软硬件一体机器人，同期推出专业数字虚拟人家族，担当老师、医生等角色；第二阶段(2023-2025):推出自适应行走的外骨骼机器人和陪伴数字虚拟人家族，老人通过外骨骼机器人能够实现正常行走和运动，同期推出面向青少年的抑郁症筛查平台；第三阶段(2025-2030): 最终推出懂知识、会学习的陪伴机器人和自主学习虚拟人家族，全面进入家庭。

汉王科技: 人工智能领域领先者

汉王科技是人工智能领域领先者: 成立于1998年，是人脸识别、大数据、智能交互技术、产品及服务的提供商。公司以核心技术为基础，面向市场需求，已形成了以识别技术为核心的、针对不同细分市场的软硬件产品系列，既有通用产品，如e典笔、汉王电纸书、汉王笔、文本王、名片通、绘图板等。公司主营业务分为四类: 笔智能交互业务:公司在笔智能交互方面的技术主要分为电磁触控及电容触控两大类，公司是全球仅有的两家拥有无线无源电磁触控自主知识产权的企业之一，此项业务包括数字绘画、电容笔、无纸化签章；文本大数据业务:公司依托 AI 文本图像识别技术、NLP 技术、RPA技术平台，在各行业赛道中寻找数字化、智能化的落地场景，此项业务包括智慧司法、智慧档案、智慧人文、智慧教育、智慧金融等；人脸及生物试别与相关AI终端。

拓尔思: 全文检索技术的始创者

拓尔思是中文全文检索技术的始创者：领先的大数据、人工智能和数据安全产品及服务提供商，成立于1993年。其主要核心业务包括软件平台产品研发，行业应用系统解决方案和大数据SaaS/DaaS云服务三大板块，涵盖大数据、人工智能、互联网内容管理、网络信息安全和互联网营销等领域方向。公司技术实力雄厚：人工智能领域：公司是国内最早从事自然语言处理（NLP）研发的企业之一，在 NLP、知识图谱、OCR、图像视频结构化领域都具备自主可控的底层技术；在大数据方面，数据采集、挖掘、分析等底层技术均实现技术可控。公司行业领域覆盖广：由于公司人工智能和大数据核心技术具有跨行业/领域的通用普适性，因此公司技术产品和服务所支持的业务应用落地场景众多，涵盖多个行业/领域，大型或头部企业级客户超过 8000 家。广泛覆盖于金融、制造、能源、互联网、传媒、政府、公共安全等领域。

云从科技: 人机协同生态体系赋能商

云从科技是一家专注于提高人机操作系统和行业解决方案的人工智能企业，致力于推进人工智能产业化进程和各行业的转型升级。一方面公司通过业务、硬件设备、软件应用，为客户提供数字化、智能化的人工智能服务。另一方面，公司基于人机协同操作系统，赋能金融、出行、商业等场景。公司自主研发了融合人工智能技术的人机协同操作系统和部分AIoT设备。

海天瑞声: AI训练数据服务领军者

海天瑞声是我国领先的训练数据专业提供商，发行人始终致力于为 AI 产业链上的各类机构提供算法模型开发训练所需的专业数据集。发行人所提供的训练数据覆盖智能语音、计算机视觉、自然语言等多个核心领域，全面服务于人机交互、智能驾驶、智慧城市等多种创新应用场景。

虹软科技: 机器视觉的算法供应商

虹软科技专注于计算机视觉领域，为行业提供算法授权及系统解决方案，在全球范围内为智能终端机智能驾驶提供视觉算法产品线，目前客户主要包括三星、小米、OPPO、Vivo、荣耀等手机厂商及部分合资品牌汽车主机厂商。