周期是人类社会中最为简单的内核规律。直到18世纪中期,亚当·斯密的《国富论》才揭开了古典经济学的以降,人们越渐掌握了现代经济学的理论工具,并用来解构世界,在此过程中,社会经济领域出现了“长中短波”般的峰谷变幻,不断增强人对经济周期的崇敬和宿命感。
这种宿命感换作当代人最熟悉的经济现象就是了:第一至第三次产业革命。这一次,我们又站在了第四次产业革命的起点。此时此刻,它还停留在以“电子计算机-移动互联网”科技作为基石的最后一轮创新康波循环的终端,我们还在为开启新60年产业革命新循环而继续求索。
现在可能会有一个新周期时点出现。它不仅在国内率先推出了基于移动终端的在线支付服务——移动支付,而且还将其拓展到其他行业和领域。最直观的标志,针对C端市场,ChatGPT走红。上线2个月后ChatGPT月活用户突破一亿,成了互联网有史以来用户发展最迅速的应用程序。
为此科大讯飞、百度和其他国内科技公司也开始进入市场跟进。以这个时间点为契机,围绕AI产业未来地位展开争夺。
/ 01 /
ChatGPT是第四次工业革命之初
在过去的很长一段时间内,AI落地探索,更多地表现为垂直领域,以智慧医疗为例、智慧城市等。但是ChatGPT问世,给我们带来了另一种可能性:跑通AI的一般范式,然后降落在特定的场景中。
于AI产业而言,ChatGPT最重要之处,它对那些技术短缺状态下滞留达半个多世纪之久的AI研发者来说,传递着一个信号:从实验室走出来,该和人类进行有效交流。
作为基于大语言模型的文字聊天产品,ChatGPT的功能远远超过了迄今为止人类所涌现出的所有智能聊天类产品,还包括苹果Siri。这也使得ChatGPT成为一个名对事实上的现象级产品。在移动互联网时代,用户不再满足于仅仅是通过手机和电脑等工具进行交流沟通,而是希望能够随时随地地与朋友、家人或者其他用户分享信息。ChatGPT是互联网历史上用户增长最快的应用,上线两个月,月活用户则突破了1亿户。
从社会整体发展的视角看,作为一种标志性的机器智能生产力工具,ChatGPT和蒸汽机的产生具有相似含义。它将带来一场革命性变革,并为人类未来生活方式提供重要启示。反映在三个方面:给一些传统行业带来颠覆性影响、对于提高各行业的效率、拉开了又一轮长波经济周期的序幕。
给一些传统行业带来颠覆性影响,最直观的反映,就是谷歌股价。谷歌加持类ChatGPT产品Bard答错之后,其市值两天之内下跌12%,亏损1500亿美元以上,被誉为史上最昂贵的失误。
理由是ChatGPT也许会改变人类产生和获得知识的途径。它不仅能使人们从“搜索”中解放出来,而且能够帮助他们更好地利用各种信息资源来解决自身在工作与生活中遇到的问题。因为这可能会使知识的生产门槛大大降低,并以此为契机,在人类探索与研究中占了一个中心地位,然后颠覆搜索引擎价值。
如果ChatGPT还没有颠覆搜索引擎,但是,它对于各行业效率提高的价值也在不断凸显出来。它将为我们带来更多可能。就目前而言,ChatGPT已足够负担许多情景下人类脑力劳动的一部分,如按规定要求搜集、整理资料、采写消息等、具体题材的文章,编写程序等。
从ChatGPT开始,生成式AI建立在生产效率优势之上,会衍生更为高级的商业模式,引发生产关系范式转变,继而启动了新的经济增长周期。
AI在多大程度上实现了范式变革,目前还不得而知。但是很清楚,ChatGPT问世,给所有AI公司开启了全新之路。在这个“万物互联”的时代,“人工智能 教育”已经成为一个炙手可热的话题。近日,科大讯飞,网易,360,浪潮、昆仑万维等等企业,纷纷公布下场的ChatGPT。这意味着人工智能将成为继语音识别之后的下一个风口。其中科大讯飞就更多,5月份首先登陆AI学习机的产品,将携带类ChatGPT技术。
作为AI行业的领头羊,科大讯飞凭什么能在ChatGPT追赶赛中独占鳌头?在未来,”智能语音 机器学习“会是一个怎样的格局?它抱ChatGPT还有多少机会?
/ 02 /
拥抱ChatGPT可能
OpenAI为AI产业化提供了新途径,后来者希望复现在ChatGPT上的算法和算力上、数据三方面缺一不可。
三者之中算法更容易被人们所认识,就像人的大脑一样,确定AI学习能力。算法是机器对世界进行认知与分析的工具,它可以通过计算获得知识并用于指导实践活动。算力则多指资源,确定算法运行效率。在实践中,超大模型因其参数规模较大、数据体量庞大,所以需要更多算力来支撑。
研究发现ChatGPT一次模型训练需要一个月的时间,培训费用高达1200万美元。该项目采用了基于大数据技术和深度学习方法的混合建模方式,通过对海量样本进行自动标注与分析来提高模型性能,降低人工工作量。认为训练超大模型需要大范围计算集群和相应模型并行算法框架支持,对中间算力的要求很高。因此,在保证高性能和可扩展性基础上,如何降低硬件开销成为了一个重要课题。根据科大讯飞副总裁、研究院执行院长刘聪判断,1000张主流卡容量的独立计算集群是完成该类任务的门槛之一。
从数据上看,针对预训练的模型,数据的质与量直接影响到模型的优劣。在大数据处理方面,数据是算法学习的基础,也可以说数据就是算法。数据比算法重要,它更像一本本高质量的教材,能确定AI将学什么。在人工智能领域中,有许多经典应用案例证明了这一点。例如ChatGPT取得了成功,则主要依靠互联网上数量众多的优质英文文本数据。如果没有海量数据支撑的学习,那么人工智能也很难实现对未知事物的认知与探索。世界第一大百科网站维基百科中,百科文章最多的是英文。
上述三方维度也正好给我们评价科大讯飞是否能发布ChatGPT类产品作为借鉴。
一关于算法的行业主流看法,尽管没有率先做出来Transformer、GPT-3,而国内公司对大模型中的工艺,离ChatGPT的距离,其实只有半年至两年。
对科大讯飞这样一家AI龙头企业而言,现实的差距也许会缩短一些。算法领域科大讯飞对Transformer深度神经网络算法有着丰富的经验,现已在科大讯飞语音识别,图文识别等领域得到了广泛运用、机器翻译及其他工作,达到了国际领先水平。
同时科大讯飞创新性地提出一个知识和大模型相整合的统一认识框架——X-Reasoner框架,以及认知智能的技术方面,2022年累计获得常识阅读理解挑战赛OpenBookQA等13项世界冠军。对AI算法有很深的积淀,这正是科大讯飞能快速跟进ChatGPT类产品发展的一个主要原因。
除在算法领域有较深积淀,科大讯飞同样拥有坚实的算力支持。例如,该企业在其总部设立了行业内一流数据中心,为构建大模型训练平台打下良好硬件基石。
不仅如此,科大讯飞还对工程实现进行了大量积极探索。例如科大讯飞在百亿参数的大型模型上取得了近千倍的推理效率加速,为今后更大规模,更大的认知智能大模型的技术经济实用的大规模应用提供可能性。这一切都离不开“大数据”,“人工智能”和“机器学习”三大关键技术的支撑。工程实现技术是大模型向大规模应用发展的关键。
就数据积累而言,以多年消费场景打开局面,科大讯飞多年来从事认知智能系统的开发与推广工作,累计行业语料50TB以上,用户互动日活跃应用突破10亿,提供大量行业文本语料及用户反馈数据,以训练并实现符合人类专家标准的大规模行业认知模型,还可为基于大模型创新应用的研发及试点推广等提供场景保障。
领先AI算法中、坚实的算力支撑和大量的文本语料,在这三方面的叠加下,科大讯飞是我国少数具备复制ChatGPT的AI企业之一。
当然ChatGPT对于科大讯飞来说还不仅仅是这么简单。有助于投资人重新认识科大讯飞根据地战略护城河,认识大模型路径和产业深度融合机遇,这就是ChatGPT之于科大讯飞的最重要的意义。
/ 03 /
ChatGPT植根于产业化之启发
ChatGPT跑通AI通用范式,引起了不少人的质疑:在ChatGPT等通用型产品得到进一步改进之后,会否进军专业领域,给科大讯飞等专业打法AI公司带来影响?
就目前而言,这一观点也许有点多虑。因此,我们需要一种开放的方法和工具来支持不同应用场景下的人工智能研究与开发。因专业领域数据封闭,通用型AI产品通常难以真正起到效果。如果要把这些大数据量转化为有价值的知识,则需要专门的算法和工具。以ChatGPT信息输出为例主要靠大量数据学习,但是对于许多具体方面,资料比较闭塞,通用模型难以得到,典型的例子是医疗数据。在这种情况下,专业性AI模型仍在明显优势中。
即ChatGPT通用AI产品问世,非但没有影响科大讯飞经营,反而再一次印证了公司业务护城河,以及其AI根据地战略实施效果。
鉴于科大讯飞行业应用案例众多,大模型路径跑通后,科大讯飞还在多个行业场景中拥有更多用武之地。
就目前来看,对于每个行业来说都是不一样的要求,今后,大模型将继续扩展到各个层次个性化模型,形成更加适应行业需求。在这个过程中,人工智能算法将发挥越来越重要的作用。仅基于以上技术演化,自然语言处理所代表的人工智能算法,才能重构互联网与移动互联网产品形态。
有别于绝大多数AI公司,科大讯飞正好在技术上、行业应用上有深厚积淀。随着人工智能产业不断向纵深发展,越来越多的企业希望将自身业务场景中的数据进行深度挖掘,进而实现对用户需求的快速响应。为进一步增强大模型对细分行业实用性,科大讯飞规划为“1 N”结构,其中“1”为一般认知智能大模型算法的开发和高效训练的底座平台,“N”为用于教育,医疗,人机交互,办公,翻译,工业等领域、汽车和其他许多行业领域专用大模型版。
比如通过对大量医学教材的研究、论文与案例,在医疗领域实现了一个对话式AI专业系统,打造“每个医生的AI诊疗助理,每个人的AI健康助手”。
长期用通用型产品对细分行业AI解决方案进行优化,科大讯飞迎来了开拓AI产业发展新途径的契机,达到了自己指数般的膨胀,继而加快整个社会经济领域创新与进步。这不是科幻电影里的情节,而是现实中发生在我们身边的真实场景。或许十年以后才会回头,也许您会发现ChatGPT是一个技术大停滞分水岭,一个全新的循环就要开始了。当你站在这个时代风口上的时候,你会不会觉得自己已经被抛下了?此后:大海航行靠AI。