智通财经APP获悉,华西证券发布研究报告称,我国国产ChatGPT生态正逐渐繁荣。百度(09888)是少有预训练模型(大模型)语言训练能力的公司,已经经历多次迭代,参数方面,模型基于ERNIE3.0,拥有千亿级参数。预训练方面,具备海量知识沉淀和丰富场景的文心大模型,跨模态方面,已有地理-语言、视觉-语言、语音-语言等模型架构,已覆盖众多方向,例如自然语言处理、机器视觉等其他重大任务,此外,根据IDC数据,目前已有近百万开发者使用文心大模型,生态正在逐步繁荣,合作厂商覆盖科技、教育、工业、媒体、金融等诸多产业。
投资建议:关注鸿蒙OS的生态伙伴
该机构认为AIGC的出世会产生革命性的影响,有望赋能千行百业,同时梳理了三条路径图,积极的推荐以下三条投资主线:
1)具备算力基础的厂商,受益标的为寒武纪(688256.SH)、商汤(00020)、海光信息(688041.SH)、浪潮信息(000977.SZ)、中科曙光(603019.SH)、景嘉微(300474.SZ)、联想集团(00992)、紫光股份(000938.SZ)、龙芯中科(688047.SH);
2)具备AI算法商业落地的厂商,重点推荐科大讯飞(002230.SZ)、拓尔思(300229.SZ),其他受益标的为:汉王科技(002362.SZ)、海天瑞声(688787.SH)、云从科技(688327.SH);
3)AIGC相关技术储备的应用厂商,受益标的为:百度集团-SW(09888)、同花顺(300033.SZ)、三六零(601360.SH)、金山办公(688111.SH)。
华西证券主要观点如下:
ChatGPT算法的核心壁垒
(1)庞大的数据训练数据,往往意味着模型精准度的上升;数据量大,往往意味着数据特征维度大,模型的参数越复杂,训练数据维度跟算力指数呈现正相关,算力成本高。
(2)底层算法Transformer,相较于传统神经网络综合特征提取能力、远距离特征捕获能力、语义特征提取能力,全部明显增强,正逐步取代RNN(循环神经网络)。
(3)AI预训练模型(大模型),本质是“大算力+强算法”结合的产物,对自然语言理解能力明显上升,谷歌BERT模型就是典型跨时代的例子,华西证券认为其是AIGC的初始应用算法。
(4)多模态数据协同,极大推动AIGC的内容多样性与通用性,让AIGC不只局限于文本和图像等单个部分,而是多应用相容。
不同类别AIGC算法比对
1、ChatGPT:训练模型为强化学习近端策略优化,可以理解成在“人脑思维”的基础上加入了“人类反馈系统”,是一种奖励模型,拥有175B参数,训练数据为语言文本。
2、LaDMA(谷歌Bard):参数方面为137B,奖励模型是人类评分机制,训练数据为对话数据。
3、图神经网络(GNN)作为科学领域预训练模型(大模型)备受瞩目,强大之处在于数据结构,其应用广阔例如推荐系统、药物发现、合成物发现、芯片设计等众多科学前沿领域。
国产ChatGPT生态正在形成
百度是少有预训练模型(大模型)语言训练能力的公司,已经经历多次迭代,参数方面,模型基于ERNIE3.0,拥有千亿级参数。预训练方面,具备海量知识沉淀和丰富场景的文心大模型,跨模态方面,已有地理-语言、视觉-语言、语音-语言等模型架构,已覆盖众多方向,例如自然语言处理、机器视觉等其他重大任务,此外,根据IDC数据,目前已有近百万开发者使用文心大模型,生态正在逐步繁荣,合作厂商覆盖科技、教育、工业、媒体、金融等诸多产业。
风险提示:核心技术水平升级不及预期的风险;AI伦理风险;政策推进不及预期的风险;中美贸易摩擦升级的风险。