德邦证券:从技术路径,纵观国产大模型逆袭之路

作者: 智通财经 刘璇 2024-07-05 14:47:31
海外大模型的宝座三次更迭:初代GPT-4o自我革命,持续刷新综合性能;二代谷歌Gemini更极限的上下文理解、更低延时;翘楚Claude3.5聚焦视觉和交互体验。

智通财经APP获悉,德邦证券发布研报称,海外大模型宝座经过三次更迭,龙头轮番抢占性能第一宝座,比拼整体性能和多模态交互,且比较维度升级,从模型到叠加终端,跨设备的使用效果体验。理科目前差距较大,聚焦长文本,国产大模型已有赶超GPT之势。长文本三大难度为注意力机制计算复杂度、上下文记忆、最长文本约束难题。从技术来看,训练&推理成本的下降推动降价。头部公司降价迭代提升竞争力,开拓逆袭之路。

海外大模型宝座经过三次更迭,龙头轮番抢占性能第一宝座,比拼整体性能和多模态交互

大模型的宝座三次更迭:初代GPT-4o自我革命,持续刷新综合性能;二代谷歌Gemini更极限的上下文理解、更低延时;翘楚Claude3.5聚焦视觉和交互体验。

大模型高地争夺:多模态的理解和响应,原生多模态技术比拼。大模型的效果取决于多模态理解与生成,毫秒级响应更先进的视觉与音频理解能力,智能感知语气与语态。端到端原生多模态技术、统一神经网络,是竞争的主要角力点

大模型的比较维度升级:从模型到叠加终端,跨设备的使用效果体验。如谷歌推出AlAgent项目Astra模型,可以手机、眼晴镜头对准身边的物品,并向Project Astra提出一些疑问,它几乎能做到零延时地准确回答。

国内大模型逆袭之路:聚焦长文本,降价迭代提升竞争力。

先文后理:理科目前差距较大,聚焦长文本,国产大模型已有赶超GPT之势,如通义千问、KIMI、山海等。

长文本的三大难度:注意力机制计算复杂度、上下文记忆、最长文本约束难题。

商业上降价,加速迭代卷出未来。头部智谱/字节跳动/阿里/腾讯/百度/讯飞低价迭代,百川智能/月之暗面/零一万物等初创公司并未加入降价行列。从技术来看,降价的背后是训练&推理成本的下降。

投资建议:建议关注(1)国产大模型厂商:科大讯飞、商汤、云从科技、格林深瞳、拓尔思、昆仑万维、创业黑马等。(2)接入头部大模型的应用标的:金山办公、万兴科技、福昕软件、虹软科技、彩讯股份、焦点科技、润达医疗、金证股份、泛微网络、金蝶国际等,同时关注Kimi相关标的。

风险提示:海外大模型展现闭源趋势,国内大模型技术差距扩大;国内大模型在整体性能上未能达到商业使用的奇点国内大模型在缺乏算力支持的情况下迭代速度放缓;国内大模型技术路线产生分歧,无法引领未来发展方向。


智通声明:本内容为作者独立观点,不代表智通财经立场。未经允许不得转载,文中内容仅供参考,不作为实际操作建议,交易风险自担。更多最新最全港美股资讯,请点击下载智通财经App
分享
微信
分享
QQ
分享
微博
收藏