海通证券:DeepSeek V3完成小版本升级 推理/开发/中文/搜索等多领域能力均有增强

新版DeepSeek-V3的发布,代表DeepSeek目前仍在稳定的更新迭代当中,这也说明目前AI的发展远远没有到停滞的阶段。

智通财经APP获悉,海通证券发布研报称,新版DeepSeek-V3的发布,代表DeepSeek目前仍在稳定的更新迭代当中,这也说明目前AI的发展远远没有到停滞的阶段,伴随各大科技公司对AI技术的持续投入,AI模型也有望持续发展,从而带来更强的能力和更好的落地性,DeepSeek API的错峰优惠政策则进一步助推了AI的落地,使得用户能够以更加便宜更加有性价比的价格,使用到最先进的大模型之一,未来AI在各领域的落地也有望持续加速。

海通证券主要观点如下:

DeepSeek-V3完成小版本升级

近日, DeepSeek-V3模型完成小版本升级,目前版本号DeepSeek-V3-0324,用户登录官方网页、APP、小程序进入对话界面后,关闭深度思考即可体验。API接口和使用方式保持不变。DeepSeek建议,如果是非复杂推理任务,用户可以使用新版本V3模型,即刻享受速度更加流畅、效果全面提升的对话体验。

新版DeepSeek-V3多领域任务能力均有提升

新版DeepSeek V3主要有以下能力提升:(1)推理任务表现提高。V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩。(2)前端开发能力增强。在HTML等代码前端任务上,新版V3模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。

(3)中文写作升级。在中文写作任务方面,新版V3模型基于R1的写作水平进行了进一步优化,同时特别提升了中长篇文本创作的内容质量。(4)中文搜索能力优化。新版V3模型可以在联网搜索场景下,对于报告生成类指令输出内容更为详实准确、排版更加清晰美观的结果。此外,新版V3模型在工具调用、角色扮演、问答闲聊等方面也得到了一定幅度的能力提升。

新版DeepSeek-V3保持高度开源,支持用户利用V3模型训练其他模型

DeepSeek-V3-0324与之前的DeepSeek-V3使用同样的base模型,仅改进了后训练方法。私有化部署时只需要更新checkpoint和tokenizer_config.json(tool calls相关变动)。模型参数约660B,开源版本上下文长度为128K(网页端、App和API提供64K上下文)。与DeepSeek-R1保持一致,此次DeepSeek-V3的开源仓库(包括模型权重)统一采用MIT License,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

DeepSeek已官宣API错峰优惠政策,进一步推动AI落地

在2月底,DeepSeek还宣布了DeepSeek API错峰优惠政策。北京时间每日00:30至08:30的夜间空闲时段,DeepSeek开放平台推出错峰优惠活动。在此期间,API调用价格大幅下调:DeepSeek-V3降至原价的50%,DeepSeek-R1更低至25%。DeepSeek鼓励用户充分利用这一时段,享受更经济更流畅的服务体验。

风险提示

AI技术发展不及预期,AI商业落地不及预期的风险。

智通声明:本内容为作者独立观点,不代表智通财经立场。未经允许不得转载,文中内容仅供参考,不作为实际操作建议,交易风险自担。更多最新最全港美股资讯,请点击下载智通财经App
分享
微信
分享
QQ
分享
微博
收藏