联想集团(00992)CTO芮勇谈ChatGPT：考虑将AIGC技术应用到产品和业务

作者：智通财经楚芸玮 2023-02-15 10:29:39

联想集团(09922)CTO、高级副总裁芮勇表示，除了基础架构之外，联想还在考虑AIGC技术在产品和业务里的应用。

智通财经APP获悉，近日，围绕火爆全网的ChatGPT话题，联想集团(09922)CTO、高级副总裁芮勇博士接受了《中国计算机学会通讯》(CCCF)的专访，并分享了对ChatGPT等大模型的看法。芮勇表示，联想新IT架构将在AI新范式加速智能化变革的过程中继续发挥重要作用。除了基础架构之外，联想还在考虑AIGC技术在产品和业务里的应用。

从大模型到AGI还有多远？

ChatGPT是OpenAI GPT系列中为对话场景优化的语言模型，属于Foundation Models，即基础模型，简称为“大模型”。芮勇将它的特点概括为“一大三多”：一大是指参数规模大，是千亿参数级别的超大型人工智能模型；三多是指利用多来源、多模态、多任务的互联网规模海量数据进行训练。

芮勇认为，大模型首先在内容理解领域大获成功，例如BERT问世时刷新了11项自然语言理解任务的记录，最近又在内容生成领域取得了瞩目成就，也就是AIGC。

对于外界普遍关心的大模型是否催生了AI新范式，芮勇给出的答案是，简单来讲，AI范式的转变，是从“针对特定任务，更新预训练模型”(small models + fine-tuning)转换到“根据上下文提示自动理解并执行各类任务，无需更新模型参数或架构”(large models + in-context learning)。

ChatGPT的成功，让业界看到了由大模型通往AGI (通用人工智能) 的曙光，不过，芮勇认为，大模型能走多远，前景到底如何，是否能实现“多任务，多模态，多化身的大一统”，目前还颇有争议。

他进一步解释，近几年大模型有了突破式进展，很多人持乐观态度。从Gartner技术成熟度曲线可以看到，大模型目前处于“期望膨胀阶段”(Peak of Inflated Expectations) 。人们对它的期望很高，但也应该看到，大模型尚未解决的问题还很多。比如谷歌版的ChatGPT，取名Bard，首次公开展示就出现回答结果不准确的问题，导致公司市值一天之内蒸发超1000亿美元。此外，对话机器人生成句子里包含的信息无法溯源，甚至包含偏向性和冒犯性言论等等。可见，通往AGI的道路还很漫长。

联想在大模型普及中发挥怎样的作用？

大模型的兴起，为进行智能化变革的企业带来了很多新的机遇。芮勇以联想为例进行了介绍。联想借鉴大模型背后的基础性算法，将小样本学习应用到基于计算机视觉的产品缺陷检测当中，提升了质检系统对新产品和新产线的快速迁移能力；此外，联想还将强化学习技术和人机协作的理念应用到供应链优化当中，使得供应链在剧烈变化的环境中，不断提升韧性。

对于联想将在AI新范式和大模型普及中发挥怎样的作用，芮勇表示，长远来看，很有可能AI新范式(large models + in-context learning)与旧范式(small models + fine-tune)共存，或是相互结合，而不会单个范式一统天下。联想将充分发挥“端-边-云-网-智”新IT架构的优势，来支撑新旧范式的结合与转换。联想提出的新IT架构，既致力于推动自身的智能化变革，也着眼于赋能各行各业的智能化转型。AI模型对运行环境需求越来越高，例如云-边-端的高度协同，异构计算与负载均衡、设备之间的互联互通、数据安全与隐私保护、模型本身的伸缩性与扩展性等等。联想在这些方面都有着深厚的技术积累，新IT架构在AI新范式加速智能化变革的过程中也会继续发挥重要作用。

除了基础架构之外，联想还在考虑AIGC技术在产品和业务里的应用。比如，在智能设备中对跨模态的生成模型进行优化和裁剪，使之能加载到手机或平板上实现个性化内容生成。在智能解决方案方面，我们考虑把AIGC用于新产品营销与新客户触达。目前，大模型还没有与知识有效结合，我们正在研究数据驱动与知识驱动相结合的方法，即Hybrid Learning来改进大模型的不足。另外，在大模型落地过程中，也需要彻底解决对环境变化或是新领域、新任务的自适应问题，即Adaptive Learning，这些都是联想人工智能的探索方向。

智通声明：本内容为作者独立观点，不代表智通财经立场。未经允许不得转载，文中内容仅供参考，不作为实际操作建议，交易风险自担。更多最新最全港美股资讯，请点击下载智通财经App