智通财经APP获悉,中金发布研究报告称,过去一年,大模型在逻辑推理、智商等方面拥有显著突破,并出现由多模态推动的趋势,如Open AI GPT-4、文生视频Sora以及Google的原生多模态Gemini系列。大模型可以对世界的概率建模,它并不需要理解每一个符号,而当它把标记空间做的足够大时,仅仅通过符号与符号之间连接的丰富性和准确性,就能够产生一个有逻辑的答案。基于此,大模型或有能力把对AI Agent的畅想落地。更进一步,AI Agent或可打造出AI原生场景及应用。
▍中金主要观点如下:
大模型面世有望开启AI Agent时代。
过去一年,大模型在逻辑推理、智商等方面拥有显著突破,并出现由多模态推动的趋势,如Open AI GPT-4、文生视频Sora以及Google的原生多模态Gemini系列。大模型可以对世界的概率建模,它并不需要理解每一个符号,而当它把标记空间做的足够大时,仅仅通过符号与符号之间连接的丰富性和准确性,就能够产生一个有逻辑的答案。基于此,大模型或有能力把对AI Agent的畅想落地。更进一步,AI Agent或可打造出AI原生场景及应用。
AI Agent现状:从基础形态迈向通用Agent。
AI Agent应用实际落地可分为单一任务和多任务场景。单一任务场景聚焦垂类赛道,AI仅具备相对初级的协同能力,典型案例如社交(如聊天机器人Character.ai、Pi等)、娱乐(如定制化内容生成AI——Sora、Runway等;个性化内容推荐AI等)、游戏(如AI生成游戏资产和NPC、模拟人类世界的生成式代理等)、交易(如电商、本地生活等)、生产力(聚焦办公类,如微软Copilot和Google Gemini)等。
多任务场景则代表AI更为高级的阶段,向着通用Agent(具备调配资源并自主集合形成问题解决方案能力的Agent)的方向迈进,典型案例如GPTs、斯坦福小镇等,这将使Agent从过程导向转变为目的导向的形态。更进一步,通用Agent未来或可升级为通用机器人(如Google的RT-2),引入线下实践和经验,使其更智能。
AI Agent初期传统龙头基于已有产品的探索看似更加活跃,但长期对其而言,挑战与机遇并存。
AI Agent在发展初期与传统互联网龙头关联性或更高,主要在于他们资源优势显著,不仅是大模型研发的主要参与者,还把持了现有的商业场景,但现有大模型能力不足,在此基础上或者找到PMF难度较大,或者即使找到的PMF,都有可能随着大模型的快速进化而被降维打击。
长期看,对龙头而言,真正的机会出现在围绕scaling law的红利趋缓、底层模型本身进化速度收敛时,如果龙头在技术上仍能保持不掉队,则有望发挥自身的用户和场景优势。同时,AI Agent带来的观念转变,需要大厂在既有文化里去产生新组织,也带来了相应的挑战。
风险
数据、隐私风险;法律道德伦理风险;长期人类生存危机。