阿里云优惠券 先领券再下单
9月24日,在杭州举办的云栖大会上,阿里巴巴集团的CEO吴泳铭发表了主旨演讲。他认为,实现通用人工智能AGI是必然的,但这仅仅是开始,最终目标是开发出能够自我迭代并全面超越人类的超级人工智能ASI。

吴泳铭首次详细阐述了通往ASI的三阶段演进路径:
第一阶段:“智能涌现”,AI通过学习大量人类知识获得泛化智能。
第二阶段:“自主行动”,AI掌握工具使用和编程能力,以“辅助人类”为目标,这是当前行业所处的阶段。
第三阶段:“自我迭代”,AI通过与物理世界的连接实现自学习,最终达到“超越人类”的目标。
为实现这个愿景,吴泳铭明确了阿里云的战略方向。阿里云作为“全栈人工智能服务商”,将通过两条核心路径实施AI战略:首先,通义千问坚定走开源开放路线,致力于打造“AI时代的Android”;其次,构建作为“下一代计算机”的超级AI云,为全球提供智能算力网络。
为支撑这一宏伟蓝图,吴泳铭表示,阿里巴巴正在积极推行三年内3800亿的AI基础设施建设计划,并将持续增加投入。根据远期规划,预计到2032年,阿里云全球数据中心的能耗将提升10倍,以迎接ASI时代的到来。
以下为演讲全文——
在演讲开始之前,我想特别感谢支持整个中国乃至全球科技行业的开发者朋友们。今天是云栖大会的10周年,这一大会源于阿里云的开发者大会,正是广大开发者推动了中国乃至全球的云计算、AI和科技行业的发展。因此,我想特别向开发者们表达我的真诚感谢。
当前,世界正经历一场由人工智能驱动的智能化革命。过去几百年,工业革命通过机械化增强了人类的体力,信息革命通过数字化提升了人类的信息处理能力。而这次智能化革命将超出我们的预期。通用人工智能AGI不仅会扩展人类的智力,还将释放人类的潜力,为超级人工智能ASI的到来铺平道路。
在过去的三年中,我们已经清晰地感受到这一发展的速度。AI的智力在短短几年内从高中生水平飞速提升到博士生水平,甚至赢得了国际数学奥林匹克金牌。AI Chatbot是人类史上用户渗透率最快的功能,其行业渗透速度超越了历史上所有技术。Tokens的消耗速度在短短两三个月内翻了一番。过去一年,全球AI行业的投资总额已超过4000亿美元,未来五年内全球AI的累计投入将超过4万亿美元,这将加速催生更强大的模型与AI应用的普及。
实现AGI——一个具备人类通用认知能力的智能系统,现在看来已成必然。然而,AGI并不是AI发展的终点,而是一个全新的起点。AI不会止步于AGI,它将向自我迭代和超越人类智能的超级人工智能(ASI)迈进。
AGI的目标是解放人类80%的日常工作,让我们专注于创造与探索。而作为全面超越人类智能的系统,ASI可能会涌现出一批“超级科学家”和“全栈超级工程师”。ASI将以难以想象的速度解决当前未解的科学和工程问题,如攻克医学难题、发明新材料、解决可持续能源和气候问题,甚至开展星际旅行等。ASI将以指数级的速度推动科技的飞跃,引领我们进入一个前所未有的智能时代。
我们认为,通往ASI的道路将经历三个阶段:
第一阶段是“智能涌现”,特征是“学习人类”。过去几十年的互联网发展为智能涌现奠定了基础,互联网将人类历史上几乎所有的知识数字化。这些语言文字承载的信息代表了人类知识的整体。基于此,大模型通过理解全球知识集合,获得了泛化智能能力,涌现出通用对话能力,能够理解人类意图,回答人类问题,并逐步发展出多步问题的推理能力。如今,AI已经接近国际数学奥林匹克金牌的水平,具备了进入真实世界、解决实际问题、创造实际价值的可能性。这是过去几年的主要进展。
第二个阶段是“自主行动”,特征是“辅助人类”。在这一阶段,AI不再仅限于语言交流,而是具备了在真实世界中行动的能力。AI可以在人类设定的目标下,拆解复杂任务,使用和制作工具,自主完成与数字世界和物理世界的交互,从而对真实世界产生深远影响。这正是我们目前所处的阶段。
实现这一跨越的关键在于,大模型具备了Tool use能力,能够连接所有数字化工具,完成真实世界的任务。人类加速进化的起点是创造和使用工具,现在大模型也具备了使用工具的能力。通过Tool use,AI能够像人一样调用外部软件、接口和物理设备,执行复杂的现实任务。这一阶段,由于AI能够极大地辅助人类提升生产力,它将迅速渗透到物流、制造、软件、商业、生物医疗、金融、科研等几乎所有行业。
其次,大模型Coding能力的提升将帮助人类解决更复杂的问题,并将更多场景数字化。当前的Agent仍处于早期阶段,主要解决标准化和短周期的任务。要让Agent能解决更复杂、更长期的任务,关键在于大模型的Coding能力。因为Agent可以自主编程,理论上就能解决无限复杂的问题,像工程师团队一样理解复杂需求并自主完成编码与测试。发展大模型的Coding能力是通向AGI的必经之路。
未来,自然语言将成为AI时代的源代码,任何人都可以用自然语言创造自己的Agent。只需输入母语,告知AI需求,AI便可自行编写逻辑、调用工具、搭建系统,完成几乎所有数字世界的工作,并通过数字化接口操作所有物理设备。未来,可能会有超过全球人口数量的Agent和机器人与人类一起工作,对真实世界产生深远影响。在此过程中,AI将连接真实世界的大多数场景和数据,为未来的进化创造条件。
随后,AI将进入第三个阶段——“自我迭代”,特征是“超越人类”。这一阶段的两个关键要素是:
第一、AI连接了真实世界的全部原始数据。
目前,AI在内容创作、数学和编码领域的进步迅速,这些领域的知识完全由人类定义和创造,AI可以100%理解原始数据。然而,在其他领域和更广泛的物理世界中,现今的AI接触到的多为人类归纳后的知识,缺乏广泛且与物理世界互动的原始数据。这些信息存在局限性。要实现超越人类的突破,AI需要直接从物理世界获取更全面、更原始的数据。
例如,假设一家汽车公司的CEO希望迭代明年的产品,通常会通过无数次的用户调研或内部讨论来决定下一款汽车应具备的功能,以及与竞对相比要实现的优势。如果AI能连接这款汽车的所有资料和数据,它所创造的下一款汽车无疑会远超无数次头脑风暴所产生的方案。这是人类世界中的一个例子,更不必说更复杂的物理世界,单靠人类知识的归纳无法让AI完全理解。
因此,AI要达到更高的阶段,必须直接从物理世界获取全面、真实、实时的数据。就像在自动驾驶的早期阶段,仅依靠人类总结的方法无法实现良好的效果。新一代自动驾驶主要采用端到端的训练方法,直接从原始的车载摄像头数据中学习,提升了自动驾驶的能力。即使是当前看似简单的自动驾驶问题,单靠人类的归纳知识和规则也无法解决,更何况整个复杂的物理世界。只有让AI与真实世界持续互动,获取更全面、更真实的数据,才能更好地理解和模拟世界,发现超越人类认知的深层规律,从而创造出比人类更强大的智能能力。
第二、Self-learning自主学习
随着AI渗透到更多物理世界场景,理解更多物理世界的数据,AI模型和agent能力将不断强化,能够为自身模型的升级迭代构建训练基础设施、优化数据流程和升级模型架构,从而实现自主学习。这将是AI发展的关键时刻。
随着能力的不断提升,未来的模型将通过与真实世界的持续交互,获取新的数据并接收实时反馈,借助强化学习与持续学习机制,自主优化、修正偏差,最终实现自我迭代与智能升级。每一次交互都是一次微调,每一次反馈都是一次参数优化。经过无数次场景执行和结果反馈循环后,AI将自我迭代出超越人类的智能能力,早期的超级人工智能(ASI)将会成型。
一旦跨越某个奇点,人类社会将如同按下加速键,科技进步的速度将超出我们的想象,新的生产力爆发将推动人类社会进入崭新的阶段。通往超级人工智能的道路正在逐渐清晰。随着AI技术的进步和各行业需求的爆发,AI也将催生IT产业的巨大变革。
我们的第一个判断是:大模型是下一代的操作系统。我们认为,大模型所代表的技术平台将取代当前的操作系统,成为下一代的操作系统。未来,几乎所有连接真实世界的工具接口都将与大模型相连,所有用户需求和行业应用都将通过大模型相关工具执行任务,LLM将成为承载用户、软件与AI计算资源交互调度的中间层,成为AI时代的操作系统。可以做一个简单的类比:自然语言是AI时代的编程语言,Agent是新的软件,context是新的记忆,大模型通过MCP这样的接口连接各类工具,Agent之间又通过A2A这样的协议实现多Agent协作,类似于软件之间的API接口。
大模型将会吞噬软件。作为下一代的操作系统,大模型将允许任何人用自然语言创造无限多的应用。未来,几乎所有与计算世界打交道的软件都可能是由大模型生成的Agent,而不是现在的商业软件。潜在的开发者将从几千万增至数亿。曾几何时,由于软件开发成本的限制,只有少数高价值场景才会被开发成商业化软件。未来,所有终端用户都可以通过大模型这样的工具满足自己的需求。
模型的部署方式也将多样化,运行在各种设备上。目前主流的模型API调用方式,使用模型的方式仍处于初级阶段,显得相当原始。类似于大型主机时代的分时复用阶段,每个人仅通过一个终端连接到大型主机进行分时使用。这种方式无法解决数据持久化,缺乏长期记忆,实时性不足,隐私问题也未得到解决,灵活性也不够。未来,模型将运行在所有计算设备上,具备持久记忆,端云联动,并随时更新参数、自我迭代,类似于我们今天的操作系统在各种环境中运行。
基于这一判断,我们做出了战略选择:通义千问选择开放路线,打造AI时代的Android。我们认为,在LLM时代,开源模型创造的价值和能渗透的场景将远大于闭源模型。我们坚定选择开源,以全力支持开发者生态,与全球开发者共同探索AI应用的无限可能。
我们的第二个判断是:超级AI云是下一代的计算机。
大模型将在AI Cloud之上作为新的操作系统运行。这个操作系统将满足每个人的需求。每个人将拥有几十甚至上百个Agent,这些Agent将不间断地工作和协同,需求海量的计算资源。
数据中心的计算模式也正在发生革命性改变,从以CPU为核心的传统计算,迅速转变为以GPU为核心的AI计算。新的AI计算模式需要更高密度的算力、更高效的网络以及更大规模的集群。
这一切都需要充足的能源、全栈技术、数百万个GPU和CPU,以及协同网络、芯片、存储和数据库的高效运作,24小时处理来自全球的需求。这需要超大规模的基础设施和全栈的技术积累,只有超级AI云才能承载如此庞大的需求。未来,全球可能只会有5-6个超级云计算平台。
在这个新时代,AI将取代能源的地位,成为最重要的商品,驱动千行百业的日常运作。绝大部分AI能力将以Token的形式在云计算网络上生成和传输。Token将成为未来的电。在这个全新的时代,阿里云的定位是全栈人工智能服务商,提供世界领先的智能能力和遍布全球的AI云计算网络,为全球开发者提供友好的AI服务。
首先,我们拥有全球领先的大模型——通义千问。通义千问已开源300多款模型,覆盖全模态、全尺寸,是全球开发者最受欢迎的开源模型。截至目前,通义千问的全球下载量已超过6亿次,衍生模型超过17万个,形成了全球第一的开源模型矩阵,渗透计算设备的程度最高。
同时,阿里云提供一站式模型服务平台百炼,支持模型定制化和Agent快速开发,同时提供AgentBay这样的Agent运行环境、灵码/QodeR等一系列开发者工具,使开发者可以方便地利用模型能力和创建及使用Agent。
其次,阿里云运营着中国第一、全球领先的AI基础设施和云计算网络,是全球少数能实现软硬件垂直整合的超级AI云计算平台之一。在硬件和网络层面,阿里云自研的核心存储系统、网络架构和计算芯片构成了阿里云大型计算集群的坚实基础。
阿里云正在全力打造一台全新的AI超级计算机,拥有领先的AI基础设施和模型,确保在阿里云上调用和训练大模型时达到最高效率,成为开发者最佳的AI云。
AI行业的发展速度远超我们的预期,行业对AI基础设施的需求也超出预期。我们正在积极推进三年3800亿的AI基础设施建设计划,并将持续增加投入。从目前观察到的AI行业远期发展及客户需求来看,为迎接ASI时代的到来,预计到2032年,阿里云全球数据中心的能耗规模将提升10倍。这是我们的远期规划,我们相信通过这样的持续投入,可以推动AI行业的发展,迎接ASI时代的来临。
超级人工智能到来后,人类与AI的协作关系将会如何?
未来,AI将愈发强大,甚至超越人类智能的ASI将诞生。那么我们人类与AI将如何相处?对于未来,我们充满乐观。超级人工智能的到来将使人类与AI形成全新的协作模式。程序员们已经感受到这一点,我们能够通过指令让AI在12个小时内创造出我们所需的系统,这展示了人类与AI协同工作的早期雏形。因此,我们认为未来的工作模式将从Vibe Coding转向Vibe Working。未来,每个家庭、工厂、公司都将有众多的Agent和机器人为我们24小时服务。或许,未来每个人都需要依赖100张GPU芯片进行工作。
正如电力曾经放大了人类的物理力量,ASI将以指数级的方式放大人类的智力杠杆。过去,我们花费10个小时获得10小时的结果;而未来,AI可以使我们的成果乘以十倍、百倍。回顾历史,每次技术革命都释放了更多的生产力,并创造出新的需求。人类将变得比历史上任何时候都更强大。
最后,我想强调,一切才刚刚开始。AI将重构整个基础设施、软件和应用体系,成为真实世界的核心驱动力,