互联网资讯 / 人工智能 · 2026年5月5日 0

S3的发展历程与未来展望——访谈技术副总裁Mai-Lan Tomsen Bukovec

2006年3月14日,Amazon S3(Amazon Simple Storage Service)的推出,开启了“弹性存储”概念的新篇章。这个看似简单的服务,让开发者能够以极低的成本存储海量数据。如今,Amazon S3已经承载了超过500万亿个对象,并在人工智能迅速发展的时代中,逐步转型为一个“主动智能基础设施”,从而脱离了最初的“被动数据湖”角色。

在Amazon S3成立20周年之际,我们有幸与亚马逊云科技的技术副总裁Mai-Lan Tomsen Bukovec进行了深入的讨论。她在访谈中首次透露,Amazon S3 Vectors在2026年NAB Show上荣获“年度最佳产品奖”,这个消息让她十分兴奋。

Amazon S3的20年:从“存储无限”到“智能无止”——专访亚马逊云科技技术副总裁Mai-Lan Tomsen Bukovec

亚马逊云科技技术副总裁Mai-Lan Tomsen Bukovec

谈到Amazon S3的创新历程时,Mai-Lan表示:“我们对每一个字节的承诺始终如一。”无论是针对非结构化数据、文件还是向量数据,这一原则未曾改变,未来也将继续遵循。

S3 Tables打破“只读”界限:Iceberg与数据表的编辑革命

回顾Amazon S3的发展,Mai-Lan认为其核心特征是“弹性”。这种弹性不仅体现在存储空间的扩展上,也体现在产品形态的多样化上。最初,S3是一个庞大的非结构化数据仓库,用户若想修改某个文件,必须替换整个对象。但S3 Tables的推出,彻底改变了这一局限,首次实现了数据的“可编辑”,通过原生支持Apache Iceberg格式。

她补充道:“这是一个巨大的进步,用户可以直接利用S3的性价比对数据表进行操作,这一变化也引发了新的生态反应。”

在S3 Vectors与S3 Files的结合中,Mai-Lan指出,S3 Files在物理存储上是对象,但在逻辑接口上符合POSIX标准的文件系统,允许开发者通过文件目录与数据互动,无需重构代码。

延迟与成本的经济权衡

尽管人工智能追求极低的延迟,Mai-Lan承认S3的架构延迟确实高于传统数据库。然而,她认为这并非缺点,而是一种设计上的权衡。许多科研分析及大规模产品相似度搜索在100毫秒的延迟下依然可以顺利进行。

随着Agent时代的到来,成本的考虑变得愈发重要。Mai-Lan指出,AI Agent通常会发起数十甚至数百个并行查询,在这种情况下,底层存储和分析服务的成本效率直接影响Agent的盈利能力。

跨越2020年的工程承诺:数年的严谨

在过去20年的服务中,Mai-Lan表示,最令人印象深刻的并非某项新功能,而是对底层架构的重构,特别是“强一致性”的引入。她回忆说:“在发布强一致性之前,我们无法通过写测试用例覆盖所有场景,因为S3的规模庞大。”

这种对“每一个字节负责”的承诺,体现在S3底层的微服务中,它们每天不懈地进行完整性校验,确保数据的可靠性。

访谈最后,Mai-Lan提到亚马逊的领导力准则——“Are Right, A Lot”。她强调,关键在于领导者要不断质疑自己的信念,寻找改进现有系统或开发新能力的机会,这种执着可能正是亚马逊在AI时代成为数据韧性与技术创新标杆的根本原因。