文 | 曾响铃
当AI发展借新基建东风进一步加速后,每个垂直门类都开始表现出一边深化技术、一边广拓生态的两大特征。
最近的百度大脑语言与知识技术峰会直接表现了这一点。
一次性推出11项发布,AI技术的大规模应用进程被行业巨头加快,而正如百度CTO王海峰所言,“在百度语言与知识技术的布局和发展中,我们始终在注意把握两个趋势,即技术发展趋势和产业发展趋势,并力争引领趋势。” 作为AI皇冠上的明珠,NLP在一边继续进行技术深化的同时,产业落地也开始齐头并进。

如果从2010年百度成立自然语言处理部算起,NLP从技术和产业上全面布局已经走过整整十个年头。
作为AI领域发展时间最久、积累最丰厚的垂直领域,NLP正在尝试塑造出一个产业智能化从技术到应用的完整范式,对百度而言,这张AI王牌中的王牌也是时候打出手了。
巨头的密集动作,直接表现出NLP这个AI排头兵在产业落地上的三大特征。
过去十年,百度大脑在NLP领域积累了大量的技术成果,例如包括国家科技进步奖在内的20多个奖项,30多项国际竞赛冠军,发表学术论文超过300篇,申请专利2000多项。

在以绝对的技术“称王”后,百度同时承担起推动技术产业化落地的责任。这次推出的中文自然语言处理数据共建计划『千言』和语言与知识技术算力共享计划,是领头羊承担行业责任、推动包括友商在内的行业共同进步的体现,已经脱离竞争范畴。
一股脑推出这些产品,表明NLP巨头在产业落地时典型的矩阵化特征。这其中既有百度原本就占据优势的业务(例如UNIT、智能创作平台)的再升级,也有根据市场需要新开发的能力,例如文心ERNIE、TextMind;
换一个角度看,这个矩阵也显示出百度NLP既能实现最底层的赋能,也能走向台前完成一线解决方案的塑造。

回过头来看,也只有NLP方面有深度积累的巨头才能完成这样的产业落地矩阵构建。
合格率99.9%的降落伞会导致每千名士兵有一人因为产品不合格而失去生命,当军方要求生产厂家负责人自己亲身检测产品后,“难以突破的”合格率马上被提到了100%。
这个二战典故带来的“降落伞”规则在很多当代产业合作中被实践,百度NLP也是如此,很多产品或解决方案都有应用在百度庞大的互联网、科技生态中的“经历”。
NLP产业应用往往面临“既要-又要”的表面矛盾,而所谓的产业落地,某种程度上就是破解这些“无法兼得”矛盾的过程。
这从百度NLP的产品或解决方案中可见一斑。

一方面,由于通用性,产业开发者可以基于共有的方案快速实现产品或解决方案的部署及上线;另一方面,随着产业智能化走向深度,不同产业客户往往都开始追求属于自己独特的定制化能力。

NLP产业落地还有牵扯要素更多的“我全都要”现象——在应用开发过程中,因为降本增效的主旋律,希望成本能够更低、效率可以更高,而开发者在庞杂的开发工作面前又往往还希望体验能够更好。

“既全且深”在过去是NLP开发者对平台服务的美好理想,既能够提供全面的服务,每个细分服务还能够做到足够得深。

在此基础上,智能创作平台进行了再升级,一次性推出囊括智能策划、智能采编和智能审校全链条的3大场景方案,而每个环节,都十分深度而不只是简单的布局。

在AI发展领域有典型的来自实践的“自增强循环”现象,即在深度积累下不断在自身业务、产业领域进行实践,将成果反馈,推动算法、数据等不断进步,自我强化,对行业的领先像滚雪球一样越滚越大。

在百度的构想中,它试图“团结”来自国内多家高校和企业的数据资源研发者,共同建设这样一个数据项目,在更多的“同行”加入下,获得更丰富的任务类型、更多的开源数据集合。

通过行业共建的方式汲取精华获得群策群力的成长,这是百度AI、NLP更大的手笔。
以这样的视角再来看百度在此次峰会上推出以王海峰为代表的百度NLP“十年十人”,可以认为,百度NLP在十年发展后,已经不单被定义为一种属于企业个体的优势技术,更成为百度推动机器更好地理解世界、服务于人这种技术信仰的典型代表,实现着更高维度的技术情怀。

总而言之,已经完成“技术扛鼎”的百度NLP,重心已经转移到了产业落地上。作为走在NLP应用于产业智能化最前线的巨头,百度走出了有自身调性的路子,也通过满足产业更复杂深度的方式来获得更广泛的认可,以及相对竞争对手的优势。与此同时,从竞争到竞合的行业态势,也通过百度的引导开始发生在NLP领域。
*此内容为【科技向令说】原创,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。
【完】