2024年1月7日,第二十五届北大光华新年论坛在bat365在线平台网站百周年纪念讲堂举行,本届论坛的主题为“增长动能 中国探索”。论坛上,百度集团副总裁袁佛玉发表了题为《生成式AI,进入智能原生时代》的演讲。
袁佛玉表示,技术真正的价值只在于应用。没有构建于大模型之上的繁荣的产业应用,大模型本身就毫无价值。生成式AI正式进入了拼落地、拼应用的“下半场”,当下就是最重要的应用创新窗口。她认为,生成式AI带来的全新机会在于用好AI智能涌现之后出现的理解、生成、逻辑和记忆四大核心能力,去创造出过去没有过的全新的用户体验、更高的生产效率。
以下为发言实录:
大家好!非常开心有机会来光华新年论坛做分享。
2023年,全球和中国整个市场对生成式AI和大模型技术的可能性以及对各行各业的改造潜力非常兴奋,有观点把它称作是“上半场”,我们通过一个视频来简单地回顾一下这一年多。
其实人工智能出现过好几次浪潮,比如出现过下围棋、人脸识别等等应用,一开始市场也非常热,但随着落地过程中出现各种挑战,包括应用有限、场景分散,使得很难标准化,企业在应用过程中发现经济模型算不过来账等等,随后就会进入低谷。
但是这一次和以往任何一次的AI浪潮非常不同的地方在于它的通用性,我们叫作智能涌现,就是没有教过的现在它的也许会了。有了这个通用性智能涌现的特点之后,当你有能力有一套基础很好的技术,就有机会在各行各业都能快速地做出有真正产业价值的应用,这就是过去AI七十多年都没有过的全新的一次机会。
技术真正的价值只在于应用。没有构建于大模型之上的繁荣的AI原生应用,大模型本身就毫无价值。所以,我们认为,站在2024年一开头再谈“百模大战”已经没有意义,也可以说已经成为过去时。一方面,重复开发多个几乎没有实际应用的大模型,是对社会资源的极大浪费,尤其是在算力还受到限制的情况下。另外,在实际应用中,基础大模型之间的梯队已经显著拉开,随着建在大模型之上的工具链、平台生态和部分的应用的出现,大模型的能力差距已经越来越大。
刚才,黄铁军老师用发动机来形容大模型的技术,我们很容易理解,当人类历史上出现了电和电动机这样的重大发明之后,我们其实要做的不是全社会重新把电和电动机做一遍,而是围绕着这项技术,我们把上面的电网、服务生态和各种电器的应用做起来,使得它真正能够在不同的产业应用下产生价值,大模型也是如此。当我们已经拥有了很多企业建立的可用的大模型,接下来我们要做的就是应用驱动,通过实际应用价值的需要来倒推基础模型技术的进步,而不是整个社会再把基础大模型做一遍。
这并不意味着创新机会变小了,实际上根据刚才的例子我们能够理解到,实际上机会最大的应用层机会才刚刚开始,有着巨大的创新空间。在我们列出了大家比较熟悉的近期几次关键技术和爆款应用产生的时间差(详见PPT)。
PC时代,IBM PC推出9年后,诞生了微软Office这样的标志性应用。移动互联网时代,iPhone发布后4年,迎来了微信等系列爆款应用。时间从9年缩短到4年,因为底层技术越来越完善,创新爆发越来越快。在AI原生时代,爆款应用诞生的时间会进一步加速。在产业中讨论的时候,会有部分非常积极的探索者认为已经有爆款应用正在产生。2024年是大家非常期待的一年,我们会认为很多有价值的、明星的应用会持续爆发。所以当下就是最重要的应用创新的窗口,推动生成式AI真正落地到各行各业。
面对生成式AI,什么是我们最应该抓住的创新机会?我们的基本理念就是:要基于过去没有而现在有了的能力,去解决过去解决不了或解决不好的问题,就会带来真正的价值,带来有巨大的创新空间。这个过去没有而现在有了的能力,就是AI智能涌现之后,出现的四大核心能力——理解、生成、逻辑和记忆。我们要思考,在业务里面怎么用好这四大能力,去创造全新的用户价值、全新的生产效率。
基于技术只有用起来才有价值的这个理念,百度智能云去年三月推出了千帆大模型平台,帮助企业更简单、更经济地把生成式AI用起来。企业与此相关的应用方式我们在实践中认为可以分为五类、三个层面。
自上往下看,最共性的需求,就是应用。一种方式是直接选择已经被开发出来的应用,我们已经推出了千帆应用商店,上面上架了积累了很多开发者开发出来的AI原生应用。在应用层,也有很多企业希望自己去开发更符合自己特殊性、个性化需求的应用。千帆提供了App builder开发工作台,集成了大模型应用开发的常见模式、工具和流程、范式,支持最低门槛的应用开发。
应用层往下是模型层。也有两种情况:有些应用是直接调用已有的基础大模型就可以完成;有些垂直领域的应用,需要在基础大模型之上进行模型精调等等二次开发才能满足需求。所以在这一层,千帆推出了Model builder工具链,支持专有模型开发、模型精调等。一站式可以完成专有模型的开发,以支撑它最终的应用。
从模型层再往下,是AI算力的需求。在这一层,我们有百度百舸AI异构计算平台,是具备万卡集群能力的智算基础设置,支持了百度文心系列大模型的训练、以及很多客户的智算需求。
在过去一年多的经历里面,我们看到,很多专业场景的实际落地都是大模型套小模型的模式,这个模式也越来越被行业所关注和认可,它同时满足性能、效率和成本的需求——行业专有模型更快、更小、成本更低,可用性更强;大模型通用能力更强,更加智能,可以进行增强和兜底。
千帆大模型的推出,就是为了支持整个社会产业经济,更快地把生成式AI的能力用起来。现在一年多的发展之后,它的易用度到底怎么样?我想举一个例子说明。前几天,吴晓波老师做一年一度的年终演讲,过去准备这个演讲花很多时间,有一个团队,有很多的问题要问他的助理,要准备整理大量的资料。今年准备演讲的过程当中,吴晓波老师在千帆平台上自己亲手用10分钟零代码开发了一个年终演讲的助手,即时回答他所有知识检索和整理的需求,包括过去往年他演讲内容的整理。
所以,最终一个技术能够用起来,除了通用大模型的能力要非常强,其实还需要非常多的建设,包括呈现应用的开发平台,要有一个足够简单的、低门槛的、低成本的经济性开发平台,才可能真正帮助企业,尤其是整个增长环境都非常有挑战的情况下,真正地应用起来。
经历了2023年的兴奋,现在产业界的焦点都放到了实际的应用上,并且是要计算应用的经济模型,并且最终要回归价值本质——谁的效率高、谁能创造的业务价值更确定,谁就会胜出,而不仅仅是所谓的通用能力本身。
2023年,百度文心大模型是在IDC等专业机构的评估中非常领先的一个大模型,面向企业客户我们的千帆平台也服务了超过4万家企业客户。这张趋势图是千帆平台大模型API公有云调用量曲线,一直保持着超过30%周度高增速。
高速发展的背后是什么?舆论场上大家非常关注通用大模型的能力,但其实在应用上一项技术要健康地发展,有更多关键的因素,我在这里想分享的是关于成本的优化。例如,文心一言从去年3月份发布至今,推理的成本下降到了最初的1%,也就是原来有些企业想用这项技术,但是因为成本高,可能一天只敢调用一万次,今天同样的成本可以调用100万次,这样企业才有可能真正在大规模在线运营的业务里面把它用起来,真正降低应用门槛。
纸上得来终觉浅,绝知此事要躬行。看再多的文章也不如我们要实践,要去探索。这是一轮长周期的大变革,它会重置很多已有的成功经验,我们认为只有更快地行动起来,把它用起来才能真正地把握住机会。
我今天的分享就这么多,谢谢大家!(完)