7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议正式开幕。高通公司中国区董事长孟樸出席大会首日全体会议产业发展主论坛并发表主题演讲。该论坛汇聚二十余位国内外人工智能及相关交叉领域的专家、业界领军人物、科技新锐力量及产业链各方代表,聚焦大模型、AI基础设施、智能终端等重点领域,着重剖析当下AI产业的全球性战略趋势,深度探讨人工智能应用前景、产业治理、生态建设等热点议题。
孟樸表示,近年来,生成式AI的兴起带来了新的应用和场景,为AI普及提供了广阔的空间,也为各个行业创造了巨大的商业价值。终端与云端的紧密结合,将成为推动生成式AI规模化扩展、加速数字化转型的关键所在。作为全球领先的无线科技创新企业,高通公司拥有超过15年的AI研发经验,持续引领终端侧AI创新,能够为终端设备提供最佳的硬件和软件,卓越的异构计算能力,包括NPU、GPU、CPU等,以及全栈软件优化和能效。高通公司现已赋能全球数十亿终端,涵盖手机、PC、汽车、扩展现实、网络和物联网终端等,在部署和推广终端侧AI方面独具优势,此外还与多家公司建立了合作,为开发者提供支持,进一步推动AI在各行业的应用创新。
以下为演讲全文:
各位来宾,行业同仁,大家下午好!很荣幸参加今年的世界人工智能大会。作为全球领先的无线科技创新企业,高通致力于推动终端侧AI的发展,非常高兴能与大家分享我们在端侧AI的实践,以及对未来趋势的看法。
过去几十年,人工智能经历了多个发展阶段,每个阶段都呈现了独特的挑战和机遇。特别是近年来,生成式AI的兴起带来了新的应用和场景,为AI普及提供了广阔的空间,也为各个行业创造了巨大的商业价值。根据麦肯锡的报告,生成式AI每年将为60多个用例,在全球范围内带来2.6万亿至4.4万亿美元的经济效益增长,大致相当于英国2021年的GDP规模。
虽然当前生成式AI的研发和应用主要集中在云端,并且云计算仍将发挥重要作用,但如果将20%的生成式AI工作负载转移到终端侧,预计到2028年将节省160亿美元的计算资源成本。这种终端与云端的紧密结合,将成为推动生成式AI规模化扩展、加速数字化转型的关键所在。同时,为了推动生成式AI的广泛应用,我们也需要将其能力延伸到日常使用的智能设备上,如智能手机、移动PC和智能网联汽车等。
实现生成式AI在终端上的落地,将创新转化为极具实用性的应用和体验,需要在终端侧打造高性能AI处理器。经过数十年在高性能低功耗计算领域的创新,如今的智能手机拥有比2000年的超级计算机更强的计算能力,而且其能耗甚至比一个LED灯泡还要低。这种技术进步在确保性能的同时,能延长电池寿命并提高能效,使仅靠电池供电的移动终端也能随时随地运行生成式AI。
此外,我们还需要对生成式AI模型进行训练优化,使其体量越来越小,效率越来越高,不断向终端侧迁移。随着“小型”生成式AI模型质量的提高,我们现在能够在终端设备上运行与云端大模型相当、甚至更好的AI模型。这一进展为在终端设备上部署高质量的生成式AI打开了大门。
高通公司持续引领终端侧AI创新,拥有超过15年的AI研发经验,能够为终端设备提供最佳的硬件和软件,卓越的异构计算能力,包括NPU、GPU、CPU等,以及全栈软件优化和能效。我们赋能了全球数十亿终端,涵盖手机、PC、汽车、扩展现实、网络和物联网终端等,在部署和推广终端侧AI方面独具优势。此外,高通还与多家公司建立了合作,为开发者提供支持,进一步推动AI在各行业的应用创新。
IDC预计,2027年中国新一代AI手机出货量将达到1.5亿台,市场份额超过50%。面对这样的发展机遇,我们推出了第三代骁龙8移动平台,最高可以支持100亿参数的生成式AI模型。目前包括小米、荣耀、一加、OPPO、vivo、三星等在内,已有超过20款搭载该平台的旗舰手机产品发布,支持丰富的生成式AI用例。
在PC方面,咨询公司预计,AI PC的渗透率将从2024年的2%上升到2028年的65%,AI PC将引领PC市场的下一阶段增长。高通先后发布了骁龙X
Elite和骁龙X
Plus平台,凭借高达45TOPS算力的NPU,为PC带来了全新AI体验。截止目前,我们携手微软和众多生态伙伴,已推出超过20款由骁龙X系列独家支持的首批Windows
11 AI PC。
在汽车领域,“AI上车”正成为现实。目前,基于骁龙8295座舱平台,包括理想、小鹏、极越等在内的多家厂商,已经发布了其打造的车端大模型功能。随着多模态技术的发展,生成式AI有望为智能座舱、自动驾驶等领域开辟全新应用前景。今年5月底,高通连续第二年在中国举办了以汽车为主题的生态大会,我们与众多产业伙伴共同呈现了60多个创新技术和超过185项产品演示,支持“越来越聪明的车”行驶在“越来越智慧的路”上。
生成式AI除了利用文本之外,还可以使用更多其他模态学习:这正是多模态生成式AI模型发挥的作用。早在今年2月,高通就展示了全球首个在Android手机上运行的多模态大模型(LMM),可基于图像输入生成多轮对话。具有语言理解和视觉理解能力的多模态大模型,将赋能诸多用例。
为了推动生成式AI实现规模化扩展,提供情境化、定制化和个性化的体验,高通还实现了在Android智能手机上运行LoRA(Low-Rank
Adaptation)模型。通过LoRA适配器减少模型可训练参数量,可以降低训练成本,提高模型在特定任务上的准确性,从而支持在终端侧实现更高效、可扩展和定制化的AI应用。我们认为,LoRA和多模态AI是终端侧生成式AI未来发展的关键技术范例。
2021年,高通就首次提出“5G+AI赋能千行百业”。如今,随着大模型的推出以及AI在云端、边缘和终端侧的广泛应用,再加上5G的飞速发展,我们更加清晰地看到了这些技术背后所蕴含的丰富发展机遇。高通公司始终秉持创新驱动的发展理念,不断推动AI研发、硬件开发和软件优化,并致力于为开发者提供全方位支持。我们的目标是通过与全球合作伙伴紧密协作,让智能计算无处不在。
谢谢大家!祝本次大会圆满成功!