CN/EN
认知AI的下一个十年将会如何?张家兴谈三大可能方向
2022-11-04
分享:
近日,IDEA研究院认知计算与自然语言研究中心(简称IDEA研究院CCNL)开源了首个中文版本Stable Diffusion AIGC模型-太乙,这是IDEA研究院CCNL在建设认知智能的基础设施的道路上取得的又一个里程碑。太乙开源模型的推出,可以更好地助力AIGC全球市场化下中国文化产业数字化转型的创新发展,并加快各个相关行业的升级速度。

AIGC只是认知AI未来十年发展中的第一步,它的无限可能性还有哪些?IDEA研究院CCNL讲席科学家张家兴在品玩十周年系列开放论坛上的主题演讲,可以为我们提供一些方向。

过去十年,认知AI逐渐从象牙塔走向人们的日常生活。从图像分类开始,发展出智能客服、机器翻译、人脸识别和自动驾驶等技术,以及广为人知的AlphaGo,认知AI无处不在,为我们带来无限可能。

在知名科技媒体品玩十周年系列开放论坛上,IDEA研究院CCNL讲席科学家张家兴受邀发表主题演讲,展望认知AI的下一个十年,围绕 “机器拓展人类想象力”、“预训练基础模型成为产业” 和 “AI生成AI”三方面分享了他的思考。



机器拓展人类想象力

何为认知智能?在张家兴看来,就是能让机器像人一样地认知和行动。他认为,未来十年,随着人类对科学的无限探索,AI将同时发挥拓展人类能力的作用,其中之一就是想象力。

“所谓的想象力本质上就是一种暴力搜索。” 张家兴表示,想象力并非人类所特有,人能想象出来的内容往往已存在大脑之中,以碎片形式存在,而想象力就是从大量碎片中找到想要的信息,并组织成一个超越现实的能力。这种搜索机制,机器同样能够实现。

针对图像的想象,以IDEA研究院CCNL开发的封神榜预训练模型体系为例,现有的太乙模型可以很好地理解中文语义,生成高质量的图像。例如,太乙可以根据古诗词文本自动生成图像,得到准确展现诗词韵味的想象画面。


太乙模型文本生成图像案例

对文字的想象,实质就是因果推理,即当我们给定一个事实,AI能据此推导出可能产生的各种结论。张家兴表示,当前预训练大模型不仅具备很强的逻辑能力,还能从海量数据中学习知识,在训练过程中融合知识和逻辑,最终完成推理。所谓机器的自主思考,可以理解为一个无限推理过程,未来认知AI发展的一个重要方向,就是构建无限的因果推理,让机器具备自主思考能力。


模型根据 “玉米价格持续上涨” 进行因果推理获得多个结果


预训练基础模型成为产业

近年来,众多公司和研究机构都在开发预训练大模型,模型参数规模不断扩大,如今已无限逼近人类大脑皮层万亿参数规模。就像CPU、GPU等通用芯片构成了IT系统的基础,预训练模型也已成为AI系统的“软芯片”。


预训练模型是AI系统的基础

“正如芯片一样,预训练模型也凝结了海量的数据和算力,使得它们具备一定的通用能力。基于这些能力,我们可以搭建出更加专业化的模型,并在此基础上发展出各个层面的AI产品和服务。”张家兴以封神榜预训练模型体系为例,介绍了燃灯、余元和二郎神三个模型在自然语言理解、知识问答、信息抽取、摘要生成等任务上的出色成果。

随着AI认知能力不断提升,预训练基础模型很大可能成为一个全新产业,当中既有数据公司提供数据,算力平台提供算力,还有专门提供训练框架和训练模型的公司,供给下游厂家使用,最终形成一个完整的产业生态体系。


AI生产AI

除发展具备通用能力的基础模型外,随着数字经济的发展,越来越多的企业需要定制化的模型,以应用到各种业务场景,但目前定制化模型生产面临着人才稀缺、数据稀缺的问题。

张家兴指出,人类技术发展的一个趋势,就是逐步走向机器生产机器,我们就是要用AI生产AI来解决人才和数据这两个痛点。可以依托预训练大模型逐渐强大的基础认知能力,实现小样本学习,同时借助大模型文本生成能力来扩充训练数据,最终实现自动化生产AI模型。


在模型生产上,机器将超越人类算法专家

改变当前纯手工的模型生产模式,IDEA研究院CCNL团队自主研发了GTS模型生产体系,Generator、Teacher、Student三种不同规模的预训练模型协作,结合不同领域算法专家团队和强大的系统工程能力,正在努力为用户提供定制化模型的自动生产服务。目前GTS模型生产体系生产的模型效果已经达到了人类最强算法专家水平。张家兴认为,未来AI在模型生产能力上很可能超越人类。

“未来十年,整个AI领域在技术范式和产业模式上,必然会发生一次非常重大的改变。”这一重大改变,将为社会增加大量的数字生产力,推动人类社会的发展进入一个新阶段。

TOP