过去十年,认知 AI 逐渐从象牙塔走向人们的日常生活。从图像分类开始,发展出智能客服、机器翻译、人脸识别和自动驾驶等技术,以及广为人知的 AlphaGo,认知 AI 无处不在,为我们带来无限可能。
在知名科技媒体品玩十周年系列开放论坛上,IDEA 研究院 CCNL 讲席科学家张家兴受邀发表主题演讲,展望认知 AI 的下一个十年,围绕 “机器拓展人类想象力”、“预训练基础模型成为产业” 和 “AI 生成 AI”三方面分享了他的思考。
何为认知智能?在张家兴看来,就是能让机器像人一样地认知和行动。他认为,未来十年,随着人类对科学的无限探索,AI 将同时发挥拓展人类能力的作用,其中之一就是想象力。
“所谓的想象力本质上就是一种暴力搜索。” 张家兴表示,想象力并非人类所特有,人能想象出来的内容往往已存在大脑之中,以碎片形式存在,而想象力就是从大量碎片中找到想要的信息,并组织成一个超越现实的能力。这种搜索机制,机器同样能够实现。
针对图像的想象,以 IDEA 研究院 CCNL 开发的封神榜预训练模型体系为例,现有的太乙模型可以很好地理解中文语义,生成高质量的图像。例如,太乙可以根据古诗词文本自动生成图像,得到准确展现诗词韵味的想象画面。
对文字的想象,实质就是因果推理,即当我们给定一个事实,AI 能据此推导出可能产生的各种结论。张家兴表示,当前预训练大模型不仅具备很强的逻辑能力,还能从海量数据中学习知识,在训练过程中融合知识和逻辑,最终完成推理。所谓机器的自主思考,可以理解为一个无限推理过程,未来认知 AI 发展的一个重要方向,就是构建无限的因果推理,让机器具备自主思考能力。
近年来,众多公司和研究机构都在开发预训练大模型,模型参数规模不断扩大,如今已无限逼近人类大脑皮层万亿参数规模。就像 CPU、GPU 等通用芯片构成了 IT 系统的基础,预训练模型也已成为 AI 系统的“软芯片”。
“正如芯片一样,预训练模型也凝结了海量的数据和算力,使得它们具备一定的通用能力。基于这些能力,我们可以搭建出更加专业化的模型,并在此基础上发展出各个层面的 AI 产品和服务。”张家兴以封神榜预训练模型体系为例,介绍了燃灯、余元和二郎神三个模型在自然语言理解、知识问答、信息抽取、摘要生成等任务上的出色成果。
随着 AI 认知能力不断提升,预训练基础模型很大可能成为一个全新产业,当中既有数据公司提供数据,算力平台提供算力,还有专门提供训练框架和训练模型的公司,供给下游厂家使用,最终形成一个完整的产业生态体系。
除发展具备通用能力的基础模型外,随着数字经济的发展,越来越多的企业需要定制化的模型,以应用到各种业务场景,但目前定制化模型生产面临着人才稀缺、数据稀缺的问题。
张家兴指出,人类技术发展的一个趋势,就是逐步走向机器生产机器,我们就是要用 AI 生产 AI 来解决人才和数据这两个痛点。可以依托预训练大模型逐渐强大的基础认知能力,实现小样本学习,同时借助大模型文本生成能力来扩充训练数据,最终实现自动化生产 AI 模型。
改变当前纯手工的模型生产模式,IDEA 研究院 CCNL 团队自主研发了 GTS 模型生产体系,Generator、Teacher、Student 三种不同规模的预训练模型协作,结合不同领域算法专家团队和强大的系统工程能力,正在努力为用户提供定制化模型的自动生产服务。目前 GTS 模型生产体系生产的模型效果已经达到了人类最强算法专家水平。张家兴认为,未来 AI 在模型生产能力上很可能超越人类。
“未来十年,整个 AI 领域在技术范式和产业模式上,必然会发生一次非常重大的改变。”这一重大改变,将为社会增加大量的数字生产力,推动人类社会的发展进入一个新阶段。
过去十年,认知 AI 逐渐从象牙塔走向人们的日常生活。从图像分类开始,发展出智能客服、机器翻译、人脸识别和自动驾驶等技术,以及广为人知的 AlphaGo,认知 AI 无处不在,为我们带来无限可能。
在知名科技媒体品玩十周年系列开放论坛上,IDEA 研究院 CCNL 讲席科学家张家兴受邀发表主题演讲,展望认知 AI 的下一个十年,围绕 “机器拓展人类想象力”、“预训练基础模型成为产业” 和 “AI 生成 AI”三方面分享了他的思考。
何为认知智能?在张家兴看来,就是能让机器像人一样地认知和行动。他认为,未来十年,随着人类对科学的无限探索,AI 将同时发挥拓展人类能力的作用,其中之一就是想象力。
“所谓的想象力本质上就是一种暴力搜索。” 张家兴表示,想象力并非人类所特有,人能想象出来的内容往往已存在大脑之中,以碎片形式存在,而想象力就是从大量碎片中找到想要的信息,并组织成一个超越现实的能力。这种搜索机制,机器同样能够实现。
针对图像的想象,以 IDEA 研究院 CCNL 开发的封神榜预训练模型体系为例,现有的太乙模型可以很好地理解中文语义,生成高质量的图像。例如,太乙可以根据古诗词文本自动生成图像,得到准确展现诗词韵味的想象画面。
对文字的想象,实质就是因果推理,即当我们给定一个事实,AI 能据此推导出可能产生的各种结论。张家兴表示,当前预训练大模型不仅具备很强的逻辑能力,还能从海量数据中学习知识,在训练过程中融合知识和逻辑,最终完成推理。所谓机器的自主思考,可以理解为一个无限推理过程,未来认知 AI 发展的一个重要方向,就是构建无限的因果推理,让机器具备自主思考能力。
近年来,众多公司和研究机构都在开发预训练大模型,模型参数规模不断扩大,如今已无限逼近人类大脑皮层万亿参数规模。就像 CPU、GPU 等通用芯片构成了 IT 系统的基础,预训练模型也已成为 AI 系统的“软芯片”。
“正如芯片一样,预训练模型也凝结了海量的数据和算力,使得它们具备一定的通用能力。基于这些能力,我们可以搭建出更加专业化的模型,并在此基础上发展出各个层面的 AI 产品和服务。”张家兴以封神榜预训练模型体系为例,介绍了燃灯、余元和二郎神三个模型在自然语言理解、知识问答、信息抽取、摘要生成等任务上的出色成果。
随着 AI 认知能力不断提升,预训练基础模型很大可能成为一个全新产业,当中既有数据公司提供数据,算力平台提供算力,还有专门提供训练框架和训练模型的公司,供给下游厂家使用,最终形成一个完整的产业生态体系。
除发展具备通用能力的基础模型外,随着数字经济的发展,越来越多的企业需要定制化的模型,以应用到各种业务场景,但目前定制化模型生产面临着人才稀缺、数据稀缺的问题。
张家兴指出,人类技术发展的一个趋势,就是逐步走向机器生产机器,我们就是要用 AI 生产 AI 来解决人才和数据这两个痛点。可以依托预训练大模型逐渐强大的基础认知能力,实现小样本学习,同时借助大模型文本生成能力来扩充训练数据,最终实现自动化生产 AI 模型。
改变当前纯手工的模型生产模式,IDEA 研究院 CCNL 团队自主研发了 GTS 模型生产体系,Generator、Teacher、Student 三种不同规模的预训练模型协作,结合不同领域算法专家团队和强大的系统工程能力,正在努力为用户提供定制化模型的自动生产服务。目前 GTS 模型生产体系生产的模型效果已经达到了人类最强算法专家水平。张家兴认为,未来 AI 在模型生产能力上很可能超越人类。
“未来十年,整个 AI 领域在技术范式和产业模式上,必然会发生一次非常重大的改变。”这一重大改变,将为社会增加大量的数字生产力,推动人类社会的发展进入一个新阶段。