CN/EN
IDEA研究院GTSfactory入选信通院首批大模型优秀应用案例
2022-08-30
分享:
用AI生产AI,赋能企业数字化转型

日前,由中国信息通信研究院、深度学习技术及应用国家工程研究中心、人工智能关键技术和应用评测工信部重点实验室共同主办的2022可信AI峰会在北京召开,会上发布了大规模预训练模型技术与应用评测标准体系,并公布了2022大模型优秀应用案例名单。

在首批大模型应用案例的征集中,由IDEA研究院认知计算与自然语言研究中心(简称IDEA研究院CCNL)自主研发、独立申报的“自动化模型生产平台GTSfactory”,经多轮评审复查,成功入选“2022大规模预训练模型优秀应用案例”。

用AI自动化生产AI模型,GTSfactory聚焦解决行业痛点,在大模型指导下为用户提供小样本、低成本的专用AI模型生成服务,助力中小企业打破技术壁垒,赋能更多企业数字化转型。此次入选是GTSfactory创新技术及应用实践获得行业认可的证明。

IDEA研究院 GTSfactory入选中国信通院“2022大规模预训练模型优秀应用案例”


小样本大模型 创新训练体系

精准解决行业痛点

大规模预训练模型(简称大模型)作为新一代人工智能发展范式,能显著提升AI技术能力,有效助推AI工程化落地进程。然而,硬件算力、训练数据、优化算法的高门槛要求,一定程度上阻碍了大模型的规模化应用和发展。中小企业普遍存在数据稀缺、样本量小、缺少专业算法工程师等问题,预期消耗的人力、财力,也让企业对选用AI模型解决业务难题望而却步。

GTSfactory作为AI模型自动化生产平台,背后依托于IDEA研究院CCNL首创的G-T-S(Generator-Teacher-Student)训练体系,能够精准解决企业在人力、数据、算力上的三大痛点,真正实现零门槛模型自动化生产,帮助中小企业突破技术壁垒,让AI技术普惠万千企业。

Generator利用预训练大模型强大的文本生成能力,为训练任务生成更多的训练样本。Teacher利用预训练大模型天然的少样本学习能力,指导整个训练过程。Student是用户可下载的轻量化模型,综合了如元学习、增量学习、半监督学习等多项机器学习技术,训练过程中会在Generator和Teacher的帮助下逐步提升准确率,最终实现“更少的参数量,更高的准确率,更便捷的使用”。

在G-T-S训练体系下,用户只需输入少量训练样本,无需AI模型训练相关知识,就能得到一个可以直接部署的轻量级小模型,帮助中小企业大大减少获得AI模型的成本。由GTSfactory高效生产出的各类模型,可方便地嵌入到定制化AI产品中,适应各种复杂的商业场景。

IDEA研究院CCNL首创的G-T-S训练体系


多场景实践落地

助推大模型产业化应用

GTSfactory自动化模型生产平台已于2022年5月30日正式上线并开放公测,目前专注于自然语言处理领域,适用在意图分类、内容审核、情感倾向分析、事件发现等业务场景,支持电商评论情感分析、科学文献学科分类、新闻分类、应用描述主题分类等工作任务。

GTSfactory自动化模型生产平台业务场景举例

“用AI生产AI”是GTSfactory的产品理念,面对用户复杂的业务场景及稀少的业务数据,GTSfactory可以生产出超越一般算法工程师的高性能AI模型。在包括FewCLUE在内的多种少样本文本分类任务中,GTSfactory生产出的模型,准确率已远超常见的基于“BERT+微调”生产的模型,模型表现也已接近人类算法专家生产模型的最好水平(SOTA)。

GTSfactory生产的模型效果

GTSfactory在自然语言处理领域的落地实践,为大模型落地应用起到良好的示范作用。未来,GTSfactory将继续探索AI模型自动化生产的多种可能,为企业提供更好的用户体验、更好的模型效果以及更多的应用场景,助力更多企业实现数字化转型及AI建设,持续为大模型及AI产业落地贡献力量。

TOP