CN/EN

AI金融与深度学习研究中心

AI金融与深度学习研究中心(简称FinAI)是沈向洋院士创建IDEA后成立的第一个研究中心。我们的愿景是打造在金融分析决策能力上超越人类的人工智能“超级大脑”(简称“金融超脑”计划)。随着近年人工智能三要素(大数据技术、深度学习算法技术、超级计算机技术)的飞速发展,金融领域正面临一场史无前例的变革。金融超脑的使命是发展最前沿的AI技术来实现前所未有的精准金融投资与金融信贷,实现更实时更全面的多层次系统化金融风险防控,让社会经济资源在公平的基础上更优化更快速地匹配,实现普惠全社会的发展共赢。我们正在创建一个世界顶级的开放式研究与技术平台,吸引全世界致力于AI金融这一前沿交叉领域的科学家和工程师参与研究和创新,并在证券、资管、投资、银行等金融行业实现大范围产业化落地。

金融超脑系统平台由5个层面组成:超算系统、数据系统、知识图谱、决策引擎和产业应用(如下图所示)。


超算系统:超算集群是金融超脑计划的硬件基础和算力支撑。在现有CPU-GPU异构超算架构的基础上,我们正在对众多金融算法、大数据算法、机器学习算法、深度学习算法和强化学习算法进行算法层面和系统层面的并行计算优化、通信优化、内存/显存优化、指令集优化乃至FPGA硬件加速,部分算法实现了在现有硬件基础上10x-1000x的计算性能提升。

数据系统:通过与第三方合作和自建的数据挖掘与管理系统,融合高中低全频段金融行情、事件行为、分析师、传统基本面、另类基本面、信贷交易等多维度多周期跨市场的金融大数据,实现对金融实体(上市公司、非上市企业、重要人物、重要事件等)的完整画像和动态分析。

知识图谱:在金融大数据库和金融实体画像的基础上,运用NLP、深度学习、小样本学习、迁移学习等技术,建立金融实体之间的多样性关联关系(产业链、资本链、供应链、诉讼链等)和事件因果关系。与此同时,研究和开发适用于超大型金融行为知识图谱分析的新型时序图推理算法与技术,在预测精度、可解释性、计算复杂度、并行计算能力、置信度和鲁棒性之间找到最优平衡点。

决策引擎:在金融实体画像和金融行为知识图谱的基础上,研发千亿级参数的超大型时序深度学习模型、大型时序深度学习和深度强化学习模型并实现分布式AutoML自动模型优化技术,探索研究面向金融领域的万亿参数级预训练大模型,研发百亿级搜索能力的金融信号自动挖掘平台和自动搜索算法与系统优化技术。研发支持超大型金融机器学习模型分布式训练和低延迟推理的软件和硬件加速技术。

产业应用:金融超脑的应用场景围绕金融证券、基金、投资、银行、保险行业的发展痛点和国家金融安全战略需求,重点发展金融资产管理和财富管理领域的AI技术与系统平台。未来5年,我们将在AI精准投资与系统性风险实时计算、全球金融衍生品AI云定价系统、证券市场高精度仿真与极端行情模拟、智能化投资研究与风险决策系统等展开深入的研究和产业化落地。

重点研究项目

1.投资风控中的深度&强化学习难题:金融市场的时间序列数据具有噪音极大(信噪比在1:100到1:1000数量级)、平稳性差(市场有效性逐年变强,市场风格切换加快,导致金融信号和机器学习模型失效速度加快)、一致性差(定价预测、风险管理、执行优化等相互独立,缺乏全局优化)、可解释性差(超大规模深度学习黑箱难以理解,成为实证分析和认知推理的阻碍)等特点,针对这些问题,我们研究新型的机器/深度/强化学习算法和新型数据建模框架,力求在金融机器学习系统的预测能力、可解释推理认知能力和预测稳定性上取得显著提升。

2.超大规模金融信号挖掘与自动建模:金融信号(或因子)是刻画了某些特定金融规律的具有一定预测能力的数学规则、统计学模型或机器学习模型。传统的手工建模方式效率低成本高。我们通过AI算法将人工建模的分析、思考、设计过程转化为复杂数学空间中的搜索优化过程,运用分布式计算实现高效的易扩展的金融信号自动挖掘流程。

3.金融行为知识图谱与认知推理计算:力争用5年时间完成全球最大的金融行为知识图谱,构建起全行业、全品种、全产业链、全周期、全球市场的通用型动态金融信息网络、挖掘金融经济实体和事件之间纷繁复杂的关联关系、因果关系和动态变化趋势。与此同时,我们研究新型认知逻辑推理算法,融合概率图符号推理与图神经网络,实现基于现有知识图谱的认知推理能力和分析决策能力。

4.多模态金融场景的深度学习预训练大模型:近年以BERT、GPT、DALLE/CLIP为代表的深度学习自监督模型在NLP和多模态预测领域取得了很大的成功,我们认为此范式在金融领域有巨大的研究和应用潜力。我们研究面向全球金融证券市场投资风控场景下的万亿级参数的超大型多模态时序深度学习模型,研究跨行业跨周期跨市场跨金融产品的通用AI大模型及其场景迁移模式,针对金融行为预测场景研究transformer、MLP-mixer等大型模型之外的新型时序模型与范式,研究超大型模型的自动特征工程/自动优化/自动集成/自动迁移技术。

5.金融算法和机器学习算法的软硬件加速:随着算法技术、超算技术和大数据技术的飞速发展,金融数据分析正向着超细颗粒度和超多样性数据维度发展,对在算法层面、软件层面和硬件层面上对金融算法和深度学习算法进行训练加速和推理加速提出了极高的要求。我们研究GPU和FPGA技术对金融算法实时推理性能加速,研究基于FPGA技术的金融计算低延迟性能,研究超算CPU-GPU硬件架构下Transformer、图卷积网络、图注意力网络等经典模型和NAS/MoE技术的分布式计算优化。

6.金融衍生品AI 精准定价模型与云平台:以期权、利率互换为代表的金融衍生品是全球规模最大的金融产品市场,衍生品投资和风控的核心是如何精准的定价。正确的、精准的资产定价有助于衍生品在金融市场中发挥风险对冲的作用,降低标的物(大宗商品、债券、股票或股票指数)自身价格波动带来的市场风险。传统定价策略和隐含波动率计算主要基于求解以随机微分动力系统为代表的复杂数学模型,其定价计算严重依赖于模型假设的准确性和求解器的效率。我们研究将深度学习技术与随机微分方程模型相融合来提升定价精度,并以此为基础研发新型金融衍生品定价云平台。

团队介绍

IDEA-FinAI研究中心由前哈佛大学大数据科学家、IDEA助理院长郭健教授领衔,汇聚了一批在深度学习、数据科学、NLP和量化金融领域一流的科学家和工程师。我们的研发团队成员多来自哈佛大学、哥伦比亚大学、UC-Berkeley、康奈尔大学、密西根大学、Northwestern大学、UIUC、剑桥大学、曼彻斯特大学、北京大学、清华大学、浙江大学、哈尔滨工业大学、香港科技大学、香港大学、香港中文大学、香港浸会大学、香港城市大学等全球知名高校以及腾讯、华尔街知名对冲基金等全球知名科技与金融企业。我们秉承“科学家思想、工程师执着、创业者精神”的人才理念,坚持“创新、分享、公平、回报”的氛围,奉行技术优先的“工程师文化”。我们绝对信任年轻人的巨大潜力,激励每一位年轻人发挥无限的创造力,干大事挑大梁,一起做改变金融行业未来格局的新技术,一起挑战世界前沿的技术领域,一起拼搏取得学术和产业上的双重成功。


FinAI联系方式:service-FinAI@idea.edu.cn

TOP