CN/EN

计算机视觉与机器人研究中心

计算机视觉与机器人研究中心立足于视觉和机器人方向的基础研究,专注于大规模的视觉表示学习、零样本及小样本物体识别、强化学习、智能控制等问题,以智能制造业为应用目标,通过核心技术的研究和突破,打造世界领先的机器视觉和智能机器人技术。

现由张磊博士任计算机视觉与机器人研究中心讲席科学家,他曾在微软亚洲研究院、微软总部研究院及计算机视觉相关产品部门任首席研究员,长期带领研究组从事计算机视觉方向的基础研究以及在大规模图像分析、物体检测、视觉语言多模态理解方面的应用,研究成果被广泛用于微软必应图像搜索及认知服务云计算平台。张磊博士在计算机视觉及多媒体计算领域顶级会议及期刊发表论文150多篇,并拥有60多项美国授权专利。因其对大规模图像识别和多媒体信息检索方面做出的贡献,他于2020年获选为IEEE Fellow。

计算机视觉与机器人研究中心旨在通过基础研究推动视觉及机器人技术的成熟和普及,探索大数据条件下基于大模型的表示学习问题,同时引入知识和结构来改进深度学习模型的推理和泛化能力,围绕智能制造业机器人所需的主动视觉和强化学习问题研究更普适、更鲁棒、可解释的智能技术,从而打造智能制造业为代表的「工业」人工智能,为新一代制造业赋能。

研究方向

超大规模机器学习平台,研究系统级别的机器学习算法优化,分布式环境下的数据并行、模型并行、数值计算分析、优化算法等关键问题,有效提高大规模模型训练效率。
视觉表示学习,研究大规模多模态数据中的视觉表示问题,以及如何有效地引入知识和结构信息,提高视觉表示的鲁棒性和可解释性。
视觉领域中的基础问题,研究大规模图像分类、物体检测、分割及跟踪、三维场景理解、视觉语言跨模态理解、零样本及小样本物体识别等问题,以及在应用中的模型优化和迁移学习。
新一代智能机器人技术,研究制造业环境中机器人手臂和移动机器人的主动视觉、强化学习、智能控制等问题,为「工业」人工智能赋能。

TOP