2022 IDEA 大会上,举行了一场以“科技是第一生产力:从学术社区到学术生态”为主题的圆桌讨论。圆桌上,便利蜂 CTO、Wormpex AI Research 院长兼首席科学家华刚,约翰威立国际出版集团中国区战略合作总监乔昆鹏,CSDN 副总裁邹欣,IDEA 研究院计算机视觉与机器人研究中心讲席科学家张磊,IDEA 研究院工程总监谢育涛,共同探讨如何提高科研效率、打造学术社区,共建科研生态。
本场圆桌集齐了科研创作者、学术会议组织人、社区建设者、出版方四种角色。“今天邀请到的几位嘉宾,每个人在学术生态中都有独特的站位。”谢育涛介绍,“华刚是 CVPR (IEEE 国际计算机视觉与模式识别会议) 2022 年的 Program Chair (会议主席)之一,邹欣是专业 IT 社区 CSDN 副总裁,乔昆鹏是 John Wiley (约翰威立)国际出版集团中国区战略合作总监,张磊是我们 IDEA 研究院的讲席科学家,资深科研工作者, 他也参与了 CVPR 2022 年的 review (评审)工作。”
张磊首先从科研工作者的角度描述了四种学术社区。离科研工作者们最近的社区,是其所在的研究小组,研究小组至关重要,将对学术工作者产生最直接、最高频的影响;其次是科研机构,机构的组织和评定方式,比如一个机构如何衡量科研人员的工作成果,最能体现一个科研机构的定位;其三是超越机构的社区,比如学术会议,通常是全世界学术同行们的活动与交流阵地;最后,借助互联网浪潮兴起的网络社区,也是一种全时、无边界的新兴学术社区,无形中对学术界产生了许多影响。
张磊
“我想从功能的角度去为学术生态做‘切片’,”华刚表示,“学术生态,是围绕知识的生产消费等环节展开的。”他认为学术生态可划分为四个环节:第一是知识的发觉和知识的产生,是科研创作者的工作环节;第二是知识验证和复核,这个环节的人们致力于避免谬误、去伪存真;第三是知识的记录和留存,记录知识将帮助全人类登上进步阶梯;第四是知识的传播和普及,比如教育和出版。科研工作者们通常会横跨四个环节,参与到全流程中,学术生态也在此诞生。
“社区、生态是繁荣而复杂的系统。”邹欣提到,“今天会场旁边就是深圳野生动物园,社区就有点像野生动物园。其中会有很多‘杂草’,也能培养出欣欣向荣的生态。”他提出,不论是构建社区还是生态,让参与其中的人们感受到“我来这里得到了真正有价值的东西”,是最大的挑战。这要求建设者们思考,“面向社区内不同的参与者,创作人、读者、机构组织,我们能提供什么价值?”
乔昆鹏表示:“这是我们出版非常关注的方向,即如何为学者社区提供更大的价值。”他为现场观众用一句话解释了狭义上的出版,即采、审、编、修,确保学者内容能长期保存并被大众访问到。随着信息爆炸和技术发展,近年来出版商们正渐渐转变为信息服务提供商。“就像 Google Scholar(谷歌学术),”乔昆鹏举例谷歌学术,“出版商和学者之间的合作,要让价值大于阻碍。”
“这是我们今天要谈论的话题,”谢育涛点出,“科技是第一生产力,科研人员是技术进步的驱动者,他们都非常优秀,可是目前他们用的工具都很简陋,身处的大小社区和知识环节都还存在许多问题。怎么提高他们的效率非常重要。学术社区是一个组织,好的生态会帮助他们提高效率,让每个人都可以在里面得到成长。”
“我第一次做 CVPR 是 2019 年,投稿量经历了爆炸性的增长。CVPR 2019 年投稿量达到 6000 篇,比 2018 年增长 56%。第二次是 2022 年,2021 年到 2022 年 CVPR 会议的投稿大概增加了 15%。现在总体增长已经放缓了,规模在 8000 篇以上。”华刚提供了一组数据,他认为会议存在最主要的意义还是去帮助知识的传播和交流。“CVPR 过去十年是人工智能、计算机科学领域发展得最蓬勃的会议,从领域的影响力来讲是第一位。”
“任何事物都有两面性,投递论文数目的快速增长给 CVPR 同行评议的过程带来了很大的挑战。”华刚表示,“面对 8000+篇投稿,真正具备水平进行高质量评审的 reviewer(评审员)其实没有 6000 个。”他坦言在大量的投稿数和紧张的时间条件下,目前 CVPR 采取的同行评议程序是组织方能采取的、最好的、最鲁棒的一个评审方式。因为只要是由人参与,就很难存在真正完美的系统,整个 CVPR 会议论文评审过程追寻的是,在有限的时间内,对每个论文做出,基于能收集到的论文相关所有评审、反驳和讨论信息的,综合的、最明智的决定。
乔昆鹏赞同,“让一篇文章能在同行、社区中快速达成共识,这个系统应该不会很大。大的系统要说接近完美,只能是效率和公平间的权衡之举。”
华刚、乔昆鹏远程参会
“我们的一大痛点是缺乏一个系统的、成熟的 reviewer 培养机制。”华刚补充,“在这么一个高速发展的领域,怎么培训更多的年轻研究员提高他们的判决力,对论文做出非常公正的推荐,需要潜移默化让他们养成正确评价一个论文的 Formal Thinking(正则化思维),ReadPaper 可能具备这样的潜力。”
ReadPaper 论文阅读平台是谢育涛团队正在运营的产品,提供论文搜索、阅读、管理和评论、社区等功能。“社区里有‘十问’(沈向洋提出的论文阅读认知模型),其中有些问题是你 review 评议时也要考虑的。”张磊谈到 reviewer 培养,“CVPR 2022 年的 review 程序中,我也曾作为 AC(领域主席)给华刚‘打工’。成为一名 reviewer,掌握‘十问’是很好的锻炼方式,但怎么能真正鼓励大家愿意写 review,还是很花时间的,是不小的投入。”
“Open review(公开评审)也是比较好的形式,”张磊回忆道:“最开始做 ReadPaper 时,我跟育涛说,作为一个资深研究人员,公开点评别人的工作,还是要非常慎重的。这其中的度,这也是非常值得探讨的方向。”
谢育涛、邹欣
“在我们技术社区,一天能出大概 12000 篇技术博客。”邹欣提供了 CSDN 的内容数据,这是不适合也无法设置 review 程序的一个数量级。“在社区里,你能看到很多种‘review’,有的就‘大佬,666’,有的就是‘你写得很好,但我也写得挺不错,欢迎回访’。”邹欣认为,学术社区要更加严肃。“组织方应该思考,如何营造一个安全的环境,让大家表达最直接、最核心的观点。让社区中允许尖锐的声音存在,才能保证科研人们得到真正有价值的反馈。”
“真实是学术生态中不变的追求,做学术社区也会是一样的道理。去年有一群人冒充 ICIMTech (信息管理与技术国际会议)2021 会议,最后 300 多篇论文被 ACM(国际计算机学会)撤稿。前年 Nature(《自然》期刊杂志)至少撤回了 370 篇论文工厂的关联文章。”谢育涛抛出了问题,“各位怎么看?”
乔昆鹏分析,一篇论文,从写作环节起就牵涉众多(比如在计算机科学领域,有人负责算法、有人负责实验,等等),再到推荐、评审、收录、出版,其间流程复杂,难监管的盲区多。
“但学术界里‘假学术’这样的事情发生比例还是远远少于市场中的假货发生率。”乔昆鹏认为,“学术界非常重视学术声誉,声誉的消失会带来不可磨灭的巨大打击。”
“学术界是很好的,不然今天科学家们的工作就不能对社会产生这么大影响,问题只占其中很小很小一部分。”谢育涛赞同乔昆鹏的说法。华刚补充:“在非常严格的同行评议机制下,如果本身是一个假的东西,是站不住脚的,随着时间流逝就自然在学术界消亡了。”
谢育涛
“那么除了监管,从激励政策上我们还能做什么样的尝试和探讨?”谢育涛提出,“Web3.0 的理念会是一个好的方向吗?”
乔昆鹏从三个角度回答了 Web3.0 理念将对学术生态带来的影响。
第一种影响是学术生态去中心化。这个去中心化包含至少两种含义,一是发表程序的去中心化,二是学术评审的去中心化,这两个去中心化将能够帮助学者在公正的环境下开展学术工作。
第二是匿名。乔昆鹏提出,学术界在评价别人的工作时会很小心,一方面考虑到自身认知和见解可能是片面的,另一方面也希望自己的评价行为能够排除其它与学术无关的因素影响。
第三种影响是贡献评定机制的革新。学术界,作者、读者和同行评审专家这三个身份常常交织在一起,导致科研人员的许多贡献极难被整理和追踪。Web3.0 理念能够帮助建立更加先进的评价体系。
圆桌的结尾,谢育涛总结:“我们这些角色生活在同一个社区里,我想我们都有一个共同的目的,就是能够让这样一群科研人员的效率变得更高。如何完善监管体系,如何用 Web3.0 理念或是其它理念,让生态发展得更加健康一些,这里面有很多值得探索的。今天开启这个话题,相信我们各自从一个好的社区出发,最终大家可以一起来打造一个更好的生态。”
2022 IDEA 大会上,举行了一场以“科技是第一生产力:从学术社区到学术生态”为主题的圆桌讨论。圆桌上,便利蜂 CTO、Wormpex AI Research 院长兼首席科学家华刚,约翰威立国际出版集团中国区战略合作总监乔昆鹏,CSDN 副总裁邹欣,IDEA 研究院计算机视觉与机器人研究中心讲席科学家张磊,IDEA 研究院工程总监谢育涛,共同探讨如何提高科研效率、打造学术社区,共建科研生态。
本场圆桌集齐了科研创作者、学术会议组织人、社区建设者、出版方四种角色。“今天邀请到的几位嘉宾,每个人在学术生态中都有独特的站位。”谢育涛介绍,“华刚是 CVPR (IEEE 国际计算机视觉与模式识别会议) 2022 年的 Program Chair (会议主席)之一,邹欣是专业 IT 社区 CSDN 副总裁,乔昆鹏是 John Wiley (约翰威立)国际出版集团中国区战略合作总监,张磊是我们 IDEA 研究院的讲席科学家,资深科研工作者, 他也参与了 CVPR 2022 年的 review (评审)工作。”
张磊首先从科研工作者的角度描述了四种学术社区。离科研工作者们最近的社区,是其所在的研究小组,研究小组至关重要,将对学术工作者产生最直接、最高频的影响;其次是科研机构,机构的组织和评定方式,比如一个机构如何衡量科研人员的工作成果,最能体现一个科研机构的定位;其三是超越机构的社区,比如学术会议,通常是全世界学术同行们的活动与交流阵地;最后,借助互联网浪潮兴起的网络社区,也是一种全时、无边界的新兴学术社区,无形中对学术界产生了许多影响。
张磊
“我想从功能的角度去为学术生态做‘切片’,”华刚表示,“学术生态,是围绕知识的生产消费等环节展开的。”他认为学术生态可划分为四个环节:第一是知识的发觉和知识的产生,是科研创作者的工作环节;第二是知识验证和复核,这个环节的人们致力于避免谬误、去伪存真;第三是知识的记录和留存,记录知识将帮助全人类登上进步阶梯;第四是知识的传播和普及,比如教育和出版。科研工作者们通常会横跨四个环节,参与到全流程中,学术生态也在此诞生。
“社区、生态是繁荣而复杂的系统。”邹欣提到,“今天会场旁边就是深圳野生动物园,社区就有点像野生动物园。其中会有很多‘杂草’,也能培养出欣欣向荣的生态。”他提出,不论是构建社区还是生态,让参与其中的人们感受到“我来这里得到了真正有价值的东西”,是最大的挑战。这要求建设者们思考,“面向社区内不同的参与者,创作人、读者、机构组织,我们能提供什么价值?”
乔昆鹏表示:“这是我们出版非常关注的方向,即如何为学者社区提供更大的价值。”他为现场观众用一句话解释了狭义上的出版,即采、审、编、修,确保学者内容能长期保存并被大众访问到。随着信息爆炸和技术发展,近年来出版商们正渐渐转变为信息服务提供商。“就像 Google Scholar(谷歌学术),”乔昆鹏举例谷歌学术,“出版商和学者之间的合作,要让价值大于阻碍。”
“这是我们今天要谈论的话题,”谢育涛点出,“科技是第一生产力,科研人员是技术进步的驱动者,他们都非常优秀,可是目前他们用的工具都很简陋,身处的大小社区和知识环节都还存在许多问题。怎么提高他们的效率非常重要。学术社区是一个组织,好的生态会帮助他们提高效率,让每个人都可以在里面得到成长。”
“我第一次做 CVPR 是 2019 年,投稿量经历了爆炸性的增长。CVPR 2019 年投稿量达到 6000 篇,比 2018 年增长 56%。第二次是 2022 年,2021 年到 2022 年 CVPR 会议的投稿大概增加了 15%。现在总体增长已经放缓了,规模在 8000 篇以上。”华刚提供了一组数据,他认为会议存在最主要的意义还是去帮助知识的传播和交流。“CVPR 过去十年是人工智能、计算机科学领域发展得最蓬勃的会议,从领域的影响力来讲是第一位。”
“任何事物都有两面性,投递论文数目的快速增长给 CVPR 同行评议的过程带来了很大的挑战。”华刚表示,“面对 8000+篇投稿,真正具备水平进行高质量评审的 reviewer(评审员)其实没有 6000 个。”他坦言在大量的投稿数和紧张的时间条件下,目前 CVPR 采取的同行评议程序是组织方能采取的、最好的、最鲁棒的一个评审方式。因为只要是由人参与,就很难存在真正完美的系统,整个 CVPR 会议论文评审过程追寻的是,在有限的时间内,对每个论文做出,基于能收集到的论文相关所有评审、反驳和讨论信息的,综合的、最明智的决定。
乔昆鹏赞同,“让一篇文章能在同行、社区中快速达成共识,这个系统应该不会很大。大的系统要说接近完美,只能是效率和公平间的权衡之举。”
华刚、乔昆鹏远程参会
“我们的一大痛点是缺乏一个系统的、成熟的 reviewer 培养机制。”华刚补充,“在这么一个高速发展的领域,怎么培训更多的年轻研究员提高他们的判决力,对论文做出非常公正的推荐,需要潜移默化让他们养成正确评价一个论文的 Formal Thinking(正则化思维),ReadPaper 可能具备这样的潜力。”
ReadPaper 论文阅读平台是谢育涛团队正在运营的产品,提供论文搜索、阅读、管理和评论、社区等功能。“社区里有‘十问’(沈向洋提出的论文阅读认知模型),其中有些问题是你 review 评议时也要考虑的。”张磊谈到 reviewer 培养,“CVPR 2022 年的 review 程序中,我也曾作为 AC(领域主席)给华刚‘打工’。成为一名 reviewer,掌握‘十问’是很好的锻炼方式,但怎么能真正鼓励大家愿意写 review,还是很花时间的,是不小的投入。”
“Open review(公开评审)也是比较好的形式,”张磊回忆道:“最开始做 ReadPaper 时,我跟育涛说,作为一个资深研究人员,公开点评别人的工作,还是要非常慎重的。这其中的度,这也是非常值得探讨的方向。”
谢育涛、邹欣
“在我们技术社区,一天能出大概 12000 篇技术博客。”邹欣提供了 CSDN 的内容数据,这是不适合也无法设置 review 程序的一个数量级。“在社区里,你能看到很多种‘review’,有的就‘大佬,666’,有的就是‘你写得很好,但我也写得挺不错,欢迎回访’。”邹欣认为,学术社区要更加严肃。“组织方应该思考,如何营造一个安全的环境,让大家表达最直接、最核心的观点。让社区中允许尖锐的声音存在,才能保证科研人们得到真正有价值的反馈。”
“真实是学术生态中不变的追求,做学术社区也会是一样的道理。去年有一群人冒充 ICIMTech (信息管理与技术国际会议)2021 会议,最后 300 多篇论文被 ACM(国际计算机学会)撤稿。前年 Nature(《自然》期刊杂志)至少撤回了 370 篇论文工厂的关联文章。”谢育涛抛出了问题,“各位怎么看?”
乔昆鹏分析,一篇论文,从写作环节起就牵涉众多(比如在计算机科学领域,有人负责算法、有人负责实验,等等),再到推荐、评审、收录、出版,其间流程复杂,难监管的盲区多。
“但学术界里‘假学术’这样的事情发生比例还是远远少于市场中的假货发生率。”乔昆鹏认为,“学术界非常重视学术声誉,声誉的消失会带来不可磨灭的巨大打击。”
“学术界是很好的,不然今天科学家们的工作就不能对社会产生这么大影响,问题只占其中很小很小一部分。”谢育涛赞同乔昆鹏的说法。华刚补充:“在非常严格的同行评议机制下,如果本身是一个假的东西,是站不住脚的,随着时间流逝就自然在学术界消亡了。”
谢育涛
“那么除了监管,从激励政策上我们还能做什么样的尝试和探讨?”谢育涛提出,“Web3.0 的理念会是一个好的方向吗?”
乔昆鹏从三个角度回答了 Web3.0 理念将对学术生态带来的影响。
第一种影响是学术生态去中心化。这个去中心化包含至少两种含义,一是发表程序的去中心化,二是学术评审的去中心化,这两个去中心化将能够帮助学者在公正的环境下开展学术工作。
第二是匿名。乔昆鹏提出,学术界在评价别人的工作时会很小心,一方面考虑到自身认知和见解可能是片面的,另一方面也希望自己的评价行为能够排除其它与学术无关的因素影响。
第三种影响是贡献评定机制的革新。学术界,作者、读者和同行评审专家这三个身份常常交织在一起,导致科研人员的许多贡献极难被整理和追踪。Web3.0 理念能够帮助建立更加先进的评价体系。
圆桌的结尾,谢育涛总结:“我们这些角色生活在同一个社区里,我想我们都有一个共同的目的,就是能够让这样一群科研人员的效率变得更高。如何完善监管体系,如何用 Web3.0 理念或是其它理念,让生态发展得更加健康一些,这里面有很多值得探索的。今天开启这个话题,相信我们各自从一个好的社区出发,最终大家可以一起来打造一个更好的生态。”