网络知识 娱乐 面向全球人工智能高影响力科研人员的综合学术影响力评价模型研究

面向全球人工智能高影响力科研人员的综合学术影响力评价模型研究

面向全球人工智能高影响力科研人员的综合学术影响力评价模型研究

摘要:科技人才对于一国的科技创新发展至关重要,科学合理地评价科研人员的学术影响力,对于科技人才遴选、引进、管理具有重要意义,同时,也可以营造公平、公正的学术氛围,推动科技发展。本研究针对新兴科技领域知识迭代更新快的特点,提出了新兴科技领域科研人员学术影响力综合评价体系和模型,并以人工智能高影响力科研人员为例进行了分析。结果发现,成果引用情况对学术影响力影响最大,其次是学术研究能力和学术活跃程度。本研究提供了一种指标客观赋值的方法,对于科研人员学术影响力的客观评价提供支撑。

1. 引言

全球科技创新进入空前繁荣期,新一轮科技革命加之新冠肺炎疫情的影响。使得国家间的竞合关系变得日益复杂。科技自立自强和科技自主创新成为新发展形势下科技创新的新理念,科技人才,尤其是高端科技人才对于一国的科技创新发展至关重要。杰出科技人才能带动重大技术的突破,或一个学科、一个产业的兴起[1],因此,促进新兴技术快速发展,需要凝聚一批具有高影响力的科技人才。科技人员影响力是特定学术研究领域内科研活动的影响范围和影响深度,科学合理地评价科研人员的学术影响力,不仅可以实现人才遴选、人才引进、人才管理和人才评价等科研管理目标,也可以营造一个公平、公正的学术氛围,提升学术成果质量,推动科技发展。

目前关于科研人员学术影响力的评价往往用科研人员的学术数量和质量来表示。然而,对于新兴科技领域,如人工智能领域,除了学术数量和质量,科研人员的活跃度对于带动技术突破、领域发展和产业兴起亦具有重要影响。本研究以人工智能高层次科研人员为例,针对其学术影响力提出综合评估模型,该模型从实际数据出发,计算评价人工智能高层次科研人员学术影响力指标间的客观权重和反映学术影响力的不同方面和维度的得分,为科技决策和科研管理提供支撑。

2. 研究方法的选择

2.1 现有研究方法述评

科研人才的发现和遴选是科研管理的重要任务,为此,需要构建一套科学、客观、操作性强,能反映科技领域和学科特色和差异的评价体系和方法,既需要避免简单地“唯论文”,又需要考虑科研人员的科研活动特征。为推动科研人员学术影响力评价理论与实践,国内外科研人员做了大量的研究。虽然关于学术影响力的内涵尚未形成统一认识,但一般将学术影响力理解为同行对某一科研人员和成果的认可和利用程度。目前关于科研人员学术影响力的评价主要分为定性评价、定量评价、定性定量相结合的评价方法等[2]。

定性评价以同行评议为主。同行评议最早应用于论文的评审中,是一种由相同或相近领域专家对某项工作、某些人或事物进行评价的过程。虽然同行评议属于主观的评价方法,但目前的定量评价方法难以取代同行评议的权威性,且多数定量评价方法为同行评议方法提供了支撑,因此同行评议至今仍被广泛应用于基金、项目、人员、论文等各项科研评价中。同行评议的关键是专家的遴选和组织,缺点是耗时、其公正性难以把握[3]。

随着科学学的发展,学术影响力的定量评价方法逐渐兴起,最初是以论文数量和引用情况作为基本的评价指标,随后发展出h指数、p指数、g指数等各类指数,以及后来的替代计量学(Altmetrics)等。总体上,学术影响力的定量评价方法可以分为四类:传统文献计量学评价方法、文献计量的指数方法、基于复杂网络的评价方法、基于替代计量学的评价方法[4]。

2.1.1 传统文献计量学评价方法

传统文献计量学评价方法是依托各类文献数据库而开展的学术影响力的评价,主要指标包括论文总数、总被引频次、篇均被引频次、高被引论文数、期刊影响因子等。这些指标在一定程度上反映了科研人员在学术界的影响力,但各自存在一定局限性,例如论文总数代表一位科研人员的科研生产力,但是不能反应成果的质量,引文总数、篇均引文数考虑了论文的质量,但是评价受科研人员的学术时间的影响,重要论文数和引文数虽然避免了“灌水”论文的评价偏误,但对于重要论文的衡量标准存在较大的主观性,并且单一指标的使用很难同时兼顾数量和质量问题,因此,VanLeeuween早在2003年就强烈建议将不同指标进行联合使用[5]。

因此,部分科研人员采用一些计算模型将反应学术数量和质量的指标进行综合考虑,例如叶鹰(2014)[6]提出了一种将所有发文和所有引文进行整体综合考虑的学术评价指标的新的设计思想,称其为“学术矩阵方法”,矩阵中的数值综合考虑发文和引文的所有分布,将高影响和无影响的产出纳入统一测度,其缺点是计算复杂度高。

2.1.2 文献计量的指数方法

文献计量的指数方法是指利用文献的基本数据构建不同的指标,比较常见的有h指数、g指数等。h指数及其衍生指数的提出兼顾了论文的数量和质量,并且计算简单,能大规模地在数据库中使用,成为科研人员学术影响力评价的广泛使用的方法[7]。但h指数也存在一些缺点,例如只能增加,不能减少,无法表征科研人员影响力变小的情况,也不利于论文数量少但被引频次高的科研人员,没有考虑科研人员在论文中的贡献,缺乏灵活性等。因此,h指数的变体或其他指数被开发出来用以测度科研人员的学术影响力,例如提出了按照被引次数降序排序计算的g指数[8]。一些科研人员比较了g指数与h指数,认为g指数比h指数灵敏性更高,但并不能替代h指数,而将g指数和h指数结合使用,对于评价结果更为稳定[9]。此外,还有评价不同学科领域科研人员学术影响力的n指数、Normalizedh指数、hf指数、x指数,以及考虑合作者的替代h指数、Hp指数、Hm指数、hap指数等[4]。

2.1.3 基于复杂网络的评价方法

基于复杂网络的学术影响力主要通过科研人员的学术合作网络位置来判断,以论文合作者为研究对象,利用作者信息构建作者合作网络,通过网络中节点的点度中心度、中间中心度、接近中心度以及PageRank算法等方法开展[10],其中点度中心度是网络中其他节点与该节点具有直接联系的点的个数,计算简单直观,但是只反映了节点的局部特征;中间中心度考虑了节点的信息载荷能力,但是不太适合大型网络的计算;接近中心性是指一个点与其他节点连结的最短路径,通过网络对部分节点产生全局影响,但是对于大型网络的适用也存在一定的局限性;PageRank方法考虑了网络的全局拓扑结构,但是有时会出现排序不唯一的情况。单独基于复杂网络的评价方法考虑了合作网络承载的信息,需要与传统文献计量学指标结合使用才能更好地评价一位科研人员的影响力。

2.1.4 基于替代计量学的评价方法

替代计量学(Altmetrics)是将影响力的范围从学术界扩展到社会界,利用微博转发数据、博客引用、社交评论与讨论、下载人次、阅读人次、文献管理标记等各种文献数据库之外的互联网平台上的信息对科研人员的影响力进行评价[11]。它具有社会性、即时性、选择性和评价对象非传统性[4]的特征,反映了科研人员的一些社会影响特征,而且存在数据容易被操控,数据收集有偏等多种问题,需要与上述其他方法结合使用来综合使用,或者作为一种补充评价形式使用而非替代评价。有些科研人员探索了上述方法相结合的评价方法新思路,例如,徐芳等(2020)[12]将替代计量学方法和引文数据相结合,构建了一条从学术发表到社会影响的学术影响链条。

上述方法及其组合使用为科研人员的发现和引进提供了有效的方法,并在不断推进科研管理效能的提升。但没有一种方法能适用科研管理的所有情况,仍需要根据科研评价的具体问题,选择合适的指标和具体的方法,并不断开发新的评价研究方法。本研究在已有科研人员学术影响力的研究基础上,引入科研人员活跃度作为新兴科技领域科研人员影响力的重要维度,构建科研人员学术影响力的综合评价模型,利用二阶因子模型对其进行加权构成综合评价指数,并以人工智能领域为例,对该领域高影响力的科研人员进行综合评价,为科研人员学术影响力评价提供一种方法,支撑相应的科研管理工作。

2.2 综合评价模型的选择依据

综合评价模型是指围绕具体综合评价目标,将反映不同维度的多个指标整合到一起以完成全面客观评价研究任务的一类模型。如前文所述,目前不少科研人员通过组合使用学术影响力的不同指标,针对不同的评价对象创新评价方法,颇具参考价值。但因为评价对象和情景的不断变化,一些新的评价需求不断涌现,以及学术界对于学术影响力认识的不断深入,在学术影响力的理论和实践中还存在持续改进的空间。本文立足于新兴领域高端人才的学术影响力综合评价问题,并选择二阶因子模型为综合评价模型的依据主要包括以下两个方面:

(1)学术影响力是一个综合且复杂的概念,需要通过构建一个较为完整的指标体系才能更清晰的阐述。科研人员的学术影响力既表现在他发表成果的数量,还包括成果引用情况、作者活跃度等多个维度。而这些维度又需要通过一个或多个指标进行量化。比如,反映成果引用情况的指标具体包括Citation、h指数和g指数。由此可见,学术影响力综合评价所依托的指标体系呈现出从抽象概念到具体指标的层级关系。这种层级关系特征恰恰符合二阶因子模型的结构特征。

(2)学术影响力的综合评价需要在全面考虑多个指标的基础上,客观计算指标间权重关系。一直以来,很多综合评价方法都采用基于专家或科研人员打分做出最终决策,属于主观赋权。有时,研究人员期望能从数据出发,计算客观权重,以反映不同指标对所属维度的重要程度。二阶因子模型的参数估计方法主要包括极大似然估计方法、偏最小二乘算法和贝叶斯估计方法。均属于客观赋权,不会因主观因素影响最终结果的稳定性。

因此,本文选择二阶因子模型为综合评价模型,在完成学术影响力综合评价指标体系架构设计基础上,通过计算客观权重,实现综合评价的目的[13]。考虑到放宽对数据分布的假设、且可以计算出因子得分的优势,本文选择偏最小二乘估计算法实现模型参数估计[14-16]。

3. 应用研究

3.1 指标选择

根据已有研究可以看出,学术影响力一般由直接科研产出、被引情况、网络地位以及社会影响等多方面的指标采用不同的模型综合构成。尽管有些研究开始将活跃度和影响力作为两个维度开展讨论[17],但少有研究将科研人员的活跃度作为学术影响力的组成部分。而在人工智能等新兴科技领域中,知识更新迭代速度快,周期短,因此,科研人员学术影响力评价除了需要考虑发表成果数量外,也需要通过所发表成果的引用情况以及作者活跃程度综合反映。

目前已存在一些指标用来反映一位科研人员的学术影响力。如发文数量(Papers)、被引频次(Citation)、H指数(H-index)、G指数(G-index)、社交性(Sociability)、多样性(Diversity)和能动性(Activity)。其中,一位科研人员的H指数是指他至多有h篇论文分别被引用了至少h次。G指数是指论文按被引次数排序后相对排前的累积被引至少g的平方次的最大论文序次g,亦即第(g+1)序次论文对应的累积引文数将小于(g+1)的平方次。社交性反映合作者数量情况。多样性反映科研人员涉足研究领域丰富程度。能动性反映最近几年发表论文情况。总体上,上述指标均反映出一位科研人员学术影响力的某一个维度。发文数量和近几年发文数量(即能动性)表达了学术研究能力(Academicresearchability,ARA),被引频次、H指数和G指数反映的是成果引用情况(Academicworkcitation,AWC),而社交性和多样性则体现出一位科研人员的学术活跃程度(Academicactivitydegree,AAD)。学术研究能力、成果引用情况和学术活跃程度共同测度学术影响力(Academicinfluence,AI)。基于此,我们构建如表1所示的指标,用于综合评价科研人员的学术影响力。

面向全球人工智能高影响力科研人员的综合学术影响力评价模型研究

3.2 数据说明与统计描述

本文以人工智能高影响力科研人员为研究样本,利用二阶因子模型对该领域高被引科研人员的学术影响力进行了综合评价。数据主要来自Aminer[1]平台上AI2000科研人员的数据,经数据清理和初步整理,形成样本量为1120的人工智能领域高影响力科研人员的学术影响力数据集,涵盖经典AI、机器学习、计算机视觉、自然语言处理、机器人、知识工程、语音识别、数据挖掘、信息检索与推荐、数据库、人机交互、计算机图形、多媒体、可视化、安全与隐私、计算机网络、计算机系统、计算理论、芯片技术、物联网等20个子领域。变量包括表1中的7个指标,数据主要来自Aminer平台上关于各个科研人员相应指标的统计。表2展示上述7个指标的统计描述结果。

面向全球人工智能高影响力科研人员的综合学术影响力评价模型研究

由表2可知,1120位科研人员在发文数量、能动性、被引频次、H指数和G指数指标的最大值和最小值方面存在明显差距,这种数据特征表明这些科研人员在具体表达学术影响力的某些方面确实存在不小的差距,因此综合评价他们的学术影响力更具意义。此外,在使用综合评价模型和估计算法之前,有必要对数据进行标准化处理,以避免数据在量级上的差异影响参数估计结果。本文选择的数据标准化方法是:(指标-均值)/标准差。即用指标的数据减去指标数据的平均值,再除以指标数据的标准差。

3.3 结果解释

通过二阶因子模型和偏最小二乘估计算法,本文得到如表3所示的参数估计结果。

面向全球人工智能高影响力科研人员的综合学术影响力评价模型研究

由表3可知,影响科研人员学术影响力的三个方面由大到小排序为:成果引用情况(0.892)、学术研究能力(0.888)、学术活跃程度(0.867)。可以看出,成果引用情况对学术影响力的影响最大,学术活跃程度的影响最小。与学术研究能力和学术活跃程度相比,成果引用情况在树立个人学术影响力方面表现出相对重要的作用。所发表成果被引用情况在很大程度上也直观表现出该学者在所深耕领域的成果价值,通过成果价值进一步反映出其学术影响力。影响成果引用情况的3个指标的效应大小由高到低是:G指数(0.980)、H指数(0.958)、被引频次(0.901)。显然,与其它指标对应的载荷系数相比,成果引用情况与其相应指标间的载荷系数取值均大于0.900,表现出相对较大的影响或效应。也从指标角度间接反映出成果引用情况对学术影响力的重要影响。影响学术研究能力的2个指标的效应大小由高到低为:发文数量(0.867)、能动性(0.851)。影响学术活跃程度的2个指标的效应大小由高到低为:社交性(0.865)、多样性(0.823)。值得注意的是,与其它指标相比,表示学者跨领域程度的多样性指标对应的载荷系数取值最小。这在一定程度上说明,学者跨领域程度在决定学者学术影响力方面表现出相对较小的效应。与表示学者研究能力和成果引用情况的指标相比,学者跨领域程度对于学术影响力的提升来说并非首要因素。但是,多样性指标对应的载荷系数为0.823,从系数的绝对值来看,对于提升学者学术影响力来说,跨界融通的重要作用不容忽视。此外,我们还统计了1120位科研人员在学术影响力、成果引用情况、学术研究能力和学术活跃程度共4个方面的因子得分,完成了对这些科研人员在不同维度下的排名。受篇幅所限,本文不展开这部分的论述。

4. 总结与讨论

科研人员学术影响力评价一直是科研评价和科研管理中的重要任务,也是科学学研究的热点问题。尽管针对学术影响力的评价有多种方法和指标,但在具体的评价中,应根据评价的问题、目的和对象选择合适的评价方法和指标,并且针对指标的优缺点将指标进行组合使用,以实现更为科学、客观、合理的评价效果。

本文以人工智能领域的高被引科研人员为对象,从学术研究能力、成果引用情况和学术活跃程度三个维度、七个指标构建了新兴科技领域科研人员学术影响力的综合评价指标体系,并借助二阶因子模型和偏最小二乘估计算法构建科研人员学术影响力的综合评价模型,具有一定的创新性和研究价值,具体表现在以下几个方面:

(1)能够客观全面反映学术影响力状况。科研人员学术影响力研究之所以能够客观全面反映学术影响力状况,主要是因为数据的获取方式可靠、所选模型与方法科学以及综合了多个测度学术影响力不同方面的指标等。其中,在正确数据获取技术保证下,本文所涉及数据均为已公开发布的数据,而且学术影响力综合评价模型和参数估计算法遵循从数据出发、客观赋权的原则,能够避免主观因素的干扰。具体来说,偏最小二乘估计算法的所有数值计算结果完全依托于数据本身。而且,该方法本身具有的不要求数据分布形式、采用客观权重、兼顾因素之间关系等优点,尤其是客观权重的计算,避免了主观赋权的干预,保证了科研人员学术影响力研究的客观性。此外,本文尝试囊括反映科研人员学术影响力的尽可能多的指标,与单一指标(如仅以发文量作为评价标准)相比,考虑更为全面。

(2)可横纵向比较科研人员学术影响力。在同一套科研人员学术影响力综合评价指标体系、使用相同的模型和算法前提下,对于不同地域、不同领域的科研人员的学术影响力综合评价结果具有较强的可比性。而且,可以持续进行科研人员的学术影响力综合评价的研究工作,滚动发布科研人员的学术影响力综合评价结果。及时发掘、追踪影响学术影响力的关键因素,通过科研人员学术影响力动态分析,可以进一步提高不同国家地区乃至个人的警惕性和灵活性,倡导健康良好的学术环境和氛围。

参考文献

[1] 程如烟. 各国高端科技人才资助计划管理浅析[J]. 世界科技研究与发展,2012, 34(1): 178.

[2] 熊回香,杜瑾,代沁泉,等. 基于主题与多维计量指标的学者学术影响力评价研究[J]. 情报理论与实践,2021, 44(8): 22.

[3] Jonkers K, Zacharewicz T. Research performance based funding systems: A comparative assessment[J]. Publications Office of the European Union, Luxembourg, 2016.

[4] 高志,张志强. 个人学术影响力定量评价方法研究综述[J]. 情报理论与实践,2016,39(01):137-142.

[5] Van Leeuwen, Thed, et al. The Holy Grail of science policy: Exploring and combining bibliometric tools in search of scientific excellence[J].Scientometrics, 2003, 57(2 ): 257-280.

[6] 叶鹰. 国际学术评价指标研究现状及发展综述[J].情报学报,2014, 33(2): 215-224.

[7] Gasparyan A Y, Yessirkepov M, Duisenova A,et al. Researcher and author impact metrics: variety,value, and context[J]. Journal of Korean medical science, 2018, 33(18).

[8] Egghe L. Theory and practise of the g-index[J].Scientometrics, 2006, 69(1): 131-152.

[9] Costas R, Bordons M. Is g-index better than h-index? An exploratory study at the individual level[J]. Scientometrics, 2008, 77(2): 267-288.

[10] 瞿辉,王菲菲. 基于知识关联网络的作者学术影响力评价研究[J]. 情报杂志,2016, 35(7):190-195.

[11] Konkiel, Stacy, and Dave Scherer. New opportunities for repositories in the age of altmetrics[J].Bulletin of the American Society for Information Science and Technology, 2013, 39(4): 22-26.

[12] 徐芳,郑毅,刘文斌.基于证据链的学术影响力评价方法探索研究[J].科研管理,2020,41(05):140-150.

[13] 程豪.互联网科技统计视阈下全球化国家科技创新能力综合评价指数统计模型[J].调研世界,2020(6): 25-31.

[14] Tenenhaus M, Vinzi V E, Chatelin Y M, et al.PLS Path Modeling[J]. Computational Statistics & Data Analysis, 2005, 48(1): 159-205.

[15] Leguina, Adrian. A Primer on Partial Least Squares Structural Equation Modeling (Pls-sem)

[J]. International Journal of Research & Method in Education, 2015, 38(2): 220-221.

[16] Cheng H, Yi D H, Si J S, et al. Establishment of Comprehensive Indicators in TCM Pectoral-Qi Case Report Based on Experts Diagnosis and Self-Test Technology[J]. Medicine, 2018, 97(7): e9916.

[17] 杨艳妮,沈阳. 基于活跃度和影响力的国家优势学科领域发展——以传播学为例.情报杂志.2015.8

作者:裴瑞敏1、程豪2

1 中国科学院科技战略咨询研究院

2 中国科协创新战略研究院

项目来源:国家自然科学基金资助项目(71904185,72001197);中国科学院科技战略咨询研究院院长青年基金项目(Y9X1661Q01)

本文原载于《今日科苑》2022年第2期

感谢您的支持与关注,欢迎赐稿交流

投稿邮箱:nais-research@cnais.org.cn