g-index和h-index

简单的来说,如果我们评价一个研究工作者,把他看作一个期刊,然后用他过去两年发表文章的平均引用频次来评价,那么他最好的方法就是发一篇文章,而且文章的引用量越高越好。这样的评价是不切实际的,我们在做研究工作的时候,并不是为了获取引用,我们只是努力地去做好每一个工作。有的工作本身关注的问题大家都关注,获得的引用就会比较高,其他工作可能获得的引用比较低,因此必须有能够兼顾质量和数量的一个指标来衡量研究者的绩效。h指数的设计,就是为了解决这个问题,我们先来了解一下。

H指数

H指数(H index)是一个混合量化指标,可用于评估研究人员的学术产出数量与学术产出水平,它在2005年由美国加利福尼亚大学圣地亚哥分校的物理学家乔治·赫希(Jorge E.Hirsch),其定义为:一个人在其所有学术文章中有N篇论文分别被引用了至少N次,他的H指数就是N。

g-index和h-index

举个例子,以为研究者,一共发了3篇SCI论文,当前的引用数量分别为2次、2次和1次。那么他的H指数是多少呢?他至少有2篇文章被引用了2次,所以他的H指数就是2。但是他没有任何一篇文章引用次数达到3,而要让H指数达到3,则至少要先发表3篇文章,而且每一篇文章被引频次都要达到3才行。

H指数可以综合一个研究者发表论文的质量和数量,从而进行评价,因此具有其优势。但是,对于年轻科学家来说往往发文量不大,那么论文数量就会称为受制因素。同时,如果一个参加科研工作时间较长的科学家,则会具有较高的H指数,因为这个指数具有累计效应。

H指数不仅仅可以用来评价学者的学术影响力,还可以用来评价期刊的影响力。谷歌就推出了H5指数,它以5年作为时间窗口,统计期刊在五年内至少有H篇文章获得了至少H条引用,从而综合评价期刊的发表质量和数量。

G指数

G指数由Leo Egghe于2006年提出,它是H指数的衍生指数,其定义为:对于一个研究者的前g篇论文(根据引用数量排序),其获得引用不低于g平方篇,但是其(g+1)篇论文获得的引用不高于(g+1)的平方。如果需要直观地解释,就是作者有g篇文章平均(在h指数中不是“平均”,而是“最少”)引用数量不少于g篇。对于同样的研究对象,其G指数一定会大于等于H指数,G指数能够在一定程度上把高被引文章获得的引用“平均”到更多的文章中,从而让这个指数变高。它是否适合于进行科研评价,是一个见仁见智的事情。

 

g-index和h-index

设计逻辑

无论是H指数还是G指数,其表达的含义都是相对直观的,而且权衡了评价对象发表文章的质量和数量。如果让我们用一句话解释这些指数的逻辑,那么就是这些指数考察了一个研究者是否发表了足够数量的具有一定影响力的文章。对于一个发文量比较多而且研究者也较多的领域,这些指数的效果是比较好的。就这两个指数而言,H指数和G指数都是体量相关的,也就是说发表文章数量的多少,会直接影响指数的大小。相对而言,H指数对个体差异的敏感性更弱。举例而言,如果某学者有一篇超级高引论文,那么对其H指数的贡献只会是1;但是如果计算其G指数,可能会极大地拉高他的G指数。至于哪一种指数才适合用于具体的科研评价,需要看评价的对象和评价的目标。

g-index和h-index

上一篇:Pandas高级教程之:稀疏数据结构


下一篇:AngularJS 源码分析3