联系我们 | 返回旧版 | 加入收藏

独家数字出版与期刊影响因子关系的实证分析*

2015-05-25 15:16:14     作者:张小强 摄影:新闻学院     

发表于《编辑学报》,2014,26(3):205-209,此为编辑前的定稿,引用请用最终印刷版本。

张小强1,2),史春丽1)

1)重庆大学新闻学院,401331,重庆;2)重庆中科普传媒发展股份有限公司博士后工作站,400015,重庆

摘要:采集较大样本量,并引入虚拟变量代表样本期刊是否独家出版,运用相关和回归分析观察了独家出版对科技期刊影响因子的具体影响。相关分析表明,无论是CNKI还是万方独家出版,影响因子与是否独家出版之间均存在显著的负相关性。对包含CNKI独家期刊的数据回归分析显示虚拟变量前的回归系数虽然为负值但从统计学上看不显著。对包含万方独家出版的医学期刊的数据回归分析发现,虚拟变量前的系数不仅为负值而且具有统计学上的显著性,表明万方独家出版引起了期刊影响因子的降低。结果还显示,若独家出版对影响因子有影响,将非常显著,期刊应慎重考虑是否独家出版。

关键词:数字出版;独家授权;影响因子;实证分析

Empirical Analysis onExclusiveDigitalPublishing’s Effects on Journals’Impact Factors//Zhang Xiaoqiang,Shi Chunli

Abstract: In order to observe exclusive digital publishing’s effects on journals’ impact factors,we analyzelargesampleswithcorrelateand regression analysis.Dummy variablesare introduced into the analysis processwhich represent whetherasample journal is exclusive or not.Correlate analyses show thatthereareremarkable negative correlations between impact factors and exclusive publishingno matterwhichpublisher(CNKIorWanfang) publish them.Whileusing the journals exclusively published by CNKI,the regression analyses show that the regressioncoefficients of dummyviables are negative but not marked fromstatisticsview. Whileusing the journals exclusively published by Wanfang,the regression analyses show that the regressioncoefficients are both negative and marked fromstatisticsview, whichsuggestsexclusive publishing causes reductionofimpact factor. Theanalyses results also show that if exclusive publishing have negative effects on impactfactors,the effects will very marked fromstatisticsview. Therefore,journals should carefully considerwhether tobeexclusivelypublished or not.

Keywords: digital publishing; exclusive authorization; impact factor;empirical analysis

First-author’saddress:CollegeofJournalismandCommunication,ChongqingUniversity, 401331,Chongqing

1引言

为提升数据资源价值,中国知网(CNKI)和万方2家大型学术文献数据库以提高分成方式与科技期刊签署独家(全文)使用协议,使科技期刊面临扩大传播范围与增加经济收益的选择。尚未与数据库签署独家协议的期刊需要决定是否签订,已经签订独家协议的期刊面临合同到期是否续签的问题。因而,分析独家数字出版对科技期刊传播的具体影响有重要现实意义。

目前已有文献进行了上述研究。方红玲[1]分析了2006-2009年间独家于不同数据库及非独家的医学期刊的指标变化,发现非独家和独家加入CNKI的医学期刊影响因子有提高,独家加入万方的医学期刊影响因子明显下降,所有期刊的扩散因子均发生下降。栾嘉、冷怀明[2]对独家于不同数据库及非独家的医学期刊2007-2011年间的影响因子和总被引频次进行了对比分析,发现所有期刊的总被引频次都是上升的,独家授权CNKI和非独家的医学期刊影响因子呈上升趋势,但独家授权万方数据的9种期刊的影响因子呈下降趋势。从样本选择上看,上述文献主要分析的是医学类期刊,结论并不一定具普遍性。从研究方法看,要么样本数量较少且只观察了样本期刊影响因子随年份的变化情况(文献[2]),要么仅仅将样本分组后观察不同组别平均值的变化和统计参数(文献[1])。上述方法未考虑影响因子的总体变化趋势,因为存在这种情况:独家出版未改变影响因子总体变化趋势,但可能抑制其上升或加速其下降。而上述方法忽略了这种情况,只有在独家出版导致影响因子变化趋势反转的情况下才可能用上述方法观测到独家出版的影响。

本文拟采集较大的样本量,并引入虚拟变量代表样本期刊是否独家,进行相关分析和回归分析来观察独家授权对科技期刊影响因子的具体影响。

2对象和方法

2.1样本选择

本研究以《中文核心期刊要目总览》[3]作为期刊分类依据,影响因子数据采集自中国科学引文数据库(CSCD,sdb.csdl.ac.cn)。第一步是选择期刊样本群:《中文核心期刊要目总览》将期刊按学科分为7类:哲学、社会学、政治、法律;经济;文化、教育、历史;自然科学;医药、卫生;农业科学;工业技术。本文仅研究科技期刊,排除社会科学类期刊后剩下医学、自然科学、农业科学和工业技术四大类。分析期刊名单,发现农业类期刊相对于其他期刊而言专业性较强,而且种类较少(仅有100多种,最终能够获得的有效样本数更少),不便于与其他类别期刊进行分组比较。为了观察综合性期刊与专业性期刊的区别,选择综合性期刊与专业性期刊载文有较大范围重合的期刊。而自然科学类综合性技术期刊种类多,且期刊载文范围基本涵盖了自然科学和一般工业技术中的专业期刊载文范围,便于样本组之间相互比较。而医学期刊因独家于万方数据库的期刊较多,为观察万方数据库独家出版的影响和与其他文献结果进行比较,将医学类期刊纳入样本组。最终,本次研究从自然科学、工业技术和医学三大类期刊中选取样本,从学科上看涵盖了数学、物理、化学、力学、地学、生物学等理科门类和机械、矿业、自动化、电工、金属等工科门类的期刊,也包括医学各学科期刊,从数量上看种类较多,是我国科技期刊的主体,使本研究的结论具有代表性。

由于从公开渠道未获得CNKI2008年独家期刊的名单,这里以2010年4月的独家期刊名单866种作为独家期刊与非独家期刊的分组依据[4]。根据公开资料,2008年CNKI独家期刊为653种,2009年为720种[5]。在以上名单的基础上,逐个在CNKI和万方数据库中检索期刊2006到2012年的全文获取情况,以实际检索为依据记录具体独家出版年份。

通过上述方法获得独家期刊和非独家期刊名单后,查询CSCD网络数据库,剔除部分指标不全的期刊和未连续被CSCD收录的期刊,获得CNKI2009年开始独家出版的自然科学综合性期刊17种、非独家综合性期刊18种、2010年开始独家出版的自然科学和工业技术专业期刊18种、非独家专业期刊55种。

万方数据库于2008年与中华医学会签订了100多种医学期刊的独家出版协议,经检索两家数据库的获取情况,获得2007年万方独家出版医学期刊12种、2008年万方独家出版医学期刊30种、非独家出版的医学期刊23种。

在CSCD数据库中采集了上述108种科技和65种医学期刊从2006年到2012年的影响因子作为分析的原始数据。

2.2影响因子平均值观察

为了和相关文献的结果进行对比,也为了观察6组期刊的影响因子总体变化情况,计算了6组期刊从2006年到2012年影响因子的平均值变化情况。结果如图1-2所示(图1为非医学期刊、图2为医学期刊)。从图1中4条折线的变化趋势可以看出,4组自然科学和工业技术类期刊影响因子的总体变化趋势是一致的,从2006年到2012年呈上升趋势,独家加入CNKI后仅观察影响因子数值的变化,是呈上升趋势的,与其他文献结果一致。两组独家期刊和两组非独家期刊影响因子的总体变化趋势也基本一致,仅从平均值看不出变化趋势的明显不同。从变化幅度看,专业期刊影响因子变化剧烈一些,综合期刊相对平缓。

图1 2006—2012年自然科学和工业技术类期刊影响因子平均值变化曲线

将独家期刊和非独家期刊在独家前后的影响因子平均值之间的差值用灰色阴影表示。对比图1中浅色阴影和深色阴影的形状及变化趋势,发现无论是专业期刊(2010年独家前后2年)、还是综合性期刊(2009年独家前后3年)在独家后影响因子与非独家期刊的差距均有拉大的趋势。但是仅从图1还无法判断专业期刊和综合期刊哪一组的变化更加明显,也无法判断这一趋势是影响因子的本来走势,还是受到期刊独家出版的影响,需进一步分析。

图2显示的是医学期刊影响因子的平均值变化情况,从图2可见,万方数据库独家出版的医学期刊和非独家出版的医学期刊影响因子变化趋势有较为明显的差异。总体看非独家医学期刊变化较为平缓且呈总体上升态势,但独家出版的2组医学期刊却呈U形变化。值得注意的是,2008年独家的期刊影响因子变化与其他文献是一致的,即独家后(2008年)连续两年影响因子发生了下降,但2007年万方独家出版的医学期刊却在独家后平均影响因子发生了微弱上升,且两组独家出版的期刊在2010年后影响因子的上升幅度均超过了非独家出版的期刊。这说明,仅从影响因子平均值变化情况看,同样不能断定影响因子的降低究竟是独家出版的影响还是这一批期刊影响因子受其他因素影响发生下降,也需进一步分析。对比图2和图1发现,非独家的医学期刊影响因子变化趋势更接近自然科学和工业技术类的变化趋势。

图22006——2012年医学期刊影响因子变化曲线

2.3相关分析

为了分析影响因子与CNKI独家出版之间的关系,引入虚拟变量表示期刊是否独家出版,若是取值为1,否则取值为0。在研究中,为了观察大样本的情况和产生对照结果,将自然科学类期刊样本分为三个组:综合期刊组、样本数N=35、含2009年17种期刊独家出版;专业期刊组、N=73、含2010年18种期刊独家出版;全部期刊组、N=108、含上述两组中的独家出版期刊。因此,综合期刊组和专业期刊组分别产生一个取值为0或1的虚拟变量代表是否独家出版,全部期刊组因为2009年和2010年独家期刊数目不同,产生两个虚拟变量,一个代表2009年期刊的独家情况,另一个代表2010年期刊的独家出版情况。

因为变量中的虚拟变量为二值变量,不是连续变量,所以应用点二系列相关方法来分析独家后各年影响因子与是否独家之间的相关系数[6]。其原理是将二分变量视为连续变量求其与连续变量的皮尔逊(Pearson)相关系数(具体计算公式参见文献[6])。通过SPSS软件计算得出上述三个组的点二系列相关系数及相伴概率如表1所示。相伴概率为统计学上的显著性指标,值越大则越不显著,根据情况一般要求小于0.1、0.05或0.001(被称为置信度)。

分组(期刊数)

独家年份

统计年份

相关系数

相伴概率

综合组(35)

2009

2010

-0.143

0.412

2011

-0.206

0.235

2012

-0.162

0.352

专业组(73)

2010

2011

-0.114

0.335

2012

-0.089

0.454

全部期刊组(108)

2009

2010

-0. 284

0.003

2011

-0. 301

0.002

2012

-0. 295

0.002

2010

2011

-0. 185

0.055

2012

-0. 197

0.041

表1自然科学和工业技术类期刊CNKI独家后各年影响因子与是否独家的相关系数

从表1可以看出,3组样本独家后各年影响因子与独家出版虚拟变量均呈负相关,但综合期刊组和专业期刊组的相伴概率值均大于0.1,相关性不够显著。将综合期刊组和专业期刊组合并后,独家后各年的影响因子与是否独家虚拟变量也呈负相关,且显著性明显提高。

在0.1的置信度下全部期刊组中独家后各年的影响因子与是否独家都存在的负相关(全部小于0.1),在0.05的置信度下仅有2011年影响因子与是否独家的相关性不够显著(0.055﹥0.05)。因此,从整体上看,CNKI是否独家与期刊的影响因子之间存在负相关性。

对于医学期刊组,将数据分为3组:2007年独家医学期刊组(N=45),包括12种2007年万方独家出版期刊和23种非独家医学期刊;2008年独家期刊组(N=53),包含30种2008年万方独家出版的医学期刊和非独家医学期刊。由于医学期刊较为特殊,独家种类大于非独家种类,为了观察医学期刊与其他期刊影响因子变化的相关性,增加一组数据,将2008年独家医学期刊组中加入其他类别的非独家期刊样本(因2007年独家期刊样本数过少,故舍去),获得一组样本数N=126的数据。结果如表2所示。

表2医学期刊万方独家数字出版后各年影响因子与是否独家的相关系数

分组(期刊数)

独家年份

统计年份

相关系数

相伴概率

医学期刊

组(45)

2007

2008

0.128

0.465

2009

-0.167

0.338

2010

-0.233

0.179

2011

-0.164

0.348

2012

-0.019

0.915

医学期刊

组(53)

2008

2009

-0.038

0.786

2010

-0.116

0.408

2011

0.124

0.376

2012

0.223

0.108

混合期刊组(126)

2008

2009

-0.270

0.002

2010

-0.304

0.001

2011

-0.222

0.013

2012

-0.180

0.044

从表2可看出,对于万方独家出版的医学期刊而言,当样本数较少的时候,相关性显著同样不够,但与CNKI独家期刊组数据(表1)不同的是,其中2007年万方独家医学期刊组2008年的影响因子与万方独家出版出现了正相关,2008年万方独家医学期刊组2011、2012两年的影响因子也与是否独家呈现正相关。由于相伴概率值非常高,未通过显著性检验,这一结果表明在医学期刊组中可能有其他影响因素的作用效果超过了独家出版。分析非独家期刊发现,未在万方数据库独家出版的期刊大多为综合性医学高校学报,而独家期刊样本均来自中华医学会主办的专业期刊,后者的影响力本身就大于前者,有可能导致独家期刊组影响因子增长超过非独家期刊组的情况。当在样本中增加其他学科的非独家期刊后发现,在样本数增加的情况下,相关系数的统计学显著性明显增强,全部相关系数均能够通过0.05的置信度检验,而且相关系数均为负值,可以认为万方独家出版与期刊的影响因子之间也存在负相关性。

上面的分析说明,当把独家出版的期刊放入一个大的样本组中分析时,无论是CNKI独家出版还是万方独家出版,影响因子与是否独家出版之间均存在显著的负相关性。将相关分析结果和图1-2对比发现,虽然部分独家期刊组影响因子平均值在独家后呈上升趋势,部分非独家期刊组在独家年份后出现了影响因子的下降,但影响因子与是否独家的相关系数依然表现为负值。说明独家期刊组和大量的非独家期刊进行大样本统计比较时,其下降趋势更快而上升趋势更慢,存在着独家出版导致上述变化的可能性。下面通过回归分析进一步验证。

2.4回归分析

因为上述自然科学全部期刊组和混合了医学与非医学的期刊组影响因子与是否独家虚拟变量之间存在显著相关性,因此回归分析用这2组样本来进行。选择回归方程之前,先绘制了各年影响因子之间的矩阵散点图(限于篇幅,此处未给出散点图),发现当年影响因子与前一年影响因子之间呈现强烈的线性关系,随着相隔年份增加线性关系减弱,但总体看各年影响因子之间具有线性关系。因此,选择线性回归观察独家出版对影响因子的影响。

影响因子计算的方式是期刊前两年发表论文在当年的引用次数除以前两年发表论文总数。假设独家出版对影响因子产生负的影响,独家当年和独家后两年的影响因子之间最容易观察到。加上年份越近影响因子之间的线性相关越强,故将独家后两年的影响因子分别作为因变量,独家当年的影响因子与是否独家虚拟变量作为自变量来进行回归分析。

在SPSS中将全部自然科学类期刊数据合并到一起,将2009年期刊是否独家的数据用虚拟变量D2009表示,2010年是否独家用D2010表示,各年的影响因子分别表示为IF2012、IF2011…,以此类推。利用SPSS软件获得的回归分析结果如表3所示。这些方程的整体模型方差参数F值均较大,相伴概率均小于0.001拟合程度较好,从整体上看模型都是显著的。

表3自然科学类期刊回归分析结果(N=108)

因变量

连续自变量及系数(相伴概率)

虚拟自变量及系数(相伴概率)

常数项(相伴概率)

拟合度R2

IF2010

0.784

(0.000)

IF2009

-0.052

(0.32)

D2009

0.111(0.001)

0.754

IF2011

0.649

(0.000)

IF2009

-0.121

(0.11)

D2009

.246

(0.000)

0.525

IF2011

0.896

(0.000)

IF2010

-0.034

(0.396)

D2010

0.12

(0.001)

0.768

IF2012

0.878

(0.000)

IF2010

-0.048

(0.275)

D2010

0.15

(0.000)

0.728

注:0.000表示小于0.0001。

从表3可以看出,虚拟变量前的系数均为负数,而且独家后两年的绝对值要大于独家一年后的绝对值。但是所有虚拟变量系数的相伴概率均大于0.1,未达到统计学上的显著性水平。说明上述系数产生的方程不能用来预测,但也不能排除CNKI独家出版对影响因子的降低效果。从上述虚拟变量前的系数可知CNKI独家出版后导致的影响因子的降低最低为0.034,最高为0.121,鉴于我国期刊的影响因子数值较低,如图1所示专业期刊2013年影响因子平均值也仅0.7左右,那么即使只是存在可能性,科技期刊也不能忽视这一因素。

表4混合期刊组回归分析结果(N=126)

因变量

连续自变量及系数(相伴概率)

虚拟自变量及系数(相伴概率)

常数项(相伴概率)

拟合度R2

IF2009

0.872

(0.000)

IF2009

-0.112

(0.001)

D2008

0.063(0.009)

0.828

IF2010

0.633

(0.000)

IF2009

-0.157

(0.002)

D2008

0.17

(0.000)

0.56

注:0.000表示小于0.0001。

对于包含万方独家出版医学期刊和非独家出版期刊的混合期刊组而言,回归方程的整体模型方差参数F值也较大,相伴概率均小于0.001,整体拟合程度较好,从整体上看模型也是显著的。从各个变量的显著性来看,虚拟变量的相伴概率均小于0.01,能够通过显著性检验。而且独家后两年的虚拟变量系数绝对值要大于独家一年后,显示时间越长则影响越大。这一回归结果表明,对于万方独家出版的医学期刊而言,可以认为独家出版引起了影响因子的降低,在独家出版后一年和两年引起的整体降低数值分别为0.112和0.157,从数值来看,独家出版的影响非常大。

3讨论

3.1定性分析

从图书馆对CNKI、万方与维普三家数据库的订购情况看,CNKI占据了学术文献数字出版的大部分市场份额,但依然有少量图书馆未订购CNKI。[78910]从用户使用习惯看,图书馆电子资源是读者查阅文献的主要方式,90%以上的读者通过图书馆的电子资源获取相关文献[11]。虽然少量读者会使用期刊的自出版或纸质期刊来获取文献,但这部分传播对期刊传播指标的影响较小。图书馆界所做的问卷调查和统计分析表明,三大数据库中,读者使用CNKI最多(62.5%~87%)、其次为万方(26%~38%)、再次为维普(10%~25%)[121314]。虽然部分用户会同时使用3种数据库检索文献,但研究表明三种数据库虽然文献有重复,但作为不同的产品存在差异性,部分用户只习惯使用其中一种。因此,科技期刊独家授权给任何出版商都必然缩小其传播范围,独家出版对影响因子如果有影响的话必然是负面的。

3.2对本文结果的分析

本文的相关分析表明在大样本群的情况下影响因子与CNKI或万方独家出版均呈负相关,说明存在相当的可能性独家出版带来影响因子的降低。而且这一降低并不必然表现出影响因子的简单上升或下降,而是抑制其上升或加速其下降,当将独家出版期刊与非独家期刊混合到一起进行相关分析时,结果显示出了上述特点。在回归分析中,对包含万方独家出版的期刊组数据的回归分析验证了上述假设。就本文的样本所做的分析而言从统计学上还不能下一个独家授权给CNKI数字出版必然对影响因子产生负面影响的结论。这可能是以下几个原因造成:

其一,从传播范围看,CNKI本身传播范围较大,因此减弱了独家出版带来的负面影响,导致观察出有统计学意义的结果更为困难。因为万方数据库的市场份额明显低于CNKI,因而对包含万方独家出版的期刊组进行回归分析时,结果通过了显著性检验,而CNKI期刊组则没有。

其二,影响因子的影响因素非常复杂,本文的研究中未将其他因素包含进来,若能排除其他因素的影响来观察独家出版的影响,结果会更为明显。如果要从计量学上进一步观察独家出版对影响因子的负面影响,还需要扩大样本量和增加变量的数量。可以通过大规模的问卷调查来获得影响因子的其他影响因素,如:期刊的“口碑”、学科、期刊的自出版情况等,并将这些因素转化为变量后进行多变量分析或采用结构模型分析。

4结论

上述分析表明独家出版确实与影响因子之间呈现出负的相关性,回归分析表明从统计学上看,独家授权给万方数字出版确实导致影响因子的下降;独家授权给CNKI虽然也带来影响因子的下降,但结果未达到统计学上的显著性。从结果来看,期刊需要足够重视独家出版对影响因子的影响,这是因为:

首先,虽然有部分结果未通过显著性检验,但并未从统计学上排除独家出版的负面影响,而且相关性分析表明这种可能性非常高。

其次,回归分析系数数值显示,独家出版对影响因子的影响是非常高的,说明对期刊而言独家出版带来影响因子下降的风险非常大。

再次,期刊影响因子(CSCD数据)反映的只是读者阅读了期刊论文后撰写论文并发表在CSCD收录期刊上,而且恰好要在影响因子的计算周期内发表出来。因此,期刊传播范围的缩小最终反映在影响因子上会被大大缩小,因为下载和阅读了期刊论文的读者未必会撰写论文发表,而发表的论文也有很多是在CSCD期刊之外或者发表时间在影响因子统计周期之外。在这种情况下,期刊要更加慎重的对待影响因子的变化,因为影响因子的微弱变化反映的是期刊传播效果的剧烈变化。

笔者认为,从本文的分析结果看,期刊不能抱着与CNKI这样的大数据库签订独家出版协议不会影响影响因子的侥幸心态。从现实的出版实践看,期刊编辑部的做法本身就较为矛盾,很多期刊一方面与网络服务商签订独家出版协议,另一方面又花费大量人力物力进行自出版、开放存取,甚至利用微信、微博等新媒体向读者推送论文。但是科技期刊的主要读者群其实是数据库用户,某个数据库独家出版带来的传播范围的缩小不见得能够通过自出版或新媒体推送弥补回来,而且独家出版后再进行自出版或推送还存在版权纠纷的可能。因而,不仅存在独家出版导致传播范围缩小而对影响因子产生负面影响,还存在其他风险,科技期刊应慎重考虑是否与出版商签订独家数字出版协议。

参考文献:


[1]方红玲.我国医学期刊加入不同全文数据库前后文献计量学指标的变化[J].中国科技期刊研究,2012,23(1):80-83.

[2]栾嘉,冷怀明.网络传播独家授权对医学期刊计量指标的影响[J].科技与出版,2012(5):68-70.

[3]朱强,戴龙基,蔡蓉华.中文核心期刊要目总览(2008年版)[M].北京:北京大学出版社,2008.

[4]《中国学术期刊网络出版总库》独家许可出版期刊清单[EB/OL].www2.tit.edu.cn/tsg/upload/201004/20100412203113118.xls[2012-11-04]

[5]电子杂志社有关负责人就学术期刊独家授权相关问题答记者问[EB/OL]. http://www.cnki.net/gycnki/daobao/cnkidaobao33/daobao33_8.htm[2012-11-04]

[6]邱皓政.量化研究与统计分析[M].重庆:重庆大学出版社,2013:227.

[7]张靖.河南省高校及公共图书馆电子资源调查分析[J].图书馆界,2012(4):12-16.

[8]孙晓明.天津市高校图书馆联盟电子资源建设调查分析[J].图书馆工作与研究,2008,(3):15-19.

[9]李云芝,熊松韫,张贝.云南省高校图书馆电子资源建设调查与分析[J].图书馆建设,2009(3):23-29.

[10]曹君,张小梅.我国高校图书馆电子资源建设调查与分析[J].科技情报开发与经济,2009,19(23):3-8.

[11]杨毅,邵敏,李京花,向阳,董丽.电子资源建设与利用的读者调查[J].大学图书馆学报,2006(6):39-48.

[12]刘春红.高校图书馆网络电子资源利用现状调查与对策研究[J].东北电力大学学报,2009,29(5):79-83.

[13]易华通.高校学生使用中文全文数据库资源调查分析[J].科技情报开发与经济,2008,18(13):89-90.

[14]肖景.大学图书馆数据库使用的读者调查与分析[J].四川图书馆学报,2010(6):53-56.