中國教育和科研計算機網 中國教育 高??萍?/a> 教育信息化 下一代互聯網 CERNET 返回首頁
影響因子:一個簡單變量的“封神”之路
2020-03-04 中國教育和科研計算機網 王世新

  為破除“SCI至上”導致的種種亂象,教育部、科技部日前聯合發文,要求高校規范各類評價工作中SCI論文相關指標的使用,鼓勵探索建立更加科學的評價模式。這里所說的SCI其實是一套體系,其相關指標包括論文數量、被引次數、高被引論文、影響因子、ESI排名等,這其中,影響因子與論文數量、被引次數、高被引等指標相輔相成,被認為是論文(學術期刊)質量、水平和影響力的標志,也是之前長期居于評價體系核心位置并與廣大科研工作者休戚相關的指標,因此有必要專門拿出來剖析一番。

  事實上,通過梳理影響因子的“封神之路”,可以讓我們再次深刻的認識到,糾正因SCI以及影響因子所帶來的“以刊定文”或者“量化至上”的唯一途徑,是對同行評審、代表作評價方面拿出符合中國國情、切實可行的操作辦法,而決不能繼續在“看刊物、數數量”上打轉轉,否則SCI也罷,影響因子也罷,即便用文件將它們拉下神壇,也會換個“馬甲”還魂而已。

  最簡單算法的“上位”套路

  “影響因子”(Impact Factor,IF)1955年首次出現在尤金·加菲爾德(Eugene Garfield)發表在《Science》雜志上的一篇文章中,這位無可爭議的SCI創立者,影響因子之父這樣寫道:對于意義重大的文章,引用索引具有量化價值,它能幫助歷史研究者評估文章的影響——這也就是“影響因子”……通過科學引文索引(SCI),可以有效檢索收錄期刊論文被哪些文章引用過,這在歷史研究中將發揮明顯作用,當人們嘗試評估某項研究成果的意義,或它對同時期的文獻或思想產生的影響時,“影響因子”應該比科學家出版成果的絕對數量更具說服力。

  后來由于期刊規模大小、刊文數量差異所衍生的問題較多,加菲爾德在1963年將“影響因子”的定義修訂為“期刊文章的平均被引用次數”。

  1975年,期刊引證報告(JCR)首次以SCI附卷的形式出版,逐年發布期刊影響因子。如今,影響因子算法的標準定義是:期刊X在前面兩年發表的源刊文本(source items)在當年度的總被引用數,除以期刊X在前面兩年發表的文章(article)總數量,即為期刊X當年度影響因子的得數。

  千萬不要被這個看似復雜的定義嚇倒,其實這是一個非常簡單地四則運算,甚至只用到加法和除法。

  舉個例子,我們想計算某一本學術期刊2020年的影響因子,假如它在2018年發了500篇文章,在2019年發了500篇文章,而這1000篇文章在2020年總共被引用了10000次,那么該雜志在2020年的影響因子就是10(10000除以1000)。

  從本質上說,影響因子雖然意圖用量化手段來評價期刊的學術水平,但最初只是作為科研工作者向學術期刊投送論文的參考性數字,這樣一個簡單至極的變量如何會一步步成為眾多科研人員推崇備至的核心評價指標呢,有以下幾個原因:

  一是名字高大上。這很像加菲爾德最早注冊的名為DocuMation或者“尤金?加菲爾德學會”的公司名都默默無聞,而四年后定名為“科學情報研究所”(Institute for Scientific Information,ISI)之后,雖然私營公司性質沒有任何變化,但很快就拿到了美國國家科學基金會(NSF)30萬美元資助,承擔建設遺傳學文獻引用索引庫(Genetics Citation Index)項目。加菲爾德本人也坦率地承認,他就是要用這樣的名字與當時的政府學術機構爭奪市場,特別是在國外,“科學情報研究所”這樣的叫法,很容易被當成一家非盈利機構。試想“影響因子”如果根據定義命名為“期刊文章的平均被引用次數”,還會有現在這么大影響嗎?

  二是時勢造英雄。1960年代前后,經歷了二戰之后的美國科研進入全面爬坡階段,當時美國大學要進行終身教授的評選時,管理者們發現,在歐洲備受推崇的“同行評議”評價方法根本沒有辦法進行,因為按照理想狀態應該將已經成為終身教授的人都找來,拿著每一篇論文集體進行研判,但這個過程實在太過復雜,再加上科研人數大幅度增加,現實中很難操作,美國大學退而求其次去尋找可以量化的手段,SCI以及影響因子就成了替代的評估方法之一,這也像極了三十年前SCI剛剛引入中國并迅速成為評價指標的情景。1980年代之后,科技的重要性使得各發達國家以及后起的發展中國家大幅度增加了相關投入,投入需要依據,就必須對研究論文、報告、專利等成果進行評價、評估;對于研究者個人來說,成果在哪里發表事關自己的學術生涯,并希望自己的論文被同行所關注并引用……在這種認知氛圍中,SCI特別是影響因子作為美國先進生產力的代表,借勢全球一體化擴張,很快鞏固和加強了自己的世界學術圈的“江湖地位”。

  三是宣傳造勢強。作為一個學術指標,最重要的是要讓科研管理者與科研人員相信,這個指標與學術水平、論文質量是成正相關的,而影響因子要證明的是引用情況好的論文就是影響力大,質量高的論文,此類論文的載體就是好期刊。在這方面,最鮮明的例子就是加菲爾德將SCI相關指標與諾貝爾獎聯系起來,并在一次學術會議上用數據顯示13位諾獎學者在得諾獎的前一年,他們的成果被SCI論文引用的平均數量和次數遠高于一般水平,以此證明SCI對于諾獎的預測能力。同樣,影響因子這個顯示學術期刊的文章在特定年份或時期被引用的頻率,也被宣傳為是衡量學術期刊影響力的重要客觀標準,2002年湯森路透開始靠“影響因子”預測諾貝爾獎,并頒發“引文桂冠獎”。雖然一直以來都有學者批評SCI以及影響因子是有選擇的呈現,但確實體現了它們在占據市場的過程中,巧妙地宣傳造勢所起到的重要作用。

  當然,打臉的“反例”也比比皆是,比如2018年諾貝爾物理學獎獲得者唐娜·斯特里克蘭,相關論文就發表在了低影響因子期刊《光學通訊》上。

  四是重賞和剛需。2006年,著名的學術期刊同時也是高影響因子的《Nature》曾經有些“受寵若驚”的刊文稱:中國有些科研單位以及高校在他們雜志上發一篇文章能夠拿到25萬、30萬元的獎金;2009年,廣州一所醫學院對系統內2008年度SCI論文發表者拋出158.7萬元巨獎,按論文發表刊物的影響因子每1分獎勵1萬元……這種獎勵數目在之后愈演愈烈,水漲船高。

  而重賞之下的另一面,則是從根部渲染SCI尤其是影響因子在大學生或者科研人員學術生涯中的關鍵性作用:比如本科生、研究生畢業,高?;蛘哐芯繖C構求職,硬性要求高校教師每年需要發表多少篇影響因子多少以上的論文,否則末位淘汰等等來設置門檻。同時,論文數量和發表雜志的“檔次”則成為部分學者衡量自己價值、地位的象征。正是在我們自己這種不遺余力的全方位推動下,影響因子才異化成了中國科研人員安身立命的“怪物”。

  影響因子如何淪為學術的對立面

  學術圈里一直流傳著這樣的段子:ESI是高校領導的心頭肉,影響因子是科研人員的命根子。蓋因ESI反映的是高校以及學科排名進退的整體情況,而影響因子則決定了科研人員投中論文的期刊分數是否降低或者升高,這直接影響他們當年的待遇以及未來的發展、升遷,同時也會影響論文發表的走向。

  因此,每年湯森路透JCR的公布都會引起巨大的反響和討論,喜氣洋洋有之,頓足捶胸者亦有之。略顯諷刺的是,論文還是那篇論文,期刊還是那個期刊,只因為一個簡單變量不同了,其學術價值以及寫作者的實際利益甚至命運就改變了。此時,影響因子更像是股市的大盤,坊間科研人員之間的互動最能體現這種黑色幽默:樓市股市都漲了,你的論文(投中期刊)影響因子漲了嗎?

  如果向前推十幾年的光景,客觀來說,當時國內高校以及研究機構通常是以SCI論文發表數量作為學者考核的核心指標,但被SCI收錄的期刊學術水平未必都是高的,而且考核中往往對論文和簡訊、自引率和他引率“一視同仁”,導致一些人鉆了空子。當這種評價標準在屢受抨擊之后,影響因子被推到前臺,本質上是將SCI收錄的學術期刊再次劃分三六九等,依據刊物影響因子實施獎勵,這比起“唯數量論”來雖有小小進步,卻依然擋不住它成為評價體系核心指標后所體現出來的荒謬。

  第一,平均值下的邏輯游戲。影響因子一直在玩一個邏輯游戲,那就是讓管理部門、科研人員人員都相信一個“真理”:學術期刊前兩年發表文章在當年被引數的平均值等同于該期刊當年的學術水平,那么,在該期刊發表的論文也等價于你的學術水平。在這個邏輯閉環中,無論是前提還是結論都有很大的漏洞:比如,為什么統計的是前兩年而不是前五年的數據至今沒有非常明確的依據。同時,一本高影響因子的期刊,只能表明它擁有多篇被多次引用的論文,但并不意味著它刊載的每一篇論文都是高引用的,這意味著,即便高引用就相當于高質量這個前提成立,由于它無法體現每篇文章的情況,那么反過來說也不能證明每篇論文都是高質量的,更不能證明你投送并發表的論文就是高質量的。

  第二,高被引未必是高質量。高被引是否等同于論文高質量、高水平,這是影響因子甚至SCI的立身之本。從數據統計學角度來看,高被引與論文的意義以及重要性方面不能說絕對沒有聯系,但這種聯系有多大程度上的正相關值得懷疑。2013年諾貝爾獎得主蘭迪·謝克曼(Randy W.Schekman)曾在媒體上直言不諱:影響因子是一種噱頭,這種衡量方法有重大缺陷,引用與質量并不完全相關,“一篇論文被大量引用可能是因為它是好的研究,也可能是因為它吸引眼球,或者是挑釁式的甚至是錯誤的”。對于中國人來說,這方面最有代表性的就是前兩年鬧得沸沸揚揚的“韓春雨事件”。

  2016年5月,河北科技大學副教授韓春雨在《自然?生物技術》(Nature Biotechnology,Nature雜志的專業子刊之一)上發表論文,宣稱他成功利用NgAgo進行基因編輯,可媲美當前最為流行的基因編輯工具CRISPR-Cas9。此事經國內媒體報道之后,韓春雨頓時名聲大噪,名利雙收,論文發表兩個月后還當選為河北省科協副主席,他論文中所說的這項工作也被評為“諾獎級別的工作”。一篇論文為何能得到如此的推崇?就是因為《自然?生物技術》當年的影響因子高達43,比母刊《Nature》的還要高。然而好景不長,這篇文章很快受到了國內外學者的廣泛質疑,甚至國內13位科研團隊的負責人實名指證韓春雨的實驗無法重復,2017年8月,韓春雨主動撤稿,該事件暫告一個段落。但在這個過程中,韓春雨的這篇文章卻成為了高被引論文,其中有很大一部分是引用該文進行批駁的。

  這種事例在科技史上并不鮮見,比如之前曝光的前哈佛醫學院安維薩教授的31篇與心肌干細胞“c-kit+”相關的論文,不僅引用量很大,還有很多模仿研究,最后因涉嫌偽造和篡改實驗數據被撤稿。所以僅僅根據引用率來評定科技成果,就很難全面評定出可經受起長期考驗的科學成果,甚至可能評出錯誤的結果,可惜SCI相關指標無法進行區分。

  第三,可操作的空間。從某種程度上說,影響因子首先帶歪的其實是學術期刊。一旦學術期刊認定自己要專注的除了發表所在領域比較重要的學術作品之外,更要關注影響因子這個變量,尤其是這個變量將影響期刊投稿質量甚至生存的時候,很難不產生一些想法。

  如同SCI不能區分自引和他引的漏洞一樣,影響因子也有操作的空間,秘密就隱藏在定義它的那個簡單公式中,想要增加一個分子式的結果無非就是加大分子數或者減少分母數,實際解決的途徑就是大幅度加大發文量以提升引文量或者減少發文量,當然最好是減少發文量的同時還能增加引文量,如何來操作呢?根據上海交通大學江曉原教授的研究,其秘密就隱藏在對分母里“文章”(article)的定義當中。

  我們可能很難想象,現在的高影響因子的代表,《Nature》、《Science》、《柳葉刀》等神刊,在1972年的時候SCI期刊排名全在40名開外,原因就是當時的影響因子將期刊的所有文本(社論、技術通信、通告、讀者來信等)都算作分母。針對這種情況,在1975年的JCR報告中,加菲爾德對規則作了調整,規定分母項只包括三類“學術文本”:原創研究論文(original research articles)、綜述文章(review articles)和技術報告(technical notes);1995年度的JCR報告中分母規則再次調整,“技術報告”也被剔除,只保留“原創研究論文”和“評論文章”兩項。

  這種“最終解釋權由定義者調整”的做法,使得《Nature》、《Science》、《柳葉刀》、《美國醫學會雜志》等期刊的影響因子大幅提升,尤其是《美國醫學會雜志》較定義修改前驚人的上升了100個位次,基本上奠定了它們如今的“學術江湖地位”。

  第四,學術期刊也追熱點?,F在很多人批評學者們寫論文追求熱點,其實根源在于學術期刊本身就在追熱點,基于影響因子游戲的需要,被引用數可謂是學術期刊的命脈。因此在保證論文學術價值的同時,期刊還要考慮刊發的論文是否有“看點”或者爭議性,從而產生了特別的偏愛:比如《Science》、《Nature》雖是綜合性學術刊物,卻格外青睞生命科學領域的文章,像數學、計算機等領域的學者,很少能在上面發文,《Nature》等不少期刊還被指責過分追求趣味性。

  這種“按影響因子和期刊喜好定研究方向、寫論文”所帶來的蝴蝶效應是非??膳碌?,往小里說,科研工作者不是從自身興趣、改變科學面貌、提升科技水平的初衷出發,而是去鉆營哪個領域、哪個方向更容易寫論文,更容易發論文,完全嵌入了本末倒置的陷阱當中,學術論文淪為逢迎的“水文”,自然談不上學術水平、科學價值;往大里說,一茬茬按照這種模式晉升成長起來的學術人才自然而然的扭曲了學科體系,好發論文的化學、醫學、材料學等領域人滿為患,數學、物理、人文學科等領域舉步維艱,此消彼長之下,必然會造成學科布局的畸形發展。

  一場反影響因子的全球行動

  影響因子作為一個全球性的重要學術指標,并非僅在中國學術圈受到重視。據《Nature》發表的一項調查發現,北美40%的研究型大學在決定提拔誰時都會考慮期刊的影響因子。該調查對美國和加拿大129所高校的800多份文件進行了分析。結果顯示,在研究型機構中,約40%在涉及員工考評、晉升和終身職位評審的文件中提到影響因子。這些數據表明,很多大學正在使用一種被廣泛批評為粗糙且具有誤導性的指標評估科學家的工作質量及表現。

  令人高興的是全球學術界已注意到影響因子的不良導向,開始尋找解決之道。

  在2012年12月美國細胞生物學學會年會期間,一些學術期刊的編輯和出版者提出關于科研評價的建議,在此基礎上成立了舊金山科研評價宣言小組,他們認為,科學界應停止使用“期刊影響因子”來評價科學家個人的工作,并起草了著名的“舊金山宣言”(The San Francisco Declaration on Research Assessment,DORA)。宣言提出:“影響因子不能作為替代物用于評價個人研究論文的質量,也不能用于評估科學家的貢獻,以及用于招聘、晉升和項目資助等評審”。DORA還提出系列改進科研論文評價方式的建議,供科研機構、出版商以及評價機構借鑒。這些建議得到超過150多位知名科學家和包括美國科學促進會(AAAS) (《Science》出版方) 在內的70余家科學機構聯名簽署支持。

  2015年4月,《Nature》發表了在前一年荷蘭萊頓召開的一次國際會議上幾位教授提出的合理利用科學評價指標的十條原則,這個被學術界稱為“萊頓宣言”的第一條原則開宗明義:“量化評估應當支撐質化的專家評估,而不是取而代之”,實際上是糾正“量化至上”的科研評價風氣。

  全球科研人員對抗影響因子的實踐和思路對于我們來說都有很大的借鑒意義。應該說,科研評價尤其是科學家貢獻的個體評價是一項非常復雜又牽涉整個國家科技發展走向的大事,我國在2020年這個關鍵歷史節點提出規范SCI相關指標使用,破除“SCI崇拜”的細則和負面清單無疑是具有積極意義的。但需要注意的是,“立”比“破”更加困難,糾正因影響因子所帶來的“以刊定文”或者“量化至上”的唯一途徑,是對同行評價和代表作評價方面拿出符合中國國情、切實可行的操作辦法,而決不能繼續在“看刊物、數數量”上打轉轉,否則SCI也罷,影響因子也罷,即便用文件將它們拉下神壇,也只會換個“馬甲”還魂而已。

教育信息化資訊微信二維碼

特別聲明:本站注明稿件來源為其他媒體的文/圖等稿件均為轉載稿,本站轉載出于非商業性的教育和科研之目的,并不意味著贊同其觀點或證實其內容的真實性。如轉載稿涉及版權等問題,請作者在兩周內速來電或來函聯系。

郵箱:gxkj#cernet.com
微信公眾號:高??萍歼M展
重庆幸运农场图