“被引量”指標(biāo),是否可用于衡量公眾號(hào)文章水平?
是時(shí)候該有人站出來(lái)做點(diǎn)什么了,比如給內(nèi)容行業(yè)也加入一個(gè)讓死學(xué)術(shù)圈欲仙欲死的“影響因子”。
學(xué)術(shù)論文有一個(gè)必不可少的部分,叫做“參考文獻(xiàn)(References)”,在這個(gè)模塊里你要把你在本論文中引用觀點(diǎn)的來(lái)源標(biāo)注出來(lái):
參考文獻(xiàn)作為論文的一個(gè)重要部分,一方面表示了該篇文章是基于什么樣的研究基礎(chǔ)展開(kāi)的;另一方面,對(duì)于被引用的論文,被引量代表了該文章的影響力和價(jià)值。
學(xué)術(shù)領(lǐng)域無(wú)人不知無(wú)人不曉的湯森路透基于文章的被引量會(huì)發(fā)布一個(gè)期刊引證報(bào)告,報(bào)告的核心指數(shù)稱之為影響因子。
影響因子(Impact Factor,IF)是湯森路透(Thomson Reuters)出品的期刊引證報(bào)告(Journal Citation Reports,JCR)中的一項(xiàng)數(shù)據(jù)。 即某期刊前兩年發(fā)表的論文在該報(bào)告年份(JCR year)中被引用總次數(shù)除以該期刊在這兩年內(nèi)發(fā)表的論文總數(shù)。這是一個(gè)國(guó)際上通行的期刊評(píng)價(jià)指標(biāo)。
影響因子現(xiàn)已成為國(guó)際上通用的期刊評(píng)價(jià)指標(biāo),它不僅是一種測(cè)度期刊有用性和顯示度的指標(biāo),而且也是測(cè)度期刊的學(xué)術(shù)水平,乃至論文質(zhì)量的重要指標(biāo)。
谷歌學(xué)術(shù)也采用了相似的H指數(shù)作為學(xué)者和期刊評(píng)價(jià)的標(biāo)準(zhǔn):
所以我在想,公眾號(hào)的文章可不可以引入這么一個(gè)“被引量”指標(biāo),用以評(píng)價(jià)一篇文章或者一個(gè)公眾號(hào)的水平呢?
學(xué)術(shù)文章的被引量很容易計(jì)算,因?yàn)閲?guó)家有明確的法律法規(guī)和標(biāo)準(zhǔn),只要有足夠全的學(xué)術(shù)文章便可以計(jì)算出某篇文章的被引量。
對(duì)于公眾號(hào)來(lái)說(shuō),計(jì)算被引量所需要的數(shù)據(jù)也是完善的。
首先,功能層面
2017年6月6日,公眾號(hào)開(kāi)放了“插入全平臺(tái)已群發(fā)文章鏈接”的功能
這個(gè)功能的開(kāi)放為添加“參考文獻(xiàn)”提供了可能。
然后,數(shù)據(jù)層面
目前內(nèi)容創(chuàng)業(yè)服務(wù)公司新榜保持每天對(duì)44.8萬(wàn)個(gè)公眾號(hào)文章的采集工作,幾乎包含了所有活躍的公眾號(hào)。這部分公眾號(hào)的文章在新榜數(shù)據(jù)庫(kù)是可檢索的。
最后,技術(shù)層面
要獲取文章的“被引用”情況,首先需要知道文章的被引用的情況,然后需要知道文章的來(lái)源(即公眾號(hào))。
而這兩個(gè)數(shù)據(jù),也是全部可以得到。
文章引用行為的獲取
我們打開(kāi)一篇“引用了”其他文章的公眾號(hào)文章,F(xiàn)12檢查文章的源代碼可以看到,文章是以超鏈接的形式出現(xiàn)的:
所以在采集文章時(shí),如果在源代碼中采集到
<a herf = “http://mp.weixin.qq.com/s?__biz********************* “>文本</a>
的字段,則可以認(rèn)為此處有“引用”行為。
引用來(lái)源分析
找到了文章的引用行為,我們需要對(duì)被引用的文章進(jìn)行分析,分析的核心在就于這篇文章的鏈接,也就是剛才herf后面的那一串。
幸運(yùn)的是,微信在鏈接里保存了我們需要的所有數(shù)據(jù)。
以剛才那篇文章的鏈接為例:
http://mp.weixin.qq.com/s?__biz=MzU1MTAwNzY4Mg==&mid=2247483897&idx=1&sn=893614b6d6fd28d04b0f51e7c857c876&chksm=fb96a554cce12c4266018f581467f009021b89f5df0d546b1d08f4a08055ce17916f2ae74745&scene=21#wechat_redirect
我們把鏈接分為三部分:
http://
mp.weixin.qq.com/s
__biz=MzU1MTAwNzY4Mg==&mid=2247483897&idx=1&sn=893614b6d6fd28d04b0f51e7c857c876&chksm=fb96a554cce12c4266018f581467f009021b89f5df0d546b1d08f4a08055ce17916f2ae74745&scene=21#wechat_redirect
了解鏈接組成的同學(xué)們應(yīng)該知道,前兩部分是鏈接的主題,每個(gè)文章的鏈接都是一樣的。關(guān)鍵信息在于“?”后面的部分。
在鏈接里,“?”后面的部分是鏈接的傳參,顧名思義,就是向服務(wù)器傳遞的參數(shù),是對(duì)鏈接的解釋(或者叫備注)。
觀察鏈接里的參數(shù),有五個(gè):
__biz
mid
idx
sn
chksm
我們這里只用到前兩個(gè)參數(shù):
__biz可以認(rèn)為是微信公眾平臺(tái)對(duì)外公布的公眾帳號(hào)的唯一
idmid是圖文消息id
通過(guò)__biz參數(shù)可以獲得公眾號(hào)的ID數(shù)據(jù),是唯一識(shí)別的,目前技術(shù)上可以轉(zhuǎn)化成賬號(hào)的;
通過(guò)mid參數(shù),我們則可以定位到文章的ID,也是唯一識(shí)別的。
到此,對(duì)于文章引用行為技術(shù)層面的問(wèn)題都已經(jīng)解決。
“被引量”的使用
和學(xué)術(shù)領(lǐng)域相同,一篇文章被引用一次,則代表該文章影響力+1,被引量越多,文章影響力就越高。
對(duì)于公眾號(hào)而言,可以使用賬號(hào)所有文章的被引量計(jì)算賬號(hào)的“影響因子”,可以使用SCI的計(jì)算方法,也可以使用GoogleScholar的H-index的計(jì)算方法。
和學(xué)術(shù)領(lǐng)域相同,文章也存在”自引“和”負(fù)引用“的問(wèn)題。
自引在學(xué)術(shù)領(lǐng)域是一個(gè)不怎么受待見(jiàn)的事情,因?yàn)椤氨灰俊边@個(gè)指標(biāo)已經(jīng)作為一種評(píng)價(jià)標(biāo)準(zhǔn),引用自己的文章給自己+1這種行為不是很好看。
負(fù)引用這件事在學(xué)術(shù)領(lǐng)域還不那么嚴(yán)重,一篇論文的結(jié)論不管對(duì)錯(cuò),學(xué)術(shù)層面的價(jià)值是存在的。但是在媒體行業(yè)就不同了,畢竟媒體很多時(shí)候傳遞的是價(jià)值觀。比如某篇文章觀點(diǎn)偏激,被全網(wǎng)噴,我們只能說(shuō)那篇文章影響力高,但是價(jià)值就沒(méi)多少了。
這里我們就不深入討論了。
最后說(shuō)點(diǎn)啥
目前的內(nèi)容行業(yè),充斥著營(yíng)銷號(hào)、流量號(hào),一群自媒體人聚在一起不是討論什么樣的文章有價(jià)值、什么樣的內(nèi)容有深度,而是討論今天的收益如何、多少閱讀量才能開(kāi)通流量主。
我們每天僅有的幾分鐘閱讀時(shí)間里,有一半浪費(fèi)在那些“聳人聽(tīng)聞”但毫無(wú)營(yíng)養(yǎng)的標(biāo)題黨上,反而那些報(bào)道事實(shí)、傳遞價(jià)值的深度內(nèi)容或因?yàn)槲淖痔L(zhǎng)、或因?yàn)闃?biāo)題不夠吸睛,被淹沒(méi)在這爆炸的信息海洋中。
是時(shí)候該有人站出來(lái)做點(diǎn)什么了,比如給內(nèi)容行業(yè)也加入一個(gè)讓死學(xué)術(shù)圈欲仙欲死的“影響因子”。
立即登錄