「聲量看政治」有瑕疵的聲量計算法,讀者應該照單全收嗎?
by 主筆室

 



「網路政治」儼然是當今選戰的當紅炸子雞,且因為社群網路「凡走過必留下痕跡」的特性,使用計算關鍵字數量等文字探勘技術的「聲量政治」,也成為了政治人物及其競選團隊,用來觀測網路風向、判斷選民正負情緒,甚至輔助預測選舉結果的重要工具。


「聲量政治」是新時代的趨勢,沒有人可以避免。但是值得擔憂的是:目前市面上各家廠商提供的「大數據觀測」工具,彼此的計算方式更有非常大的岐異,有些解釋的結果,更是不折不扣的「黑箱」,達到了令人「匪夷所思」的地步。


例如,長期觀察聲量政治的粉絲專頁「聲量看政治」,日前發佈了「2024總統大選新聞,柯文哲聲量佔比最重」一篇文章,該篇文章宣稱:


根據這260天(1/11 - 9/27)的新聞聲量資料,以2024總統大選為新聞標籤的新聞中,內文所提及的政治人物以柯文哲比例最高,佔了29.40%;其次是韓國瑜,佔了20.33%;第三名是朱立倫,佔了16.40%。


圖片取自:聲量看政治

其實,單看此文呈現的排名,就已經足以顛覆許多長期觀察「網路政治」的人的想像,例如,長期被國民黨「邊緣化」的朱立倫、亦或是已經長期不問政事的郭台銘,怎麼可能在「選2024總統」這個議題的網路聲量上,勝過侯友宜、鄭文燦、賴清德等政治人物?


事實上,經過仔細觀察「聲量看政治」的資料來源以及解釋方法後,我們認為,「聲量看政治」的作者並沒有告訴我們完整的故事,甚至更告訴了我們「錯誤的」故事:


1. 「聲量看政治」所謂「2024總統大選 相關新聞」的新聞來源,只有六家:


「聲量看政治」此篇文章最吸引目光的,莫過於作者侷限在「2024總統大選」標籤的相關新聞,但是其「2024總統大選」的相關新聞,來源其實相當有限;事實上,我們發現作者的新聞來源,僅有「風傳媒」、「新頭殼」、「自由時報」、「三立新聞網」、「中時電子報」、「大紀元」六間媒體:


「聲量看政治」2024總統大選 媒體分佈,圖片來源:https://bit.ly/3l0t6wX

 

換句話說,作者幾乎只用六家媒體的新聞資料,就要推論成「整個新聞媒體」的新聞資料,其他主流媒體如「蘋果新聞網」、「聯合報」、「中央社」等,完全付之闕如。


因此,在最初的資料來源上,這份觀測就已經「先天不足」,更可惜的是,作者在原始文章中,完全沒有提到這個「缺陷」。


2. 「聲量看政治」忽略了必須對媒體「避而不答」的人群,導致結果和現實脫節:


除此之外,「聲量看政治」討論政治人物的方法,和長期觀察「聲量政治」的經驗不符,例如:為何作者只觀察「媒體聲量」,而不討論「其他社群頻道」(如Facebook、YouTube、Instagram⋯⋯)的聲量呢?


調查媒體聲量,一個很大的缺點,就是會被媒體的「取材」傾向,受到嚴重干擾,因而失真;像是:柯文哲、韓國瑜,一直以來被媒體認為是較「有梗」的政治人物,自然也較受媒體青睞,報導數也比較多;而如賴清德、鄭文燦、林佳龍等綠營政治人物,因為尊重現任總統的緣故,對「選總統」這個議題只能「避而不答」,在「套不出話」的前提下,媒體聲量自然較少;然而,他們在其他方面的網路聲量,未必會落於人後。


在這樣的情況下,我們沒有足夠的信心,可以認為「聲量看政治」只討論媒體聲量的結果,能告訴我們一個「足夠」的故事。


3. 「聲量看政治」只討論「2024總統大選」的方法,其實不比直接討論政治人物個別聲量的方式準確:


「聲量看政治」只討論「2024總統大選」的方式,雖然也有價值,但「強加標籤」的結果,就是「過度推論」。


事實上,所有「聲量」資料只能告訴我們:「OOO的社群聲勢不錯」,我們再「依據」聲量資料的結果,去「嘗試」推論「OOO選總統的機會比較高」。把目光只放在「2024總統大選」,其實有所侷限,例如被認為是國民黨2024年最有勝選機會的侯友宜市長,在此排名上僅僅有第11名,令人匪夷所思。


相較之下,我們認為比較政治人物在社群上或是新聞上的「整體聲勢」,結果反而會更為準確,也更有討論價值。


有鑑於此,我們使用長期與報臺合作的Qsearch輿情系統交叉驗證,並仿照「聲量看政治」的計算方法。毫不意外地發現:「單使用政治人物」作為關鍵字的聲量,和「聲量看政治」使用「2024總統大選」標籤的數據,呈現非常不同的樣貌:

 



就我們的系統顯示,在新聞標題或內文提及的政治人物排名,分別是韓國瑜、蘇貞昌、柯文哲、江啟臣⋯⋯等;這樣的結果和「聲量看政治」跑出朱立倫第3、郭台銘第6、侯友宜第11的結果,的確有明顯差異;朱立倫、郭台銘在我們的系統分別只位居第10、第11位,侯友宜則上升到第5,這樣的排名,相信更符合長期觀察政治後,所得到的「趨勢」。


綜上所述,我們有合理的理由懷疑:「聲量看政治」的數據,並沒有告訴我們「正確的」故事,甚至因為「聲量看政治」資料來源不夠全面、取樣方式有問題等種種原因,使得「聲量看政治」所呈現的數據,和真實世界的全貌相差甚遠。


即使如此,我們仍應該給「聲量看政治」使用「數據」而非「直覺」來判斷政治,給予更多的掌聲;「聲量看政治」更有許多觀測方法值得借鏡;但是,對於社會大眾而言,我們在觀測網路上免費提供的「聲量」數據時,仍應多保留警覺心和批判心,以防被有心人士誤導。