智東西(公眾號:zhidxcom)
編 | 季瑜生
導語:利用AI技術,結合網站歷史評估、外部渠道評價以及文本分析,麻省理工大學團隊推出了準確率高達65%的假新聞檢測系統。
智東西10月8日消息,近日,麻省理工大學團隊聯合塔爾計算所宣布將利用人工智能進行假新聞鑒別,準確率可達65%。
“真實”作為新聞最基本的要素,在當下卻變得益發稀缺。無論是早些年的震驚業界的珍妮特.庫克事件還是近些年各種網站以及社交媒體上層出不窮的小道消息,人們生活的信息世界里正充斥著大量無法辨別的虛假信息。
三月份的一個調查顯示,有一半的美國人都在新聞網站上見到過有偏向性的新聞,而多數的受訪者則表示無法辨別新聞的真實性。
那么該如何辨別這些虛假消息呢?麻省理工學院的研究人員以及塔爾計算所宣布已經創建了一個可以鑒別信息來源以及可信度、偏見程度的AI系統。該系統將在于比利時布魯塞爾舉行的2018年EMNLP大會上公開發布。
該系統搜集了1,066個帶有Media Bias / Fact Check的網站開放數據集。然后根據網站本身的文章、維基百科頁面、Twitter帳戶甚至URL等來源,系統對新聞進行了“真實程度”“偏見程度”的打分。
該系統的創見性在于采用了多維度內容評測,除過文本內容提取外新聞來源、網絡數據流量結構、社交媒體評價都是重要參考渠道。

▲MIT人工智能系統利用多維度測評對信息真實性進行核查
其中,維基百科是一個重要參考渠道。一般維基百科里網站的詞條內容越長,網站內容的真實性也就越高。此外,維基百科里的標簽評價也是一大參考要素,洋蔥新聞的維基百科頁面標記為偏左,Drudge Report的維基百科頁面標記則為保守。
另外,值得一提的是,該系統采用支持向量機(SVM)來評估新聞的真實度與偏見程度。其中,真實性分為高、中、低三點,政治偏向性分為極左、左、中偏左、中偏右、右、極右七點。

▲MIT的研究結果表明,具有“極端”偏見性和低準確性的出版物之間存在相關性。
除過消息來源分析以外,內容分析也是一大主要方式,系統會在每個新聞網站上分析50到150篇文章,并對其中的語言進行檢查。
一些具有明顯傾向性的新聞網站為了挑起讀者的情緒,相較主流網站,經常會使用一些比較有辨識度的語言。比如假新聞網站會經常使用一些夸張或者情緒化的詞語,左傾媒體則會高頻使用“公平”“互惠”。
根據麻省理工大學團隊的說法,該系統只需要150篇文章就可以確定是否可以對新的信源做出評估。通過這一系統,AI在預測新聞真實性方面具有大約65%的準確率,在檢測偏見程度時大約有70%的準確性。
不過,麻省理工大學并不是唯一使用人工智能來做假新聞分析的。
谷歌的Jigsaw人工智能系統會自動對讀者的評論做出評價。Facebook則長期堅持利用人工智能技術來進行新聞篩查,近期還收購了總部位于倫敦的創業公司Bloomsbury AI,以幫助其識別假新聞。
不過一些專家對此也表示出了懷疑態度。
卡內基梅隆大學機器人研究所(Carnegie Mellon University Robotics Institute)科學家Dean Pomerleau在接受外媒the Verge的采訪時表示,人工智能對于文本中一些比較隱晦的虛假信息以及偏向性內容缺乏足夠的理解能力,但是這也正是辨別假新聞的時候最重要的技能之一。
盡管人們對于人工智能核查新聞真實性的能力表示懷疑,但是事實證明人工核查的效果似乎也并不理想。
今年,谷歌其新聞報道欄下線了“事實核查”(Fact Check)的標簽,因為此前有保守派媒體曾指責谷歌上經過了核查的新聞依舊存在著偏見嫌疑。
更令人灰心的是,根據Gartner預測,如果維持當前現狀,人工智能也好人工核查也好,都沒辦法跟上假新聞的制造速度。到2022年,發達國家的大多數人會看到比真實信息還要多的虛假信息。
文章來源:pop sci 、venture beat