我們翻譯全球之聲的訊息,讓全世界可以聽見我們的聲音。

閱讀更多 語言翻譯  »

推特語言解密:推友怎麼看俄、烏總統?

Images mixed by Tetyana Lokot.

圖片由 Tetyana Lokot 製作

本篇文章是一份公民媒體資料分析計畫的其中部分。該計畫是由回聲計畫(RuNet Echo)和馬里蘭科技暨人文學院共同合作。請上總統們的所有貼文一文頁面,探索完整的文章系列。

去年10月我們開始蒐集推特上的資料,當時我們最感興趣的內容便是俄烏兩國民眾對於他們總統的談論內容。但我們決定把網撒得更廣一些,蒐集所有包含兩國總統姓氏俄文(Путин 和 Порошенко)、烏克蘭文(Путін 和 Порошенко)及英文(Putin 和 Poroshenko)等不同語言寫法的推文。最終我們蒐集到超過6百萬筆的推文,確切來說是 6,342,294 筆推文。

我們取得所需資料後便面臨一個問題:該如何判斷發那些關於普丁和波洛申科的推文的推友是俄國人或烏克蘭人,而不是英國人或韓國人?其實,推文內容和推友的帳號包含了許多特性,而這些可以幫我們找出推友所在的國家和使用的語言。首先,在個人檔案裡有推友所選的位置;接著,在帳戶和介面也有推友自己設定的語言;第三,每一筆推文也有語言指示工具,由使用者鍵盤設定和推文內容所決定;最後,一些推友在使用他們智慧型手機時,地理標記也會開啟,這樣一來每筆推文都會具有一組可以配在地圖上的經緯值。

當然這些選項並不會百分百準確地告訴你推友的國籍,但是這些也可以告訴我們一些有用的資訊。在本章節裡,我們會帶各位看看,在資料裡的推文的語言使用。而推文的地理標記和其他針對國籍推文的更多討論,則留待下一次談。

以下是我們對這多達六百萬筆的推文資料所做出的分析結果。

各語言的推文數量。推文發表日從2014年10月12日至11月30日,共6,342,294 則推文樣本。所有的推文包含以下至少一項關鍵字詞:poroshenko, putin, порошенко, путин, путін。

各語言的推文數量。
推文發表日從2014年10月12日至11月30日,共6,342,294 則推文樣本。所有的推文包含以下至少一項關鍵字詞:poroshenko, putin, порошенко, путин, путін。

很明顯地,在推文中所使用的語言,以俄語佔大多數,占了資料庫中至少一半的推文。但是這些以俄語發文的推友不只包括俄國人,也包含烏克蘭人、哈薩克人、摩爾多瓦人和其他前蘇聯加盟共和國的公民。且說俄語的移民遍及各地,從義大利到澳大利亞,他們的推文在我們的資料庫中也佔了極大部分。

雖然俄語佔最多,但是烏克蘭人卻是時斷時續地以俄語和烏語貼文。所以其實以烏語和俄語寫成的貼文總數和俄烏兩國推特使用者總數,兩者並無關連(在2014年俄羅斯的推特使用者超過800萬而在6月烏克蘭統計約有60萬位推特使用者)。

此外我們還知道,俄國人和烏克蘭人通常也會以非母語來貼文,例如英語和法語,在烏克蘭政治劇變的那段期間這現象尤其明顯。這現象和Poell、Darmoni在2012年突尼西亞革命研究一文中提到的推文變化情形相吻合,人們以英語來推文,藉以吸引西方主流媒體和英語使用者的興趣。

另一個讓我們這次語言分析更顯複雜的因素,就在於主題標籤(Hashtag)的使用:推友同時使用拉丁字母、非拉丁字母(譯註: 此指西里爾字母)。在卡特理娜.庫森諾克(Katerena Kukusenok)針對在烏克蘭親歐盟示威期間發佈的數百萬筆推文所做的分析中,她發現了「有為數甚多的推文每一筆都同樣同時使用了許多語言」,例如:#Євромайдан、 #Евромайдан、#Euromaidan(註: 三者依序為烏克蘭語、俄語、英語的寫法,前二者屬於西里爾文字系統),這麼做無非是為了增加自己推文曝光的機會。

雖然要解釋俄文和烏克蘭文為什麼會佔據我們語言分析金字塔之頂十分容易,然而要解釋一些其他同樣佔據頂端的語言,卻沒這麼簡單,尤其如果把我們樣本分析的結果,拿來和統計更廣的「推特最常使用語言」互做比較的話。

每日平均推文語言百分比。 數據來源:Semiocast (以國家列出語言及推文,10%樣本,2013年9月) 、推特。 * 每一個"other"的語言佔少於1%

每日平均推文語言百分比。
數據來源:Semiocast (以國家列出語言及推文,10%樣本,2013年9月) 、推特。
* 每一個”other”的語言佔少於1%

英語的人氣當然是最明顯的,因為英語使用者不只來自像是美國、英國等英語系國家,也來自全世界。此外,一般來說西班牙語在推特上也很普遍,我們採計的樣本中也反映出這點。

整體來說,法語則較不普遍,德語甚至更少,不過這兩種語言的貼文在我們的樣本資料中是相當重要的存在。這可能是因為,對於烏俄兩國之間針對烏東衝突的斡旋,法德兩國也牽涉其中,所以這兩國的媒體和社群網路用戶也更加關注波洛申科和普丁的大小事。

使用土耳其語和義大利語的推友似乎也是如此。所有提到烏俄兩國總統的土耳其語貼文數量,和德語貼文數量是不相上下的,義大利語貼文總數也差不了多少。這些足可指出,這些國家對於鄰國命運的關注是有所提高的。

在我們的樣本中,日語寫成的推文數量相對稀少,這樣的數量值得注意。在所有的推文裡,以日語寫成的貼文總共佔了16%。阿拉伯語、馬來語及葡萄牙語寫成的關於俄烏兩國總統的貼文,所佔比例也少到可被忽略,使用印尼語的推友似乎反而比他們更好奇俄烏間的情勢。

雖然總體來說,全世界都好奇烏俄兩國元首到底在做什麼,不過來自網友的關注和輿論,數量上卻是壓倒性地集中在俄語和烏語推特圈裡。我們期望在深掘其中的同時,也能在回聲計畫頁面(RuNet)上帶給你有關政治討論的新見解,讓你能更仔細去理解,弗拉基米爾.普丁與彼得羅.波洛申科兩人對烏俄兩國的推友們來說意味著什麼。

譯者:Chien-An Wang
校對:Timmy Shen

展開對話

作者請 登入 »

須知

  • 留言請互相尊重. 內含仇恨、猥褻與人身攻擊之言論恕無法留言於此.