Poly,教會你世界所有語言

Poly logo

Image courtesy Wikitongues.

原文刊登於r12n

Wikitongues創辦人暨總監丹尼爾‧波格雷‧烏德爾(Daniel Bogre Udell)與弗雷德里戈‧安德拉德(Frederico Andrade)懷抱著極具野心的抱負–幫世界上所有語言建檔,甚至是教學。「所有語言」真的是指所有語言:包含 3千種以上無法被書寫的語言、3百種手語、甚至是人造語言─世界語邏輯語

最近和他們談到他們的語言檔案編制(language documentation)和學習平台Poly。一般人對於如此雄大的目標感到懷疑是自然的,但這幾年來的成果仍值得我們一探究竟,或許這個計畫能樂觀以待。

Wikitongues

源自於丹尼爾與弗雷德里戈對語言及科技的共同愛好,總部設在布魯克林的非營利組織Wikitongues應運而生。同時也是全球之聲協作者的丹尼爾,在僅使用英語的家庭中成長,但他對語言的愛好,來自於生長在一個少數族群語言的社區。他在西班牙時,先是待過亞拉岡,接著是加泰隆尼亞。學習加泰隆尼亞文的經歷劇烈改變他對世界、對語言的看法:「我開始用異於大多數外國人的方式去理解西班牙,也開始用異於大多數歐洲人的方式和歐洲產生連結。」弗雷德里戈則是生在使用英語與葡萄牙語的雙語家庭,也在成長過程中習得其他語言。創辦者們珍視語言多樣性的價值,卻也對其在公共環境裡的不被重視感到沮喪。

丹尼爾指出:「孩子們被教導[這世界上]有多少個國家、這些國家裡有多少地區,卻未曾有人教過我們世上有7千多種語言。直至今日,我們在媒體上看到對於語言的歧視仍屢見不鮮。」由於對語言的共同熱情,加上科技和設計背景,提供了Wikitongues的理論與實踐基礎。

Every language in the world

Wikitongues影片講者。 Image courtesy Wikitounges.

2012 年秋,丹尼爾開始拍起他在布魯克林的鄰居,用母語述說簡短的歷史。紐約或許是世界上語言多樣性最豐富的城市,有超過7百種語言在這裡被使用。很快地,丹尼爾拍攝的影片累積到一定數量,於是他開始上傳至YouTube頻道。「幾個星期內,我們就記錄到了將近40種語言。」令他驚喜的是,他發現他創立的頻道迅速吸引了全球觀眾的注意。

隔年春天,丹尼爾的朋友、同時為帕森設計學院(Parsons School of Design)校友的弗雷德里戈加入,他們持續在紐約各地拍攝影片,也在全美各地旅行蒐集不同社區的記錄。得到許多人氣與關注之後,他們開始號召來自世界各地的協作。最終,Wikitongues成為非營利組織,致力於藉由拍攝短片記錄語言,將主要重心放在瀕危的語種。原文書寫的當下,Wikitongues的YouTube頻道已有347支短片來自世界上有人居住的各個角落。

比方說,最近的一支影片,紀錄米蘭德斯語(Mirandese)的使用者。米蘭德斯語為葡萄牙共同官方語言,同時也是少數族群語言,使用者不到一千人。

檔案編制是振興語言課程中重大的一步,但從採集語言到擁有新使用者的路途,並非一路順遂。2014年夏末,Wikitongues創辦者們發現一篇關於瑪麗‧威爾柯斯(Marie Wilcox)的文章。瑪麗‧威爾柯斯生於 1933 年,是最後一位烏加奈語(Wukchumni)使用者,烏加奈語是現今無數瀕危的印地安語言之一。耗費超過十年,瑪麗和她的女兒珍妮佛‧莫隆(Jennifer Malone)與其他夥伴,從筆記本和信封背面上的隨筆開始,一同記錄她的語言。丹尼爾和弗雷德里戈深深為她的貢獻所感動。

隨著遇見越來越多像瑪麗一樣的朋友,他們理解到:身為瀕危語種使用者的人們,或許很樂意參加類似的編纂字典計畫。「這是個超級費力的過程,年復一年。」弗雷德里戈表示,這對多數人來說都太難達成。

對Wikitongues而言,從一開始的採集要往語言振興的方向前進,需要更多「瑪麗」幫忙,如此一來,他們在自己的影片裡就可以跟學習者有更多連結。為了達成記錄與振興這個目標,弗雷德里戈表示:「我們集思廣益,試圖找出有哪些實用的小方法與學習者互動,以取得一些確實的進展。」他們期待能找到對使用者友善又不困難的途徑,讓希望記錄自身語言的用戶方便使用,同時將語言傳承下去。為了這個願景,Poly於2014年末,誕生了。

Poly

藉著去年成功的群眾募資計畫Poly迅速成長,近期更兌現承諾,在國際母語日推出實用的app版本。Poly的概念像是一本「書」,涵括了單字、片語與短句。如果你心血來潮想要創建拉科塔語(Lakota)跟法語對照、或是多斯拉其語(Dothraki)與克林貢語(Klingon)對照的片語集,只要幾個按鍵,Poly就會提供最適切的空間。下面的範例中,將可以看到弗雷德里戈建立了一個英語─葡萄牙語(巴西)的片語集。

Poly的介面簡單、靈敏,操作方便。創辦人們希望,Poly開放給任何類型的教學者與學習者,期待它能成為一項實用的工具協助更多像瑪麗一樣的人,更直接地記錄語言,以便他人學習。

開放原始碼、開放數據、開放的組織

弗雷德里戈開玩笑地說,Poly成立之初是一項開源專案(open source project),「只是因為[Github上的]私人專案需要付費。(Github是全球最大的開源平台)」。以開源技術為基礎的 Poly,前端運用的是React,後端則是Rails與PostgreSQL。弗雷德里戈認為,儘管開源在創立初期有一定的象徵性,Poly早已在這個成長中的開發者社群裡吸引「價值數十萬美元的開發時間」。他解釋道:「因為我們非營利,而且任務導向極為強烈,我們已經得到大批開發者的支持。」他形容,帶領共同開發團隊的過程「就像魔法一般」。

Wikitongues同樣開發一種開放的方法以整理他們的數據。在Wikitongues共同總監─同時也是「開源、開放標準、數據、在地化內容」倡議(“open source, open standards, open data and localized content”)的倡導者─阿洛莉塔‧莎瑪(Alolita Sharma)領導之下,組織致力於開放所有授權內容,如創用CC計畫,包含影片內容、影片數據以及Poly的語言資料。

同時,他們也必須面對處理大量來自各社群數據的挑戰─有些瀕危語種社群擔心受到剝削,有些則對文化與智慧財產權的認知不盡相同。「對某些大型開源或是開放知識的專案而言,授權與否就有某種獨斷的成分。」丹尼爾說道。然而,Wikitongues的目標是「開放」,現有數據的授權在某些情況下就成為必須。組織現在正在倫理、合法性與文化的領域中努力。「倘若能證明某些社群在我們[開放數據]的模型下取得成功,我們就能觸及更多不相信的人並告訴他們:『你看,這是有好處的』。」弗雷德里戈解釋。

開源的精神不只是[開放]程式碼與數據。丹妮爾指出Wikitongues期望能達到的規模─與世界上所有語言社群合作─需要一定的開放性。弗雷德里戈表示,「組織最深層的理念之一,便是和這些社群合作。我們拍攝影片,可不是要將這些影像『錄回來』而已」。數以百計的影片裡,Wikitongues希望傳達的是,有一個真實的人物願意用他們的語言,跟聽眾訴說他們的經歷。

Poly poster

Image courtesy Wikitongues.

世界上所有語言

像Wikitongues這樣子的計畫,對振興語言相當重要。如先前提過的,對一個語言來說,語言數位資源的發展可以確保下一代對這些語言的近用,而大部分在商業科技主流趨勢之外(或最好是伴隨著這個趨勢)的任務,無疑是最大的挑戰。與科技大廠會談時,丹尼爾體會到他們對於較少人使用的語言的熱情有限:「他們想確定他們會觸及4百種、甚或更多種語言。我們也跟Google的同仁討論過,他們明確地表示,對於少於1萬名使用者的語言,不感興趣。」帶著Poly,Wikitongues在發展全球語言開源社群裡持續著它的旅行。

「因為採集語言的諸多努力,我們是唯一試圖與全世界語言合作的組織。」丹尼爾表示,「沒有其他人有這樣的興趣。」這導向與使命直接說明了 Poly 的發展。「相較於對語言學家,我們更期望語言對於語言使用者來說是有用的,因為他們是真正有需要的人。」

譯註:相關內容亦可參考全球之聲報導《全球2500種語言消失中》。

校對:Conny Chang

展開對話

作者請 登入 »

須知

  • 留言請互相尊重. 內含仇恨、猥褻與人身攻擊之言論恕無法留言於此.