Common Voice 捐出廣東話聲音

滿語,又稱滿洲語,喺清朝擁有官方語言嘅地位。但因為民族間嘅頻繁交流,以及滿漢通婚等因素,識講滿語嘅人愈來愈少,而家以滿語為母語嘅人唔夠二十個,其中三位已經超過八十歲,而清朝滅亡到呢家不過一百年左右。前排被關注嘅Common Voice計劃,義工團隊成員敬文同Sammy,希望大家都願意捐出廣東話聲音,打造全民參與嘅語言活動:「其實一個語言要消失,真係冇大家想像中需時咁長。」

S=Sammy、敬=敬文

點樣知道Common Voice呢個項目?

S:無論係iOS定Android,近年愈來愈多手機可以做到語音輸入,背後其實需要好龐大嘅數據庫,但因為並冇對外開放,如果公眾人士想使用,只可以用好多錢搵大公司買。而Firefox瀏覽器嘅母公司叫Mozilla,佢哋嘅理念係保持網路開放並成為全球公用資源,於是近年就推出Common Voice。我自己本身有幫Mozilla喺香港做社區性項目,又識咗敬文好耐,知道佢有興趣,又有相熟嘅長者就一齊幫手。


敬:我從事咗好多年長者科技嘅工作,同open source嘅淵源好長。廣東話寫法好有特色,例如告訴個「告」字,其實上面係個「牛」字,但部分字型就冇穿腳。小學老師話錯,阿媽話啱,點解香港政府有規範,但又冇一套字畀你跟?所以我哋將政府4,762隻中文字變成字型,叫「自由香港楷書」。我哋想有個更新版本提升到七千字以上,包括政府中文字版本冇屋邨個「邨」,冇深水埗個「埗」。今次Common Voice都搵長者幫手,但好大鑊。因為首先要收集廣東話句子,再搵人錄音同核對,但我何來有呢堆字呢?市面太少廣東話素材,於是我叫老人家幫手,喺社區拎住部平板電腦慢慢收集,叫佢哋搭車聽人哋講乜。


收集數據有咩有趣事同難處?

S:今次要收集唔同年紀嘅聲音,純粹男女完全唔足夠,因為細路同老人家嘅聲線都唔同。另外要睇埋居住地區,例如香港島半山區有條街叫堅道,我細個都住嗰一帶,我哋會將「道」讀「島」,其他人就會讀「道」。 


敬:我哋有擔心收集返嚟嘅數據質素,驚有雜聲影響,其實我哋唔急要幾時完成,打算持續進行。日本團隊得幾個人幫手錄,但我哋唔想咁,呢個唔係單純科技項目,而係一種在地文化。部分人講嘢有懶音,但只要數據夠闊,呢啲問題就會解決到,我當係一個全民活動,大家一齊去參與就最理想,每個人肯錄幾十句都好重要。


你哋認為用「保育」嚟形容廣東話現今狀態適合嗎?

S:我覺得廣東話需要保育,用廣東話密度最高嘅地方就係香港,你點樣令將來嘅人繼續用呢?講廣東話嘅人代表咗某種意識形態,如果佢哋有日要講普通話,咁又會點改變呢?廣東話發展係悲觀,但如果唔畀自己一絲希望,又何來有希望? 

敬:你有冇食過涼粉,你知唔知涼粉嘅真身係咩樣?其實對農夫嚟講都不值一提,佢係路邊野草,叫涼粉草,係香港原生植物,但而家好難搵到。好多香港人都知涼粉係乜,但冇人去諗佢原本係咩樣。本身同我哋喺同一塊土地上,但而家好似冇咗關係,點解冇咗關係,就係因為冇咗經濟價值。一種文化都要睇有冇經濟價值,我哋同大陸做生意要講普通話,咁點解唔係佢哋講廣東話呢?其實同日本都一樣,日本人都唔太識講英文,可能蝕底啲,但佢哋唔會覺得低等,仍然為日文而驕傲,但香港人唔係,所以係心態問題。


點解想做好呢份義工?

S:而家個科技唔止認到語言,連圖像都認到,如果冇一個廣東話系統,就會同世界有距離。例如你睇YouTube開字幕,英文片可以自動出字幕畀你,但廣東話仍然未做到。

敬:當時對我嚟講呢個項目有個時限,就係2047年之前,但原來唔係,原來早咗27年,都冇人想像到。呢個係好重要去保留港式廣東話嘅社會運動,佢唔屬於任何人,大家可以隨便去用,唔使介意要畀幾多錢,本身個努力就係出自於香港市民,我諗呢個價值係最重要。如果而家唔做,咁幾時做?■