Skip to content

neoTeochew/neoTeochew.github.io

Repository files navigation

潮语埠

埠,籠貨物積販商泊之所。建此站,籠歷史舊有話術,積時代新生表達,意在傳承與發展我儂之母語——潮語 Tiê-gúr。本站規畫以“辭典”爲中心向外層層發展,多語言版本供海内外有心潮人學習。本站暫時僅一人從零起步邊學邊做,進度較緩慢,在此做些標記,防止遺忘。

一、多語言版本

語言版本的選擇與潮人的分佈位置一致。潮汕本土地少人多,爲了生存必然是有一部分人口須外溢。海外主要遷往東南亞,以泰國爲首,其次還有新加坡、馬來西亞、印度尼西亞、越南、柬埔寨、老撾等地。上個世紀東南亞發生戰亂,大批華人淪爲難民逃亡到世界各地,於是今天法國、美國等地也有潮人聚居。國内則一部分參與到開墾臺灣的隊伍中,然而後世被客家人同化;另一部人向往大城市,去遷往滬、港、鮀,然而改革開放之後特區發展不順,鮀城及周邊人口亦再次外流至京、穗、鵬等地。

所以本站所預備的語言版本暫時是10種,潮汕話、普通話、英文、法文、泰文、馬來文、印尼文、越南文、高棉文、老撾文。國内潮人若不懂潮汕話則使用普通話即可,如果外文版全更新完,可能適時考慮爲滬、港、臺更新吳語、粵語、客語版本。

二、辭典

目標是收録古今中外潮人所使用的詞、詞組、管用語句及俗語。

1.數據格式

羅馬字、發音、漢字、詞性、圖片、多語言定義、多語言詞組、多語言例句、多語言備注。

2.羅馬字規範 與 連讀變調一般規則

以下是一些經驗積纍,還未整理所以表述上未必簡潔。

(0)統一折中拼寫,書寫上不區分發音。實際發音時按自己的口音做映射。也不排斥按實際口音來書寫,只是不方便記録所以不採用。

(1)讀輕聲的詞,用雙連字符打頭。如果前面有音節的話,連字符與上一個音節相連。例如,前日 tsôy--zid,肉痛 neg--thyà,好了 hó--liáu,挈出去 qiex--chut-qùr。

(2)單個詞内部各音節,如果非輕聲則音節間以連字符連接;如果讀輕聲則使用輕聲標記,如(1)所示。例,潮汕人 tiê-swa-nâng,牛肉丸 gû-neg-yî。

(3)每個分句的最後一個音節要麽讀本調,要麽讀輕聲。讀輕聲的話則往前推,距離最近的一個非輕聲音節讀本調。例如,

  • 愛去讀 ày qùr thag-cheh. //句子最後一個音節cheh讀本調

  • 枝鎖匙交去。Ki só-sî ka-laux--qùr. //句子最後一個音節是輕聲,往前推倒數第二個音節laux讀本調。

  • 着我哇。Muex--tiex--uá--ua. //句子最後三個音節都是輕聲,所以倒數第四個音節muex讀本調。

(4)一般句子中名詞的最後一個音節讀本調。其餘的非輕聲音節全部讀前變調。例如,

  • /在學/睇着阮同/挈本英語/咯補作。Kim-zid tǒ hag-hǎu thóy tiex uán tâng-hag qiex pńg eng-gúr-tsur lo póu tsak-ngiab.

(5)不滿足規則的特殊變調,在總結出新的規則之前,特殊前變調在音節的羅馬字末尾加l,特殊本調在音節的羅馬字末尾加c。例如,

  • 人咯嫑 nângl lo mài //理論上“人”nâng是名詞應該讀本調的。

  • 拜拜 pâic-pai //這是一個詞的兩個音節,但是兩個音節都讀本調。

❓我在想這種詞内部音節不變調的情況,究竟要不要加連字符呢?不加的話或許對於詞的邊界就不容易判斷了;加的話判斷變調又不方便;好像不加的話判斷變調也没變方便,因爲“拜”不是名詞。

(6)人稱代詞,分三種情況。

作爲施動者,視爲名詞,讀本調;作爲受動者,視爲補足語,讀輕聲;作爲屬格,視爲修飾語,讀前變調。例如,

  • 愛趁 ày thàn tsyî.

  • 伊。Mài muex--i.

  • 。Uán kim-zidlâi.

特殊地,“别人”縮讀的“人”nângl,哪怕做主語也是讀前變調。爲什麽認爲是前變調,而不是認爲它已經和nâng是兩個發音了呢?因爲其屬格發音,與“人”nâng的前變調發音相同。例句如(5)所示。

(7)「着」TIEX的兩種用法

一種是補足語,讀輕聲;一種是指代某種感受,視爲名詞,讀本調。

  • 手靠着。Tsiah chiú --tiex.

  • 着愉嘿?Sńg tiex --her?

(8)在强調時,被强調的音節强行讀本調,後面的音節直到名詞或句子末音節都讀輕聲。

被强調的音節可以用全大寫表示,輕聲就不必再標記了;不全大寫則輕聲要顯式標注了。

  • 此个啦。Tsí kâi muex ǒi ngiá--la.

  • !个物也會哩。TSÍ kâi muex iā ǒi ngiá--li.或者Tsí--kâi--muex iā ǒi ngiá--li.

  • 着有滴囝道理。Thya tiex ǔ--tih-kyá--tǎu-lí. //輕聲是按詞標記的,雖然有四個音節讀輕聲,但總共其實是兩個詞,詞内部依舊是單連字符。

(9)量詞具有冠詞的作用,又同時反映名詞的形狀性質等特點,於是會出現將名詞縮讀爲量詞。雖然具備名詞性,但是依然保持前變調。

  • 哩。Bué hûr ǒi uax--li.

  • 尾偌㩼錢?Buél ziex-tsōi tsyî?

(10)筆者偏好,漢字引號用直角引號「」,羅馬字引號用法文引號«»。不强制大家按此標準。

3.❓詞與詞組的界限在哪

目前是認爲,多個字拆開與合并意思不變的,認爲是詞組,如果意思改變了認爲是詞。

只是有些詞雖然拆開與合并意思不變,但平時常用的搭配基本就一個,幾乎是有點詞的感覺了。最初本站是不考慮收録詞組的,正是因爲這些理不清道不明的詞組存在,所以本站大改了數據格式,把詞組也收録進來。

詞内部個音節間用連字符連接;詞組内部不同詞之間空格隔開。

4.關於詞性

漢語屬於分析語,與西方主流屈折語不同,漢語更講究的是語義上的合理而非結構上的合理,所以如果直接套用西方的“結構合理式”語法,會出現大批量詞具備多種詞性,這很不簡潔。

所以本站做了個嘗試,不適用西方的結構語法分詞性,而是按語義來分。例如,西方語言主流中同一個詞根,名詞和動詞用法是有變化形式的,但漢語裏并不會變化。本站使用“行爲”來指這類類似動詞的詞,一個“行爲”本身就能指行爲對應的動作,即動詞用法;也能指行爲本身,即名詞用法。

三、輸入灋

詞庫來自本站辭典,分漢字、羅馬字、漢字詞、羅馬字詞四個庫。目前邏輯基本没問題,剩數據量需要手動補全。

四、後續工作

  • 【网站】主站新增多語言版本,但很多頁面還未同步。

  • 【网站】做好多語言版本的翻譯。

  • 【网站】繁簡體的轉化邏輯還不完善。

  • 【网站】多語言的頁面跳轉邏輯也有問題。

  • 【辭典】羅馬字一直在改,裏很多還没來得及改。

  • 【辭典】參考已有文獻録入更多表達。

  • 【辭典】校對並修正數據錯誤、標準不統一等問題。

  • 【辭典】補充必要圖片,做好壓縮,盡量節省空間。

  • 【辭典】爲已有條目補充例句、定義、分類。

  • 【字典】補全常用字等信息。

  • 【輸入灋】在辭典和字典數據完善之後,做同步補充。

  • 【自學】基於辭典數據做個背單詞网頁。

  • 【自學】做個完善的書面教材自學网頁。

  • 【智識】發展科學用語。

  • 【新聞】發展正式書面表述。

  • 【故事】從翻譯公共版權經典作品和記録已有作品開始,到創作新作品。

  • 【音樂】從匯總到創作。

  • 【參考資料】公共版權的文獻共享及電子化處理。

  • 【未來】學點後端,整點錢搞服務器。到時再看怎麽改進。

五、其他問題積纍

1.如何給語言中的生物下定義?

一些生物,人們給它們命名很具體,精確到單一種的話,直接用學名做定義。另一些生物,人們給它們命名很籠統,往往没有精確的邊界,這種該如何下定義呢❓

暫時的處理是把典型的窮舉,模糊的就認爲不是。如果整個屬都是該詞所指的生物,祇寫屬名;如果屬裏僅部分種是該詞所指的生物,寫1個屬名+括號内列舉種名;如果只有一個種是該詞所指生物,則直接用學名,即屬名+種名。

About

Aiming at recording and developing Teochew language.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors