跳至內容

LinguaLibre

出自Taiwan Tongues 台語維基
於 2025年8月22日 (五) 22:32 由 TaiwanTonguesApiRobot留言 | 貢獻 所做的修訂 (從 JSON 檔案批量匯入)

(差異) ←上個修訂 | 已批准修訂 (差異) | 最新修訂 (差異) | 下個修訂→ (差異)

Lingua Libre是法國維基媒體協會建立的一个線頂協會佮工具,用建立使用自由授權條款的協作、多語言、視聽語料庫。

是咧講

Lingua Libre 會當錄製任何語言的單字、片語抑是句,包含口語(錄音)抑是手語乎(錄影)。

單字以列表的形式呈現予欲錄製語音的人,該列表可能會是即時製作抑是提前製作,抑是使用閣有的維基媒體分類。錄製語音的人只要讀出螢幕頂懸顯示的單字,做軟體偵測著唸完單字了後的恬恬的時陣,就會跳落來後一字單。這个行為是佇咧其建立者,Nicolas Vion,的協助下對開放原始碼軟體 Shtooka 錄製程式處借用,予每點鐘錄製數百个單字成做可能。然後錄音會自動對網頁客戶捀上傳到維基共享資源媒體庫。

二空二一年春季,Lingua Libre 因為史特拉斯堡發生火災離線,但並無遺失任何錄音。

使用錄音

可在 Lingua Libre 抑是維基共享資源上查閱錄音。其他維基媒體的專案,譬如講用來說明維基詞典內底的條目抑是講去維基百科文章內底的專有名詞。

並且會使佇語言教學環境中重複使用錄音,語言學習者會當免費下載發音並佇流行的詞典軟體 GoldenDict 最使用。所以,此處的錄音會當佇咧 GoldenDict 上作為「發音詞典」使用,煞無需要網際網路連線。

遮的錄音嘛會佇自然語言處理專案內底閣重複使用,比如講用來驅動 Mozilla 的 DeepSpeech 語音辨識 ia̋n-jín。

版本

Lingua Libre 佇二空一五年一月二三號啟動,經歷過三个主要版本:

Lingua Libre v . 一 ( 二千空一十六 )

做為 _ Languages of France _ 專案的一部份,這个案目標是佇維基媒體佮網際網路專案面頂記錄閣推廣法國的區域語言,Lingua Libre 的概念佇二空一五年十一月份開始,部份資金來自 DGLFLF(法國的語言總代表團,英語:General Delegation for the French language and the languages of France)。 該專案的頭一个版本佇二空一六年八月推出。彼當陣干焦適用著錄音,Lingua Libre 佇二空一六年十二月的奧克語工作坊頂面展示,紲落呈現予線頂維基媒體社群,嘛佇二空一七年的國際活動上展示。

Lingua Libre v . 二 ( 兩千空一十八 )

二空一七年底全面重建。新版 Lingua Libre 是以 MediaWiki 為基礎,使用 Wikibase 佮 OAuth 通好較好勢融入維基媒體環境。其介面透過 Translatewiki . net 就共翻譯,就按呢該專案會當予大量社群使用。新版的網站佇二空一八年六月準備好勢,並且二空一八年八月向大眾開放。

Lingua Libre v . 二嬸二 ( 二千空二十 )

二空二空年,平台發生重大變化;有專門網站開發的新外觀,而且 . org 網域嘛取代代先使用的 . fr 網域。Lingua Libre 現此時支援透過視訊錄製手語。

  • * *

統計資料

佇專案啟動的前兩冬,大約製作一萬份的錄音。向 v . 二的過渡嘛同時伴隨著貢獻的快速增加。佇無到一冬的時間內,錄音的數量增加超過十倍,佇二空一九年五月時就超過十萬份,遮的錄音是由一百二十七位貢獻者以近五十種語言錄製的。到甲二空二空年九月,該平台已經有九十種語言的超過三十萬份的錄音,貢獻者超過三百五十人。二空二一年六月達到五十萬份錄音的路站碑這愛歸功佇一百二十種語言的五百四十名貢獻者。

參見

  • Forvo
  • Common Voice
  • GoldenDict

參考資料

外部連結

  • 官方網站
  • " Lingua Libre " , émission spéciale Francophonie . RFI . fr . 二千空一十七抹三鋪二十二 [二千空二十五十二孵二] .(原始內容存檔佇咧二千空二十一鋪十二鋪十六)(法國的).