LanguageTool
LanguageTool是一套自由及開放原始碼的語法、風格佮拼寫檢查軟體,其所有功能攏會當供下載。 LanguageTool 採取核心開源模式,其網站佮其實彼个姊妹仔有計畫LanguageTool Plus相牽連,啊若這个專有的姊妹仔計畫佇英語佮德語的錯誤偵測方面有所改進,抑若佇長篇文本的修改閣較容易。
LanguageTool 由 Daniel Naber 佇二空空三年創建,原來用佇伊的學位論文,以 Python 語言編寫。 截至二空二二年八月十六 ( 二千空二十二孵八鋪十六 ),LanguageTool 支援三十一種語言,攏是由志願工作者維護,通常攏是彼號語言的母語使用者。程式的偵錯模式採用模式匹配,利用自建的錯誤匹配規則來試例文。 對無支援的語言,網站亦提供有一个簡單的(這聲稱三分鐘的)簡介,以協助使用者去開發其語言的工具。
核心應用程序本身是免費佮開源,會當下載以供離線使用。有的語言的規則以「N 元語法」數據來建立,遮的數據足大的,需要顯明的計算能力佮輸入速度以平均到額外的偵錯能力。所以,LanguageTool 就是佇咧侍服器頂懸處理「N 元語法」數據的 Web 服務提供者。LanguageTool Plus 猶閣使用「N 元語法」作為其免費增值業務模型的一部份。
LanguageTool 的 web 服務會當通過使用網頁瀏覽器愛存取網路應用程式的接口,閣通過專用的客戶捀插件佇下列各軟體中調用:Microsoft Office、LibreOffice、Apache OpenOffice、Vim、Emacs、Firefox 瀏覽器、Mozilla Thunderbird 佮 Google Chrome。其網頁客戶端亦可集成到網站頂懸。免費翻譯系統 OmegaT 中內置一个是對 LanguageTool 的語法、鬥寫和儀式檢查插件。
技術
LanguageTool 的技術無檢查句佇文法頂懸敢有正確,只是檢查敢有包含定定看著的錯誤。所以,事實上咱會當編造出一句文法上錯誤,但是閣予人 LanguageTool 接納的句。句式偵錯是透過比對一系列以 XML 編寫的規則,並配合以 Java 編寫的應用程式來執行。這是因為的 XML 的規則會當透過一个網仔頂懸表格來填寫。較近期的發展依賴於大型的 n-gram 庫,佇咧人工神經網路的幫助之下為著改善拼寫錯誤提供建議。
離線使用
做獨立版的 LanguageTool 咧已經安裝矣 Java、用作侍服器的電腦解壓縮,會當透過下列命令列來運行檢查程式的侍服軟體:
- ` java-cp languagetool-server . jar org . languagetool . server . HTTPServer--port 八千空八十一--allow-origin " * " `
成功執行了後,會當佇瀏覽器展現執行列命令來測試:
- http : / / localhost : 八千空八十一 / v 二 / check ? language=en-US & text=my + text
- _ { " software " : { " name " : " LanguageTool " , " version " : " 四配六 " , " buildDate " : " 二千空一十九石六鋪二十六七 : 二十八 " , " apiVersion " : 一 , " premium " : false , " premiumHint " : " You might be missing errors only the Premium version can find . Contact us at support < at > languagetoolplus . com . " , " status " : " " } , " warnings " : { " incompleteResults " : false } , " language " : { " name " : " English ( US ) " , " code " : " en-US " , " detectedLanguage " : { " name " : " English ( US ) " , " code " : " en-US " , " confidence " : 空九六五六一八五六 } } , " matches " : [{ " message " : " This sentence does not start with an uppercase letter " , " shortMessage " : " " , " replacements " : [ { " value " : " My " }] , " offset " : 零 , " length " : 二 , " context " : { " text " : " my text " , " offset " : 零 , " length " : 二 } , " sentence " : " my text " , " type " : { " typeName " : " Other " } , " rule " : { " id " : " UPPERCASE \ _ SENTENCE \ _ START " , " description " : " Checks that a sentence starts with an uppercase letter " , " issueType " : " typographical " , " category " : { " id " : " CASING " , " name " : " Capitalization " } } , " ignoreForIncompleteSentence " : true , " contextForSureMatch " : 影一 } ] } _
- http : / / localhost : 八千空八十一 / v 二 / check ? language=zh & text=我的文字
- _ { " software " : { " name " : " LanguageTool " , " version " : " 四配六 " , " buildDate " : " 二千空一十九石六鋪二十六七 : 二十八 " , " apiVersion " : 一 , " premium " : false , " premiumHint " : " You might be missing errors only the Premium version can find . Contact us at support < at > languagetoolplus . com . " , " status " : " " } , " warnings " : { " incompleteResults " : false } , " language " : { " name " : " Chinese " , " code " : " zh-CN " , " detectedLanguage " : { " name " : " Chinese " , " code " : " zh-CN " , " confidence " : 空八五一九六七七空四 } } , " matches " : [ ] } _
利用程式執行了後擲出來的 JSON 資料,使用者會當設計出自訂的文法檢查插件。
參看
- 自然語言處理
- Grammarly
- OpenTaal
- 自動校正
參考資料
外部連結
- 官方網站