感觉目前网上对 OpenCC 介绍的不多,我推荐它的理由是:
- 功能完善(严格区分「一简对多繁」和「一简对多异」,支持中国大陆、台湾、香港异体字和地区习惯用词转换,词库和函数库完全分离,可以自由修改、导入、扩展等)。
- 本地部署,无须网络。
- 纯命令行工具,简洁优雅,方便嵌入程序脚本。
当然最后一点可能要视使用情景而定,如果是要转换一段文字,那肯定没有在线工具方便。但如果是在整理视频文件时,需要处理某些字幕文件,那就很趁手了(反正本来就可能要用到 FFmpeg 之类的命令行工具……)。
项目地址:GitHub - BYVoid/OpenCC: Conversion between Traditional and Simplified Chinese。
此项目提供 Windows、Linux 和 macOS 下的命令行程序,也提供 Python 包、npm 包和 C / C++ 头文件。
下载地址:Download · BYVoid/OpenCC Wiki · GitHub。
下载地址(自己整理打包的 1.1.6 版,适用于 Windows,内附简单说明):
下面简单介绍一下 Windows 下的用法:
opencc.exe -i "[输入文件路径]" -o "[输出文件路径]" -c "[配置文件路径]"
例如,把某繁体 *.srt 文件转换成大陆简体:
opencc.exe -i "C:\Users\User\Desktop\01.zh-Hant.srt" -o "C:\Users\User\Desktop\01.zh-Hans.srt" -c "C:\Users\User\AppData\Local\Programs\OpenCC\share\opencc\tw2sp.json"
配置文件决定了转换规则,程序自带以下配置文件,位于解压出的 OpenCC/share/opencc
这个文件夹下:
s2t.json 简体到繁体
t2s.json 繁体到简体
s2tw.json 简体到台湾正体
tw2s.json 台湾正体到简体
s2hk.json 简体到香港繁体
hk2s.json 香港繁体到简体
s2twp.json 简体到繁体(台湾正体标准)并转换为台湾常用词汇
tw2sp.json 繁体(台湾正体标准)到简体并转换为中国大陆常用词汇
t2tw.json 繁体(OpenCC 标准)到台湾正体
hk2t.json 香港繁体到繁体(OpenCC 标准)
t2hk.json 繁体(OpenCC 标准)到香港繁体
t2jp.json 繁体(OpenCC 标准,旧字体)到日文新字体
jp2t.json 日文新字体到繁体(OpenCC 标准,旧字体)
tw2t.json 台湾正体到繁体(OpenCC 标准)