C#下虽然可以采用Microsoft.VisualBasic.Strings.StrConv()函数进行繁简转化(参考此文),但是存在转化不完全的问题。主要是部分异体字无法转化。
因此,我们根据异体字整理表和繁简字对照表来构建辅助字典,用于将未能成功转化的异体字或繁体字转化为简体字。
格式化的文档v2t.txt和s2t.txt放在了Github中。
1. RemoveVariant()查表去掉异体字
/// <summary>
/// 查表去掉异体字
/// </summary>
/// <param name="source"></param>
/// <returns></returns>
private stat

C#中使用Microsoft.VisualBasic.Strings.StrConv()函数进行繁简体转化存在不足,主要问题是部分异体字和繁体字无法完全转化。通过整理异体字和繁简对照表,构建辅助字典,实现完整的转化功能。详细步骤包括RemoveVariant()去除异体字,RemoveTraditional()处理遗漏的繁体字,以及ToSimplified()作为主要转化函数。项目源码已上传至Github,并打包为dll方便调用。
最低0.47元/天 解锁文章
534

被折叠的 条评论
为什么被折叠?



