python 获得汉字笔画

文章介绍了如何通过Unihan文件中的笔画数据,利用Python3中的字典结构,按Unicode编码范围划分,快速查询特定字符的笔画数。作者记录了存在笔画数的Unicode码范围,并提供了一个函数`get_stroke`用于实际操作。
部署运行你感兴趣的模型镜像

通过unihan的文件来实现。
只要是unihan中有kTotalStrokes字段,获取其笔画数。
Hash也是非常简单清楚的,但想到这些unicode其实会有一个分布规律,就记录了一下,
利用此性质通过数组方式来获取笔画。

记录了一下unicode的范围

start: [13311, 19968, 63744, 131072, 173824, 177984, 178208, 194995]
end : [19893, 40917, 64045, 173782, 177972, 178205, 183969, 194998]

总共包括80682个存在笔画数的unicode码,包含CJKV。
64045-131072中间都没有此字段,就分了两部分。

此处使用python3 Demo实现,原理非常简单:使用数组保持笔画,将unicode映射到数组index,即可获取对应笔画数

def get_stroke(c):
    # 如果返回 0, 则也是在unicode中不存在kTotalStrokes字段
    strokes = []
    with open(strokes_path, 'r') as fr:
        for line in fr:
            strokes.append(int(line.strip()))
 
    unicode_ = ord(c)
 
    if 13312 <= unicode_ <= 64045:
        return strokes[unicode_-13312]
    elif 131072 <= unicode_ <= 194998:
        return strokes[unicode_-80338]
    else:
        print("c should be a CJK char, or not have stroke in unihan data.")
        # can also return 0

strokes_path: https://github.com/helmz/Corpus/blob/master/zh_dict/strokes.txt
"按照unicode顺序排列的笔画数"

您可能感兴趣的与本文相关的镜像

Python3.11

Python3.11

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

### 使用 Python 获取汉字笔画顺序 对于获取汉字笔画顺序,在 Python 中可以利用 `pypinyin` 库配合 Unihan 数据库来间接处理,不过直接获得笔顺的信息通常不是这些库的主要功能之一。更具体来说,为了得到准确的笔顺信息,开发者们往往依赖于专门提供此类信息服务的应用接口或是特定的数据集。 #### 利用第三方API服务 一种方法是调用在线 API 来查询汉字的具体书写方式。例如,某些教育类网站提供了公开访问的 RESTful 接口用于返回单个字符的标准笔序图示或动画链接[^2]。 另一种更为精确的方式涉及使用集成有官方发布的《通用规范汉字表》等资源的服务平台所提供的 SDK 或者 Web Service 进行交互以取得所需资料[^3]。 #### 自建本地解决方案 如果倾向于构建离线环境下的解决方案,则可以从 Unicode 组织维护并开放下载的 Unihan Database 寻找帮助。该数据库包含了丰富的有关CJK(Chinese, Japanese and Korean)文字属性描述字段,其中就涵盖了部分关于笔划数目以及粗略排序模式的内容。然而需要注意的是,它并不包含详细的每一笔的位置坐标序列;因此仅适用于简单场景下作为辅助参考之用。 ```python import requests def get_stroke_order(character): api_url = f"https://example.com/api/strokes?char={character}" # 假设这是一个有效的API地址 response = requests.get(api_url) if response.status_code == 200: data = response.json() strokes = data['strokes'] return strokes else: raise Exception(f"Failed to fetch stroke order for {character}") # Example usage of the function with a Chinese character '大' try: print(get_stroke_order('大')) except Exception as e: print(e) ``` 此代码片段展示了通过 HTTP 请求向假设存在的外部 API 查询给定汉字‘大’的笔画顺序,并打印出结果。实际应用时需替换为真实可用的服务端点URL。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值