通过Python根据汉语水平词汇与汉字等级大纲进行数据统计

该博客介绍了如何使用Python对汉语水平词汇与汉字等级大纲进行数据统计,旨在快速评估对外汉语学习者的词汇分布和水平。作者分享了一段简单的代码,用于对比学习者文章中的词素与等级大纲,并统计各等级词汇数量和占比。同时,文中提到在处理汉字编码问题上的挑战,并吐槽了语料库在线网站的编码格式问题。

通过Python根据汉语水平词汇与汉字等级大纲进行数据统计

汉语水平词汇与汉字等级大纲

汉语水平词汇与汉字等级大纲是由国家汉语水平考试委员会办公室考试中心出台的用于衡量汉语为第二语言的学习者对汉语词汇和汉字的掌握水平的标准。在对外汉语的教学中,不论是教学教材的设计或者是课堂授业,都以此为参考依据。各级汉语水平考试以及最终成绩的评测,也以它为标准。
为了能够快速有效的对学习者输出的文章中的用词分布做出统计并挖掘相关数据,现开发如下程序,将学习者输出的文章中的词素与等级大纲进行对比,并统计每个等级的词汇出现的数量和占比。从而能够更加直观快捷的掌握学习者的相关水平并进行量化评价。

说明

母亲大人的学生写了文章,母亲大人要统计数据,大过年的让我母亲一个老教授对着电脑一个一个查真是太让我看不下去了(ಥ_ಥ),于是花了一个小时写了个小程序替她查表,上面说的好厉害的那个大纲其实就是个词表,然后把她学生的文章也整理成单表然后输进一个list里,接着就是for循环的查询了,不需要排序也不需要优化算法,真的是入门等级的程序。真正的难点其实是在汉语字符编码上。。。

代码

如前面所说的,不是什么很厉害的代码,贻笑方家了,有需要的自取。。。

#!/usr/bin/python
#coding = UFT-8

levellist=[]    #用来储存等级列表

#读取汉语水平词汇与汉字等级大纲进行等级划分
levelfile = open( "level.txt", mode='r', encoding='UTF-8')
#存为列表
for line in levelfile.readlines():
    levellist.append(line.rstrip())

#查询词汇等级分布,查一下每一级最后一个词在哪里,其实算一下也行
#print(levellist[5])
#print (levellist.index("座右铭"))
#print (len(levellist))

#文件用完要关上
levelfile.close()

#词汇列表等级分布
print ("词汇列表等级分布")
print ("甲级词:0-1042")
print ("乙级词:1043-3079")
print (
标题SpringBoot智能在线预约挂号系统研究AI更换标题第1章引言介绍智能在线预约挂号系统的研究背景、意义、国内外研究现状及论文创新点。1.1研究背景意义阐述智能在线预约挂号系统对提升医疗服务效率的重要性。1.2国内外研究现状分析国内外智能在线预约挂号系统的研究应用情况。1.3研究方法及创新点概述本文采用的技术路线、研究方法及主要创新点。第2章相关理论总结智能在线预约挂号系统相关理论,包括系统架构、开发技术等。2.1系统架构设计理论介绍系统架构设计的基本原则和常用方法。2.2SpringBoot开发框架理论阐述SpringBoot框架的特点、优势及其在系统开发中的应用。2.3数据库设计管理理论介绍数据库设计原则、数据模型及数据库管理系统。2.4网络安全数据保护理论讨论网络安全威胁、数据保护技术及其在系统中的应用。第3章SpringBoot智能在线预约挂号系统设计详细介绍系统的设计方案,包括功能模块划分、数据库设计等。3.1系统功能模块设计划分系统功能模块,如用户管理、挂号管理、医生排班等。3.2数据库设计实现设计数据库表结构,确定字段类型、主键及外键关系。3.3用户界面设计设计用户友好的界面,提升用户体验。3.4系统安全设计阐述系统安全策略,包括用户认证、数据加密等。第4章系统实现测试介绍系统的实现过程,包括编码、测试及优化等。4.1系统编码实现采用SpringBoot框架进行系统编码实现。4.2系统测试方法介绍系统测试的方法、步骤及测试用例设计。4.3系统性能测试分析对系统进行性能测试,分析测试结果并提出优化建议。4.4系统优化改进根据测试结果对系统进行优化和改进,提升系统性能。第5章研究结果呈现系统实现后的效果,包括功能实现、性能提升等。5.1系统功能实现效果展示系统各功能模块的实现效果,如挂号成功界面等。5.2系统性能提升效果对比优化前后的系统性能
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值