Vim统计中文字数和英文单词数（附针对LaTeX的特殊处理）

trium_KW

已于 2022-06-24 11:52:22 修改

阅读量1.3k

点赞数 1

分类专栏：开发工具文章标签： vim linux

于 2022-06-18 18:27:55 首次发布

本文链接：https://blog.youkuaiyun.com/trium_KW/article/details/125350210

版权

本文介绍了如何在Vim中统计中文字数和英文单词数，特别是在LaTeX文档中进行特殊处理的方法，通过Python脚本和内置命令实现，还提供了一个整合的Vim函数和插件来方便使用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

统计中文字数

在 Vim 中可以容易地用 Ex 命令

:%s/[\u4e00-\u9fa5\u3040-\u30FF]//gn

统计。

统计英文单词数

在终端中可以使用 wc -w 统计。但如果英文中混有中文该怎么办呢？我写了这个 Python3 脚本 stripwchar.py：

#!/usr/bin/env python3
import argparse
import unicodedata
import sys


def make_parser():
    parser = argparse.ArgumentParser(
        description=('This script strips wide characters from FILE or stdin '
                     'if one is not provided, and outputs to stdout.'))
    parser.add_argument('filename', metavar='FILE', nargs='?')
    return parser


def stripwchar(istream, ostream):
    for line in istream:
        cbuf = []
        for c in line:
            if unicodedata.east_asian_width(c) in 'FW'