# -*- coding: utf-8 -*-
__author__ = 'Zhao'
import re
import operator
blank = [chr(183)]
tabs = ['']
def tree(lst):
l = len(lst)
if l == 0:
print('─' * 3)
else:
for i, j in enumerate(lst):
if i != 0: print(tabs[0], end='')
if l == 1:
s = '─' * 3
elif i == 0:
s = '┬' + '─' * 2
elif i + 1 == l:
s = '└' + '─' * 2
else:
s = '├' + '─' * 2
print(s, end='')
if isinstance(j, list) or isinstance(j, tuple):
if i + 1 == l:
tabs[0] += blank[0] * 3
else:
tabs[0] += '│' + blank[0] * 2
tree(j)
else:
print(" ", j)
tabs[0] = tabs[0][:-3]
def judge_element_delete(list_input, centroid, group, match_num):
for list_element in list_input:
if isinstance(list_element, list):
for element in list_element:
if element == match_num:
del centroid[list_input.index(list_element)]
del group[list_input.index(list_element)]
简易中文分词聚类(Python)
最新推荐文章于 2022-05-05 19:54:28 发布

本文介绍了如何使用Python进行中文分词和文本聚类。通过引入jieba库进行分词,然后利用KMeans算法对分词结果进行聚类,实现对大量中文文本的有效组织和分类。
最低0.47元/天 解锁文章
961

被折叠的 条评论
为什么被折叠?



