- 博客(5)
- 资源 (2)
- 收藏
- 关注

原创 python实现的人脸识别,中文显示名称
开发环境:python3.6+opencv+face_recognition注释:主类:bosswatching.py,pictures下放训练的图片,读取摄像头数据,检测到人脸,并实时识别人脸,中文显示人物名称,显示人物备注信息测试:此程序本人测试运行在windows上,需要安装一些软件包,比较麻烦,linux系统可能更方便。主要的包以及版本如下:github地址:https://github....
2018-06-25 10:53:24
4252
9
原创 使用tf-idf文本分类
中文分词(Chinese Word Segmentation)指的是将一个汉字序列切分成一个一个单独的词。中文分词是文本挖掘的基础,对于输入的一段中文,成功的进行中文分词,可以达到电脑自动识别语句含义的效果。 TF-IDF(term frequency–inverse document frequency)是一种用于信息搜索和信息挖掘的常用加权技术。在搜索、文献分类和其他相关领域有广泛的
2015-01-13 16:00:45
3210
原创 聚类算法文档(业务进程+业务URL)
假设:终端=4000;业务软件进程=100;URL=16000;第i个终端包含xi个不同业务软件进程,包含yi个URL。该算法关键是需要将业务进程名集和URL进程名集转换成数值相似性集合,便于聚类分析。 1、 首先将终端与对应的业务软件进程集作关联性分析;第i个终端业务进程名数=ki(Process_1,…,Process_ki),该终端权重=ki/
2015-01-13 15:41:45
753
原创 URL关联性分析及推荐算法
URL关联性分析及推荐算法1. 首先将第d天的终端使用的业务URL集转换成数值相似性集合第Ui个业务URL在Ti个终端上使用,访问该URL的终端与全部终端占比为Ti/T(T为全部终端数),分析该URL与其他URL之间的相似性(两个URL之间终端使用的重合度*(1-Ti/T))。依次迭代计算业务URL之间的相似性,最后形成业务URL之间的相似性集合。2. 连续计算一个时间段(
2015-01-13 15:22:26
932
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人