
算法
文章平均质量分 77
项哥
热爱技术
展开
-
服务器配置相同服务性能不一样排查
背景查看响应时间日志,新增加的两台GPU机器服务器响应时间要比老的机器要快3倍qps 相似,机型一模一样,同一个服务和同样的模型排查htop 查看老机器开启了 swap, 新机器关闭了swap,于是将老机器的 swap 关闭,然而并没有效果prometheus 比对两台机器的运行差异,除了老机器CPU使用率和负载都比新机器高以外其余的指标全部都接近,排除磁盘、网络等问题export -p 对比环境变量一样,排除环境变量问题lsof -p 进程ID| grep mem 拿到p原创 2021-07-22 19:54:22 · 1304 阅读 · 2 评论 -
k-means聚类对评价内容进行归类
应用场景有很多评价内容,对评价内容进行聚类,得到每个类别的关键可以用python的scikit-learn或者mahout,得到聚类结果都只能作为参考,最终结果仍然用人工定义python方案1.准备足够多的的评论样本,最好1万+2.对每个评价内容用jieba分词,这一步最重要,自建特定行业词库分词效果最好3.scikit-learn的方法得到所有样本的tf-idf矩阵4.拟定一个聚类...原创 2019-08-08 18:19:20 · 3428 阅读 · 0 评论