- 博客(16)
- 资源 (1)
- 收藏
- 关注
原创 论文:Mingling of Clear and Muddy Water:Understanding and Detecting Semantic Confusion in Blackhat SEO
黑帽SEO检测
2022-09-13 16:37:45
283
原创 论文笔记:Domain names abuse and TLDs: from monetization towards mitigation
域名滥用 论文阅读笔记
2022-08-12 14:28:01
1103
原创 os.popen执行查询进程数的返回结果比实际进程数多1
暂未找到原因,如果路过的大佬知晓原因,跪求分享只是发现了这个现象,即:python中执行os.popen('ps -ef | grep "name" | wc -l')所查询到的数值是linux中直接执行ps -ef | grep "name" | wc -l的结果+1
2022-01-04 16:24:25
541
2
原创 计算矩阵间余弦相似度,无循环
矩阵v1:,可看作n个k维行向量矩阵v2:,可看作m个k维列向量计算v1的行向量和v2列向量的余弦相似度,无循环根据余弦相似度公式,向量点乘除以模的乘积,拓展到矩阵间运算大致分为三步:1. 矩阵点乘,得到矩阵m:2. v1行方向求模得到m1:,v2列方向求模得到m2:,m1与m2点乘得到矩阵denom:3. 矩阵m/demom,对应位置除运算如此即可矩阵运算得到行列向量间的余弦相似度,python代码如下:def matrix_cos_similar(v1, v2): .
2021-10-11 15:18:51
2991
原创 Python Crypto报错解决:object type <class ‘str‘> cannot be passed to c code
首先,Crypto.__version__ 检查下Crypto的版本是否>2.6.1如果是,pip install pycrypto==2.6.1,基本可解决若不是,参考前辈https://blog.youkuaiyun.com/zhangpeterx/article/details/96351648
2020-08-12 19:16:37
2136
原创 Scala处理数据groupby,collect_list保持顺序,explode一行展开为多行
目录1. 数据说明及处理目标2.groupby,按某列有序collect_list3.explode 展开udf返回的array4.将单列按照分隔符展开为多列1. 数据说明及处理目标DataFrame格式及内容如下图所示,每个rdid下有多个wakeup_id,每条wakeup_id对应多条ctime及page_id。处理目标:获取每个wakeup_id下的page_id变化序列,假设某wakeup_id下的page_id有序列表为[1,3,4,6,6,7,8,8],那么所...
2020-07-16 15:49:11
4324
2
原创 Unicode
推荐这个文章,写的真的不错https://pycoders-weekly-chinese.readthedocs.io/en/latest/issue5/unipain.html
2019-11-15 17:59:49
148
原创 【已解决】Makefile出错:Undefined symbols for architecture x86_64
操作系统:MacOSdemo项目结构:makefile文件这样写:objects = demo.o cJSON/cJSON.odemo : $(objects) cc -o demo $(objects) -Wl,-rpath,. -L. -lwebsocket -lm$(objects) :demo.o : libwebsocket.h cJSON/cJSON.h...
2019-10-09 11:54:49
1159
原创 python获取wav时长,切割wav文件
python操作wav文件有很多库:wave scipy.io.wavfile pydub等。wav文件截取我用的是pydub库。from pydub import AudioSegmentfilePath = '.../'# 操作函数def get_wav_make(dataDir): sound= AudioSegment.from_wav(dataDir) ...
2019-09-27 14:28:01
9552
转载 计算广告概览
转至http://www.cnblogs.com/maybe2030/ 品牌广告(Brand Awareness):创造独特良好的品牌或者产品形象,目的在于提升较长时期内的离线转化率。 效果广告(Direct Response):在短时间内明确用户转化行为(比如:购买、注册、投票等)诉求的广告。 ROI(Return On Investment):投资回报率。...
2019-04-23 21:22:44
237
原创 读Excel数据,画条形图
画图部分转自https://blog.youkuaiyun.com/zhangxiaojiakele/article/details/78014627目录1.处理数据2.画条形图导入包from matplotlib import pyplot as pltimport numpy as npfrom matplotlib.font_manager import FontProp...
2019-04-11 10:41:54
428
原创 Leetcode-21: Merged two sorted lists
Merge two sorted linked lists and return it as a new list. The new list should be made by splicing together the nodes of the first two lists./** * Definition for singly-linked list. * struct List...
2018-11-24 10:04:19
164
原创 Leetcode-20:Valid Parentheses
class Solution {public: bool isValid(string s) { stack<char> stk; map<char, char> parentheses = {{'(',')'}, {'{','}'}, {'[',']'}}; for(char c: s){ ...
2018-11-24 09:36:19
113
原创 全排列递归(解决了重复字符问题)
网上有很多讲解全排列递归的算法思路以及程序,所以在此本菜鸟就不再写一遍了。今天的重点在解决重复字符方面,感觉网上博客里的解决思路大都一致,写一个isSwap函数,然后在递归主体里判断一下函数返回true还是false,大神们也都po出了程序运行图。然而我这么写的程序最终跑不出来预期结果,因此我分析了一下,觉得可以有一个更为简单的办法去重。要点就是:如果发现待交换的两个字符str[i] == str...
2018-06-19 10:12:41
1441
1
原创 剑指offer:矩阵中的路径问题,回溯法,非递归版本
/**我是挺想不开的用栈非递归做这道题, 希望大家不要向我学习 * 以下言论纯属自我体会,接受优化 * 用栈存储当前合法访问路径,与str对应,用pathIndex做索引。 * 我认为非递归做这道题最主要的坑是在访问标记这块, * 当栈顶字符的上下左右有不少于1个可访问字符时, * 控制字符的访问标记 */ public static boolean hasPath(char[] ma...
2018-05-03 10:07:36
304
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人