- 博客(99)
- 资源 (11)
- 收藏
- 关注

原创 SySeVR环境配置:joern-0.3.1、Neo4j-2.1.5、py2neo2.0
最近希望在基于图神经网络的漏洞检测上有所推进,准备复现文章SySeVR开源代码,基本环境配置是python库环境以及joern-0.3.1、Neo4j-2.1.5环境的配置,环境具体要求如下假期的时候就已经完成过joern的配置,光是安装就卡了我两个星期,并未详细记录,特此来记录一下。但是最后采用joern-cli绘制图代替joern使用了详细见文章链接。..................
2022-07-22 21:33:26
2665
7

原创 Joern的代码使用-devign
** 最近一直在做关于图神经网络试验的复现,但是开源的代码真的是少之又少,说起我和joern的爱恨离愁还真是有很长时间了 **初试joern-cli代码中使用问题问题解决
2022-03-05 20:29:08
6737
26

原创 爬虫学习总结
啦啦啦,滴滴答,我是卖报的小行家,今天终于完成长达两天的python爬虫的学习了今天的总结呢,包括以下几点:一.关于基础知识的归类爬取基本过程1.选着要爬的网址 (url)2.使用 python 登录上这个网址 (urlopen等)3.读取网页信息 (read() 出来)4.将读取的信息放入 BeautifulSoup5.选取 需要的tag 信息等登录网站的方式urlopen:from urllib.request import urlopen# if has Chinese
2021-03-19 23:09:16
841

原创 多进程(多核运算)Multiprocessing
多核运算目录1.什么是 Multiprocessing2.添加进程 Process3.存储进程输出 Queue4.效率对比 threading & multiprocessing5.进程池 Pool6.共享内存 shared memory7.进程锁 Lock1.什么是 Multiprocessing将任务分配给多个核进行计算,单独的核有自己的运算空间,运算能力,真正的做到各个部分的任务被同时执行,实现并行操作而不是多线程的伪并行,让你的多核计算机发挥真正潜力多进程 Multip
2021-02-26 23:36:34
5913
1

原创 python多线程
多线程(mult-tHreadings)目录什么是多线程添加线程 add threadjoin功能Queue功能不一定有效率 GIL锁 lock什么是多线程可以分配任务为一个个的小任务让电脑同一时间完成任务。将每一个小任务放在一个线程里运算,所有线程同时计算工作,当所有线程的子任务同时完成后,总任务也被完成,从而大大的降低计算时间,比如我们可以在同一时间内运行多个程序,运行多个函数。多线程是加速程序计算的有效方式,Python的多线程模块threading上手快速简单,从这节开始我们就教大
2021-02-22 22:17:25
690
3

原创 在转化词向量之前先转化为AST再转化为词向量的实现方法
实现思路环境:我们在文章https://blog.youkuaiyun.com/lockhou/article/details/113883940已经实现了在Win上的将一系列的c文件转化生成对应的AST文件,并且通过AST文件经过节点匹配生成文本向量,从而构建一个c文件对应一个存储AST的txt文件对应一个存储文本向量的txt文件,且对应的三个文件同名,因为我们判断一个文件是否有漏洞是从文件名字当中体现的。思路:我们原理是现将文件分类为Train,Test,Validation,之后直接读取.c文件做去空处理
2021-02-21 19:12:39
653
2

原创 codesensor:将代码转化为ast后再转化为文本向量
学习材料:论文:1.DeepBalance: Deep-Learning and FuzzyOversampling for Vulnerability Detection:https://download.youkuaiyun.com/download/lockhou/153819112.Cross-Project Transfer Representation Learningfor Vulnerable Function Discovery:https://download.youkuaiyun.com/downl
2021-02-20 21:51:06
4766
8

原创 Bert的实现方法
bert-as-serviceBERT 模型是一种 NLP 预训练技术,本文不介绍 BERT 的原理,主要关注如何快速上手使用 BERT 模型生成词向量用于下游任务。Google 已经公开了 TensorFlow 版本的预训练模型和代码,可以用于生成词向量,但是还有更简单的方法:直接调用封装好的库 bert-as-service 。使用 bert-as-service 生成词向量bert-as-service 是腾讯 AI Lab 开源的一个 BERT 服务,它让用户可以以调用服务的方式使用 BER
2021-02-07 17:27:12
1176
1
原创 chainer-gpu版本,cupy安装教程
但是我的cupy是和cuda版本匹配的,可能是和chainer存在不兼容的情况,并且我之前看到cupy-cuda102虽然对于不同cuda是不同的,但是其本身还有不同版本呢,具体如下,我目前是最新的,因此我换成最旧的,但是gpu都吊不起来了,所以最后经过尝试。我全部返回true,说明可以正常调用gpu,但是引入chainer产生提醒cudnn is not enabled,我觉得可能还是没正确用上gpu,所以我先觉得运行程序看一下,确实占用显存,我运行代码截图如下。我查阅资料,发现可能是下面这个回答,
2025-03-12 13:07:30
394
原创 在Eclipse中安装配置JDK11
添加上面的路径 C:\Program Files\Java\jre-11.0.6 即可。执行完成以后,会在 C:\Program Files\Java 目录下生成 jre-11.0.6 文件夹,即为所需要的JRE目录。最后在 Java->Installed JREs->Execution Environments 中沟通JDK11的JRE即可。在Eclipse的菜单的“ Windows -> Preference”中进行配置。使用下载的安装包进行安装,双击可执行文件一路下一步即可。
2023-04-21 16:11:19
2569
原创 maven安装教程(结合eclipse和IDEA)
首次执行 mvn help:system 命令,Maven相关工具自动帮我们到Maven中央仓库下载缺省的或者Maven中央仓库更新的各种配置文件和类库(jar包)到Maven本地仓库中。本文须知:安装maven环境之前要先安装java jdk环境(没有安装java环境的可以先去看安装JAVA环境的教程)Maven 3.3+ require JDK 1.7 及以上。添加如下配置(注意要添加在和两个标签之间,其它配置同理),放在默认节点的前面,是添加在原来默认的节点之前不要删除修改原有的节点。
2023-04-21 15:09:55
568
原创 choco-slover安装
简单来说,jar包是对写好的类进行了打包。我们可以通过将jar包放到lib目录下来使用这些jar包中的类、属性和方法。专业解释,JAR文件是Java Archive File-java档案文件的简称,是与平台无关的文件格式,基于zip文件格式将许多文件合成一个压缩文件.jar,区别是比zip多了一个包含了一个 META-INF/MANIFEST.MF 文件,这个文件是在生成 JAR 文件的时候自动创建的。
2023-04-20 23:39:55
335
原创 FORD-FULKERSON算法
其中w也有流流向了u和v,而这部分流无法流向源点s,因为没有路径,所以最后这部分流量加上s到u和v的流量,在u和v之间无论如何互相传递流,最终都要流向集合T,所以这个流量值是等于s流向u和v的值的。首先,我们必须了解一个特性,根据上一篇文章中讲到的最大流问题的线性规划表示时,提到,流网络的流量守恒的原则,根据这个原则我们可以知道,对网络的任意割,其净流量的都是相等的。举个例子,假设(u,v)当前流量为3/4,那么就是说c(u,v)=4,f(u,v)=3,那么r(u,v)=1。首先介绍下,割的概念。
2023-04-02 15:50:27
4734
原创 AllDifferent约束条件下广义弧一致性的实证研究-Generalised arc consistency for the AllDifferent constraint: survey
AllDifferent约束是任何约束工具包、语言或求解器的重要组成部分,因为它被广泛应用于各种约束模型中。文献中包含了这个约束的许多不同版本,它们以推断的强度与计算成本进行交易。在这篇文章中,我们关注于推理的最高强度,加强了一个称为广义弧一致性(GAC)的性质。本文对GAC的主要算法在AllDifferent约束条件下的优化进行了分析研究。我们从文献中对一些关键技术进行了实证评估。我们还报告了这些技术的重要实现细节,这些细节通常在已发表的论文中没有描述。我们特别关注。
2023-03-31 22:15:31
1156
转载 Tarjan算法超超超详解(ACM/OI)(强连通分量/缩点)(图论)(C++)
在有向图G中,如果两个顶点u,v间有一条从u到v的有向路径,同时还有一条从v到u的有向路径,则称两个顶点强连通。如果有向图G的每两个顶点都强连通,称G是一个强连通图。有向非强连通图的极大强连通子图,称为强连通分量(Strongly Connected Components, SCC)。换句话说,一个强连通分量中的每两个点可以互相到达,且这个强连通分量所包含的的节点数尽可能大。例如:(下图中被框起来的子图就是强连通分量,共三个):显然,环是一个强连通分量的子图。
2023-03-31 14:08:07
766
5
原创 Alldifferent约束下无用约束传播的早期有效识别-Early and Efficient Identification of Useless Constraint Propagation
约束传播和回溯是解决约束满足问题的两种基本技术。在解的搜索过程中,通过约束传播丢弃不属于任何解的变量对和值对,保证广义弧的一致性,避免了无结果的搜索。然而,约束传播经常被调用,对许多CSP几乎没有影响。在预测何时调用约束传播以求解CSP方面投入了大量精力。然而,对于不同的约束条件,还没有一个有效的解决方法。本文给出了一个新的定理,用于在一个值图中识别所有alldifferent约束的边,这些约束的去除会导致无用的约束传播。
2023-03-29 21:27:01
260
原创 A Fast Algorithm for Generalized Arc Consistency of the Alldifferent Constraint(不同约束广义圆弧相容的快速算法 )
各种不同的约束可以在各种各样的组合问题中找到[Wallace1996],包括各种谜题、图着色和指派问题。
2023-03-27 23:47:43
181
原创 A fltering algorithm for constraints of difference in CSPs
CSP解的存在性问题是NP完全的。因此,一些方法已经发展起来,以简化CSP之前或期间的搜索解决方案。一致性技术是最常用的技术。对于二进制CSP和N元CSP提出了几种实现弧一致性的算法。引入的特殊约束的算法AC-4进行了改进,研究了单调和泛函二元约束。在本工作中,我们对n元约束的一个特殊情况:“不同约束”感兴趣,为此我们提出了一个过滤算法。如果一个约束在变量子集上被一组元组定义,而在同一元组中出现的值都是不同的,则称为“不同约束”。它们存在于现实生活中的许多问题中。
2023-03-25 21:17:09
239
原创 网页爬虫开发基础实验
1.掌握使用Request库生成GET请求、Request库上传请求头中的User-Agent(信息),Request库查看返回的响应头、Request库查看返回的状态码、以及Request库和chardet库识别返回的页面内容编码,并正确显示页面内容。2.掌握Xpath的语法知识、etree模块的使用方法以及在动态网页种直接获取Xpath路径方法。3.掌握使用Beautiful Soup库搜索文档树中的节点,掌握使用Beautiful Soup库提取搜索到的节点中的文本内容。4.掌握综合运用Requ
2023-02-05 23:50:37
352
原创 目标检测—安全帽检测实践
在该项目当中我们采用的是传统的开源数据集SHWD(Safety helmet (hardhat) wearing detect dataset)数据集标签为hat,person。
2022-08-06 13:51:12
3106
1
原创 word2vec发展过程
最后一点,在神经网络模型中,如”the”、”a”等频繁词会降低训练的速度以及损害训练结果准确性,为了解决这个问题,引入了欠采样技术,技术原理很简单,就是以某个随机的概率舍弃词典中的词,越频繁的词被舍弃的概率越大,因此,在不改变词频排列顺序的前提下,大大减小了频繁词与非频繁词的比例,从而突出了非频繁词,训练结果更加准确,训练的速度也更快。假设词表中共有n个词,将所有单词排序后,每个单词都会有一个位置信息,则对于单词[公式],可以使用n维向量来表示,其中向量的第i分量的值为1,其余值为0,向量记为[0,0,….
2022-08-06 13:41:17
357
原创 word2vec原理
这篇论文详细地推导和解释了word2vec模型的参数更新公式,包括:CBOW(continuous bag-of-word)模型和SG(skip-gram)模型,以及两种参数优化技术:hierarchical softmax 和 negative sampling.
2022-08-06 13:38:17
525
原创 scikit-learn no moudule named six
在scikitlearn版本0.23中删除了模块sklearn.externals.six。
2022-07-31 23:19:57
179
原创 ImportError: `save_weights` requires h5py.问题解决
问题分析keras或者tensorflow保存模型是时候需要结合h5py使用,所以需要安装该库即可,并且保证h5py版本和keras或者tensorflow匹配问题。
2022-07-31 19:47:54
946
原创 linux中anaconda安装(Ubuntu)
anaconda会自动将环境变量添加到PATH里面,如果后面你发现输出conda提示没有该命令,那么你需要进行环境配置。链接https//www.jianshu.com/p/8634f31eafb0。source~/.bashrc这样就是更新环境变量,就可以正常使用了。再次输入condalist测试看看,应该就是没有问题啦!打开配置文件,在末尾添加如下内容。...
2022-07-31 14:09:27
543
原创 joern运行后.joernindex数据库无内容
但是当我导入数据之后,产生了.joernindex文件,该文件产生的位置和你当前所在文件夹,具体位置可以在joern-0.3.1文件夹下的joern-conf修改,我每次导入数据都可以生成该文件,但是我是用命令neo4jconsole访问服务的时候(如果云服务器访问详见文章),发现joernindex文件的数据当中是空的没有任何节点,说明我数据并没有导入,这个问题困住了我一天,我以为是java版本的问题,换了好多次就java版本并反复使用ant重构,但是之前ant是成功的,不知道到底是哪的问题。...
2022-07-25 13:22:29
590
原创 远程访问云服务器上Neo4j等服务的本地网址
使用腾讯云服务器安装Neo4j,其服务器启动在服务器的7474端口上,即服务在http7474,而由于使用的命令行形式,我们可以使用命令行控制浏览器访问固定网址,并返回但是可能需要下额外软件同时并不美观,如何通过我们本地浏览器直接访问云服务器上的服务呢。...
2022-07-25 13:03:47
901
原创 VNC Timed out waiting for a response from the computer
最近在腾讯云服务器ECS上安装了图形界面和VNCServer,参考Ubuntu18.0下安装远程桌面服务端软件VNCServer但是连接的时候却提示。
2022-07-25 12:50:52
2911
原创 搭建 Ubuntu 可视化界面
它是一款优秀的远程控制工具软件,由著名的AT&T的欧洲研究实验室开发的。VNC是基于UNIX和Linux操作系统的开源软件,远程控制能力强大,高效实用,其性能可以和Windows和MAC中的任何远程控制软件媲美。本文档指导您如何在Ubuntu操作系统的云服务器中搭建可视化界面。则需在实例已绑定的安全组中放通5901端口,即在“入站规则”中添加放通协议端口为TCP5901的规则,具体操作请参见添加安全组规则。如果您还未购买云服务器,请参考快速配置Linux云服务器。......
2022-07-25 12:43:24
3086
1
原创 sudo java -jar joern ModuleNotFoundError: No module named ‘apt_pkg‘错误
python更新为3.8,no module named 'apt_pkg'
2022-07-23 16:54:05
414
原创 Neo4j运行报错Error occurred during initialization of VM Incompatible minimum and maximum heap sizes spec
找了网上很多帖子说是java内存大小的问题,但是我看他的报错有一部分眼熟像是当时配置N4o4j时候的参数,所以我就怀疑是我Neo4j参数配置的问题,打开文件neo4j-wrapper.conf,根据提示接着运行指令```neo4jstart-no-wait``即可。...
2022-07-23 16:48:05
829
原创 Ubuntu 提示sudo: XXX: command not found解决办法(以java为例)
ubuntu下运行sudoJava时提示“sudojava在网上找了,其中很多方法都提示要修改/etc/profile的配置,或是修改/etc/environment的配置。配置完sudojava就可以运行了,但是改完之后依然无效。
2022-07-23 11:24:51
1455
原创 腾讯云服务器Ubuntu系统如何使用 root 用户远程登录
腾讯云服务器Ubuntu系统的默认用户名是ubuntu,并且在安装过程中默认不设置root帐户和密码。如果想直接以root用户进行远程登录,可在设置中开启允许root用户登录。
2022-07-22 18:22:50
2894
原创 ubuntu如何升级python版本号
ubuntu升级python版本号的方法1、打开ubuntu终端;2、输入命令获取最新的python3.6;3、输入命令移除旧版本;4、输入命令更换默认python3版本;5、将pip需重新安装一下即可。1、使用快捷键【Ctrl+Alt+T】打开ubuntu终端;2、输入以下命令获取最新的python3.6,将其添加至当前apt库中。3、再输入以下命令移除旧版本4、再输入以下命令更换默认python3的版本为3.65.更新完后,还需要将pip需重新安装一下,安装命令如下。...
2022-07-22 16:53:48
24653
1
原创 Ubuntu下安装配置JDK1.7
本文安装中环境变量的修改在~/.bashrc中,仅针对当前用户,如果修改/etc/profile则针对所有用户。对于下载方法,可以使用命令,也可以手动下载。本人采用手动下载jdk的方式。下载jdk-7u7-linux-i586.tar.gz到Ubuntu桌面,...
2022-07-20 16:22:04
1624
原创 起点中文网 字体反爬技术 网页可以显示数字字母 网页代码是乱码或空格
我接过一段代码# -*- coding: utf-8 -*-"""Created on Tue Mar 23 14:38:01 2021@author: xinyi"""import xlwtimport requestsfrom lxml import etreeimport timeall_info_list = []def get_info(url): html = requests.get(url) selector = etree.HTML(html.
2022-03-23 20:50:50
813
2
原创 joern-cli与graph-for-funcs.sc版本问题
之前通过修改joern-cli的版本使其适配devign开源代码但是我之前以为这是开源的大佬自己写的,我寻思是独一无二的,只能通过修改joern-cli的版本版本去迎合graph-for-funcs.sc,但是我今天发现不是这样的下载一个版本的joern-cli之后,你也可以接着下在他的源代码source code,下载完source code.zip压缩包之后解压,在路径joern-1.0.170\joern-cli\src\main\resources\scripts\graph下你能看到各种sc
2022-03-06 21:31:22
1229
9
py2neo-3.1.1-py2.py3-none-any.whl,已经配置完成下载后直接使用即可,具体实体过程详见主页文章
2022-07-22
joern-tools-master.zip,joern-0.3.1,已经配置完成下载后直接使用即可,具体实体过程详见主页文章
2022-07-22
python-joern-0.3.1,优质资源配备齐全下载解压即可使用,具体使用过程详见主页文章
2022-07-22
Deep Cost-Sensitive Kernel Machine for Binary Software Vulnerability Detection
2021-02-20
Cross-Project Transfer Representation Learning for Vulnerable Function Discovery
2021-02-20
PCA-理论及代码实现
2020-11-16
新建 DOC 文档.doc
2020-04-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人