- 博客(494)
- 资源 (1)
- 收藏
- 关注
原创 计算机安全会议审稿的一些感想(以及今年还在征稿的几个会议)
大概从去年开始,在专业领域的service逐渐多了起来。今年主要将在几个关于计算机安全的学术会议里担任程序委员会(Program Committee)成员。本文主要谈谈关于这几个会议的一些信息,也欢迎大家踊跃投稿
2025-03-22 11:33:24
787
原创 小样本学习中的Prototypical Network(原型网络)详解
原型网络是小样本学习(Few-shot Learning)中的经典方法之一,特别适用于分类任务。它的核心思想是通过学习每个类别的“原型”来表示该类别的特征,然后通过比较新样本与这些原型的距离来进行分类
2025-01-23 11:47:33
163
原创 天道酬勤与“灰人理论”
如果你在某一领域天分很高,那么牛津大学就会全力支持你深入研究该领域。但是,如果你没有这方面的天分,而非要通过努力去弥补,这样的人就叫作灰人。这种灰人就是在浪费生命,因为即使你再努力,这辈子也达不到那高度,你可能从一达到三,但你这辈子都达不到十
2024-10-25 07:06:20
1345
原创 Ghidra逆向工具之旅与二进制代码分析【4】
Ghidra是一种开源的逆向工具,它是由NSA的研究理事会为其网络安全任务开发的软件逆向工程(SRE)框架,它有助于分析恶意代码和病毒等恶意软件,并可以让网络安全专业人员更好地了解其网络和系统中的潜在漏洞。把Ghidra和Python脚本结合起来,会大大提高工作效率,从而发挥更加强大的功用
2024-09-04 08:41:38
297
原创 从弗兰克·赖特的艾伦别墅谈起——工作与生活的平衡艺术
弗兰克·劳埃德·赖特是二十世纪享誉世界的建筑大师,被认为是现代建筑的先驱之一。弗兰克的设计风格以其有机建筑理念著称,他主张建筑应该与自然环境和谐融合。2019年,弗兰克的五栋代表性建筑在打包后以“弗兰克·劳埃德·赖特的建筑作品”为名目被共同列入联合国教科文组织的世界遗产名录
2024-08-21 08:42:49
1199
原创 站在巨人的肩膀上:Open AI的Text Embedding
自OpenAI公司的ChatGPT横空出世以来,大语言模型可谓风头无量。个人用户可以直接使用ChatGPT这样的会话式交互平台来辅助自己的日常工作,提高生产效率。除此之外,如果要做进一步的开发,就需要使用OpenAI提供的API。OpenAI 的 API 可用于几乎所有需要理解自然语言的任务
2024-07-03 08:44:56
353
原创 站在巨人的肩膀上:OpenAI API与Fine-tuning
自OpenAI公司的ChatGPT横空出世以来,大语言模型可谓风头无量。个人用户可以直接使用ChatGPT这样的会话式交互平台来辅助自己的日常工作,提高生产效率。除此之外,如果要做进一步的开发,就需要使用OpenAI提供的API。OpenAI 的 API 可用于几乎所有需要理解自然语言的任务。而且,使用API还可以大批量地自动产生输出本文
2024-06-27 08:10:51
366
原创 从诺曼底登陆八十周年说起
昨天是诺曼底登陆(Normandy Campaign)八十周年纪念日。除了受到各路媒体争相报道的影响,也因为最近暑假刚开始的两个星期,刚好参观或游历了几个跟二战有关的地方,心中不免感慨万千
2024-06-08 10:02:12
808
1
原创 异常检测(Anomaly Detection)——基于MATLAB的实例(1)
异常检测(anomaly detection)是数据挖掘中的一类常见任务,它是指对“与预期模式或数据集中的项目、事件或观测值不相匹配的”数据点进行识别的过程。因此,它也被称作异常值检测(outlierdetection)。通常,这些异常值的检测会在不同的应用场景中被转变成银行欺诈、结构缺陷、网络攻击等类型的问题
2024-03-09 12:15:05
725
3
原创 计算机英文单词课堂——Shebang, Left of Boom, and Right of Boom
如果脚本文件中包含Shebang,类Unix操作系统的程序载入器会分析Shebang后的内容,将这些内容作为解释器指令,并调用该指令,并将载有Shebang的文件路径作为该解释器的参数
2024-01-26 11:44:21
775
2
原创 微调BERT实现对IMDB数据集的情感分析(Sentiment Analysis)
BERT是Google提出的一个基于Transformer的自然语言处理领域的预训练模型。在得到一个预训练的模型之后,针对不同的具体任务,还要做Fine-tuning。本文将演示在Tensorflow中微调BERT模型实现对文本进行分类的目的。文本情感分析(Sentiment Analysis)是自然语言处理中的一个常见任务
2024-01-22 08:17:55
565
原创 软件漏洞发现:基于Transformer分析补丁中的Commit Message
谷歌的研究人员在论文 Attention is All you need 中提出了 Transformer 模型,其使用 Self-Attention 结构取代了在 NLP 任务中常用的 RNN 网络结构。而且实验也证明Transformer在效果上已经完败传统的 RNN 网络。在当下流行的很多LLM中,Transformer也是必不可少的基石。本文主要演示Transformer在软件安全领域的一个应用。我们将通过分析软件补丁中的Commit Message部分,来挖掘出那些未上报的隐秘软件漏洞
2024-01-22 08:09:48
488
原创 BERT(从理论到实践): Bidirectional Encoder Representations from Transformers【3】
BERT(Bidirectional Encoder Representations from Transformers)是Google提出的一个基于Transformer的自然语言处理领域的预训练模型。BERT这种预训练模型是“自监督的”或者半监督的(Semi-supervised Learning)。本文将在Tensorflow/Keras中运用BERT实现文本分类任务
2024-01-04 08:43:43
1478
原创 BERT(从理论到实践): Bidirectional Encoder Representations from Transformers【2】
BERT(Bidirectional Encoder Representations from Transformers)是Google提出的一个基于Transformer的自然语言处理领域的预训练模型。BERT这种预训练模型是“自监督的”或者半监督的(Semi-supervised Learning)。本文将在Keras中演示BERT的使用
2024-01-03 14:52:44
1440
原创 探访纳尔逊美术馆里的绝世中华艺术品收藏
上个世纪初,军阀混战,民不聊生。1912年,河北易县一个偏僻的山洞里惊现十六尊令人叹为观止的等身三彩罗汉像。而且,这也是迄今为止唯一发现的辽代孤品,极其罕见。辽代三彩等身罗汉像原本一共16尊,偷盗和运输过程中至少毁坏了3尊。目前,可查的存世罗汉像共10尊,却没有一尊留在中国。可想而知它们的珍贵程度。纳尔逊美术馆里现收藏有其中的一尊,如果你有幸到此,千万不要错过
2024-01-03 09:34:22
705
原创 英文诗歌里是如何表达“我命由我不由天”这句话的?
不可征服这首诗在欧美国家流传度极高。南非前总统纳尔逊·曼德拉经常背诵非常喜欢这一首短诗,据说他被囚禁于罗本岛时,就经常背诵这首诗,以达到激励斗志、坚定信仰的目的。在拍摄曼德拉的传记电影《成事在人》时,导演克林特·伊斯特伍德决定将《成事在人》的片名由原来的工作用名“The Human Factor”改为了“Invictus”,将诗歌与电影合为一体,体现了“面对灾难时争取生存”的主题
2024-01-03 08:02:09
925
原创 BERT(从理论到实践): Bidirectional Encoder Representations from Transformers【1】
BERT(Bidirectional Encoder Representations from Transformers)是Google提出的一个基于Transformer的自然语言处理领域的预训练模型。BERT这种预训练模型是“自监督的”或者半监督的(Semi-supervised Learning)。也就是说,我们手头拥有大量未标记的数据——自然语言中的句子。为了训练一个语言模型,就自己创造一些任务,例如Maked LM和NSP
2024-01-02 13:58:11
1335
原创 Byte-Pair Encoding(BPE)
Byte-Pair Encoding(简称BPE)是一种在NLP中使用的压缩算法,它用一小组子词单元表示大词汇量。它广泛用于各种NLP任务,如machine translation, text classification, and text generation。BPE的基本思想是通过迭代地合并文本语料库中最频繁的相邻字节或字符对,直到达到预定的词汇大小。生成的子词单元可用于以更紧凑和高效的方式表示原始文本
2024-01-02 13:55:37
2121
原创 解决编译中遇到的问题:Please port gnulib freadahead.c to your platform
解决在编译若干个老版本的GNU gzip软件中遇到的各种各样的问题。例如:Please port gnulib freadahead.c to your platform,以及error: too many arguments to function ‘futimens’ 188 | return futimens (-1, file, timespec); 等等。遂记录于此。
2023-09-23 03:31:13
2889
原创 在Linux、Ubuntu中跨平台编译ARM(AARCH64)平台的binutils
Binutils 是GNU提供的一组二进制工具的集合。通常,在已经安装了Linux操作系统的个人电脑上,系统就已经自带了这个工具集。但在进行嵌入式开发的时候,可能会用到支持ARM64平台的Binutils,这时就需要用到交叉编译
2023-07-24 11:08:53
1904
1
原创 基于Transformer实现文本分类(Keras/TensorFlow)
2017年,Google 在论文 Attention is All you need 中提出了 Transformer 模型,其使用 Self-Attention 结构取代了在 NLP 任务中常用的 RNN 网络结构。而且实验也证明Transformer 在效果上已经完败传统的 RNN 网络
2023-02-16 07:56:12
3077
原创 Keras实例教程(7)之构建模型的第三种方式
曾几何时,在TensorFlow中搭建深度学习模型对于很多人来说其实仍然是比较困难的。相比之下,Keras作为独立于TensorFlow的一种深度学习框架则要简单很多。在TensorFlow与PyTorch的竞争中逐渐式微的情况下,TensorFlow团队终于宣布Keras将成为在tensorflow2.0中构建和训练模型的核心高级API
2023-02-15 11:50:22
631
转载 Python面向对象中的super详解
Python中关键字super主要用来调用父类的方法,当我们调用 super() 的时候,实际上是实例化了一个 super 类,而非关键字或者函数等其它数据结构。在大多数情况下,super 包含了两个非常重要的信息: 一个 MRO (方法解析顺序)以及 MRO 中的一个类
2023-02-15 08:46:34
840
原创 successful NUMA node read from SysFS had negative value (-1)告警的处理方法
在使用 TensorFlow或者Keras时,可能会遇到下面这个告警“successful NUMA node read from SysFS had negative value (-1)”,本文将介绍该告警的处理方法
2023-02-11 07:34:26
2609
原创 LSTM已死,Transformer当立(LSTM is dead. Long Live Transformers! ):下
2017 年,Google 在论文 Attention is All you need 中提出了 Transformer 模型,其使用 Self-Attention 结构取代了在 NLP 任务中常用的 RNN 网络结构。而且实验也证明Transformer 在效果上已经完败传统的 RNN 网络
2023-02-11 04:54:25
3415
原创 LSTM已死,Transformer当立(LSTM is dead. Long Live Transformers! ):上
2017 年,Google 在论文 Attention is All you need 中提出了 Transformer 模型,其使用 Self-Attention 结构取代了在 NLP 任务中常用的 RNN 网络结构。而且,实验也证明Transformer在效果上可以完败RNN,本文主要介绍 Transformer 模型的具体实现,作为上篇,我们先把Multi-head Self-Attention解释清楚
2023-02-10 10:43:27
1232
原创 libnvinfer.so, libnvinfer_plugin.so : cannot open shared object file 错误解决
在使用GPU加速你的深度学习程序时,你是否遇到过如下警告:Could not load dynamic library 'libnvinfer.so.7'; dlerror: libnvinfer.so.7: cannot open shared object file: No such file or directory; Could not load dynamic library 'libnvinfer_plugin.so.7'; dlerror: libnvinfer_plugin.so.7
2023-02-08 09:02:09
3687
原创 脚本语言Bash简明教程【3】(完结篇)
Bash, Bourne-Again SHell,是Bourne shell的后继兼容版本与开放源代码版本, Unix shell的一种。在1987年由布莱恩·福克斯为了GNU计划而编写。1989年发布第一个正式版本,原先是计划用在GNU操作系统上,但能运行于大多数类Unix系统的操作系统之上。Bash是一个命令处理器
2022-12-17 08:42:57
495
原创 Ghidra逆向工具之旅与二进制代码分析【3】
逆向工程工具Ghidra由NSA的研究理事会为其网络安全任务开发的软件逆向工程(SRE)框架,它有助于分析恶意代码和病毒等恶意软件,并可以让网络安全专业人员更好地了解其网络和系统中的潜在漏洞
2022-12-16 11:13:17
785
原创 Linux中使用交叉编译、二进制分析工具链
交叉编译,就是要生成在其它平台上运行的目标代码。例如个人电脑上的CPU都基于X86架构。但很多手机或其它嵌入式设备的处理器则可能是基于ARM架构的。若要在个人电脑上开发嵌入式应用,就要进行交叉编译。本文主要演示在Linux环境下使用交叉编译及二进制分析工具链的基本方法
2022-12-16 06:51:41
1093
原创 脚本语言Bash简明教程【2】
Bash, Bourne-Again SHell,是Bourne shell的后继兼容版本与开放源代码版本, Unix shell的一种。在1987年由布莱恩·福克斯为了GNU计划而编写。1989年发布第一个正式版本,原先是计划用在GNU操作系统上,但能运行于大多数类Unix系统的操作系统之上。Bash是一个命令处理器
2022-12-14 09:25:06
359
原创 脚本语言Bash简明教程【1】
Bash, 即Bourne-Again SHell,是Bourne shell的后继兼容版本与开放源代码版本, Unix shell的一种。在1987年由布莱恩·福克斯为了GNU计划而编写。1989年发布第一个正式版本,原先是计划用在GNU操作系统上,但能运行于大多数类Unix系统的操作系统之上。Bash是一个命令处理器,通常运行于文本窗口中,并能执行用户直接输入的命令。Bash还能从文件中读取命令,这样的文件称为脚本。它支持通配符匹配、管道、命令替换、变量,以及条件判断和循环遍历的结构控制语句
2022-12-09 06:12:42
493
原创 GNU调试、反编译、二进制分析工具链
GCC是GNU中用于编译的工具,其全称是 GNU Compiler Collection。将C/C++源代码用GCC/G++编译成可执行的二进制文件后,后续还有很多有用的工具可以支持调试、反编译、及二进制代码分析的工作,例如知名的gdb。本文主要介绍GNU工具链中跟调试、反编译、二进制分析相关的应用。例如addr2line和objdump。熟悉和了解这些工具对于逆向工程、系统安全、软件分析等非常有帮助
2022-11-19 13:02:23
949
原创 Ghidra逆向工具之旅与二进制代码分析【2】
Ghidra是一种开源的逆向工具,它是由NSA的研究理事会为其网络安全任务开发的软件逆向工程(SRE)框架,它有助于分析恶意代码和病毒等恶意软件,并可以让网络安全专业人员更好地了解其网络和系统中的潜在漏洞。把Ghidra和Python脚本结合起来,会大大提高执行效率,从而发挥更加强大的功用
2022-10-30 11:30:12
1675
原创 Ghidra逆向工具之旅与二进制代码分析【1】
本系列文章系统地介绍众多逆向工具中的一种 Ghidra,它是由NSA的研究理事会为其网络安全任务开发的软件逆向工程(SRE)框架,它有助于分析恶意代码和病毒等恶意软件,并可以让网络安全专业人员更好地了解其网络和系统中的潜在漏洞。Ghidra跟IDA Pro用起来很像,但Ghidra是免费的,而且是开源的
2022-10-29 13:03:25
1133
原创 Linux信号详解:signal与sigaction函数【2】
前面已经讨论了Linux操作系统中“信号”、“中断”、“僵尸进程”’等重要概念。结合C语言中的setjmp、longjump、sigsetjum和siglongjmp,读者也知道了如何实现异常处理。通过signal和sigaction,我也知道了如何修改或者屏蔽默认的信号处理函数。这是本系列文章的最后一篇。本文将通过具体代码实例来深化上述重要概念和方法的理解
2022-10-11 08:21:37
629
原创 Linux信号详解:signal与sigaction函数【1】
在此前的系列文章中,我们已经介绍了signal函数的基本用法,本文将通过若干例子帮助读者增进对于它的了解,特别地,本文还要重点解释Sigaction的使用方法
2022-10-07 11:21:39
707
原创 据传是科罗拉多最美的景致:万山中的秘境仙踪
科罗拉多州(Colorado)素有“户外运动天堂“之称,该州最著名的旅游胜地洛基山国家公园更常年位居全美最热门国家公园榜单前列。但如果问“哪里是科罗拉多最美的地方(the most photographed and iconic spot)?”,答案可能是一个很多人都没太听过的名字——Maroon Bells。大部分介绍科罗拉多旅游的出版物(杂志文章或者书籍)都使用该地所拍摄的照片作为封面
2022-09-26 11:08:20
722
1
原创 Excel表格快速复制公式到最后一行,无需拖拽!
工欲善其事,必先利其器!掌握一些Excel表格的操作技巧,很多时候会极大地减轻工作量。有时我们希望在Excel表格中快速填充/复制公式,但如何在不使用鼠标拖拽的情况下直接复制到最后一行呢?本文将手把手助你提升工作效率
2022-09-26 10:27:07
35378
1
原创 Ubuntu22.04深度学习GPU环境配置:Nvidia CUDA 11.7、cuDNN 8.5 详细解读(20220910)
假设你已经成功安装了最新版本的Ubuntu22.04 LTS 操作系统,并已经配备了支持深度学习的英伟达GPU,本文将手把手详细解读如何配置环境,包括安装必要的软件:例如驱动515,CUDA 11.7,以及cuDNN 8.5等
2022-09-12 06:47:47
4418
2
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人