
Note
文章平均质量分 57
江南蜡笔小新
这个作者很懒,什么都没留下…
展开
-
-tf.reduce_sum(one_hot_labels * log_probs, axis=-1)是什么损失函数?
-tf.reduce_sum(one_hot_labels * log_probs, axis=-1)是什么损失函数?由于BERT代码当初是用Tensorflow1.x发布的,阅读代码时没太看懂这个loss function原创 2022-09-15 17:01:57 · 923 阅读 · 1 评论 -
tf1.x和tf2.x查看TFRecord数据的方法
【代码】tf1.x和tf2.x查看TFRecord数据的方法。原创 2022-09-05 19:26:58 · 873 阅读 · 0 评论 -
从第一行代码学Python:理解from..import
from ..module import xxx是什么意思?Python中from 省略号/点点 Import ..是什么意思?原创 2022-05-06 17:45:59 · 1713 阅读 · 2 评论 -
[解决方案] 如何让Ubuntu 切换程序不合并标签
Ubuntu使用Alt+Tab的时候发现会把同一个应用程序的窗口合并在一起,要点击箭头才能选具体的窗口.对这个功能, 我表示很不理解.解决方案:设置->设备->键盘我们可以看到默认的切换窗口是禁用的, Alt+Tab指向的是切换应用程序.我们直接把切换窗口改成Alt+Tab, 切换应用程序的快捷键会自动禁用.此时即可流畅切换....原创 2021-11-25 18:12:15 · 1705 阅读 · 0 评论 -
[aminer] 2020清华大学人工智能发展报告pdf
「2020清华人工智能发展报告.pdf」,点击链接保存,或者复制本段内容,打开「阿里云盘」APP ,无需下载,极速在线查看享用。原创 2021-11-24 12:01:16 · 957 阅读 · 0 评论 -
[NLP] 实例讲解 N-gram语言模型 中 Good-Turning 平滑技术
1.背景最近在阅读论文的时候接触到了古德-图灵估计法,感觉比较模糊不清,进一步查阅了一些资料,希望有一个自己的直观理解。…本论文采用的是古德-图灵估计法,其基本思想是对于任意出现r次的n元语法对,都假设它出现了r*次,即降低高概率的n元语法对,提高低概率的n元语法对…1.1 为什么要用平滑技术?通常来讲,我们认为N-gram模型是一个无监督模型,具有非常大的语料库。然而,语料库再大,也会出现未知的N元对。以bigram为例,p(鼠标|弃飞),语料库再大这个p(鼠标|弃飞)也该等于0吧?天王老原创 2021-11-23 22:51:09 · 4027 阅读 · 2 评论 -
[Pandas] pd 报错TypeError: Can only append a dict if ignore_index=True
使用df.append()方法以dict形式添加数据时报错:TypeError: Can only append a dict if ignore_index=True通过报错信息,我们知道要求ignore_index=True,解决方案: df_out.append({'err':err,'predicted':corrected_sent,'target':cor},ignore_index=True)...原创 2021-11-21 16:43:23 · 6568 阅读 · 0 评论 -
[解决方案]Python安装 kenlm 报错
使用pip install kenlm 报错:python/kenlm.cpp:6381:13: error: ‘PyThreadState {aka struct _ts}’ has no member named ‘exc_traceback’; did you mean ‘curexc_traceback’?tstate->exc_traceback = *tb;^~~~~~~~~~~~~curexc_tracebackerror: command ‘gcc’ failed with原创 2021-11-20 23:45:01 · 1879 阅读 · 0 评论 -
[Notes] Pytorch中DDP(DistributedDataParallel)指定显卡/GPU运行的方式
先看看哪些卡空闲/可用,使用CUDA_VISIBLE_DEVICES屏蔽掉不可用的卡#自定义端口CUDA_VISIBLE_DEVICES="1,2,4,7" python -m torch.distributed.launch --nproc_per_node 4 --master_原创 2021-11-16 18:12:08 · 4100 阅读 · 0 评论 -
[PyTorch]图解DistributedDataParallel (DDP)的通信方式:gather,all_gather,all_reduce,reduce,scatter
在DistributedDataParallel (DDP)中,PyTorch不仅提供了Point-to-point communication这样的底层通讯方式,也提供了gather,all_gather,all_reduce,reduce,scatter这样的经封装的通讯方式.但在文档中没有提供详细的说明.在查找资料的过程中,在一个tutorials找到了相应的图解,一目了然.文中图片与参数均来自官方doc与tutorials,本文仅作为个人笔记使用.故,其中一些细节会略去,有兴趣的朋友可以参考原创 2021-10-29 15:16:56 · 3780 阅读 · 0 评论 -
【整理】C语言和C++中结构体的区别
struct Stt{ int num1; int num2;};1. 实例化的不同C:1.struct Stt ex;2. 使用typedef struct Stt{ int num1; int num2;}St;可以直接 St stt;C++:1.struct Stt ex;2.Stt ex;3.需要注意的是struct Student{ int no; char name[12];}stu1;等价于Student stu1;而非起了一原创 2020-11-07 21:38:32 · 640 阅读 · 0 评论 -
C++中等号到底会不会调用(复制)拷贝构造函数?
突然用到了,做个简单的笔记。简单来说A a=b;//会调用贝构造函数?//下面这种不会 A d;d=b;test code:#include <iostream>using namespace std;int main(){ //得出磁盘的可用空间 class A { public: int a; A():a(-1){ } A(int i) { cout<<"Constructor start!"<&原创 2020-10-27 21:38:20 · 1147 阅读 · 1 评论 -
QT/C++ 获取磁盘信息/簇大小、块大小、st_blksize、blockSize
最近有一个需求,为了优化传输计算,需要获取当前磁盘块的块大小。之前网上查询了一下是用windows.h做的,但在我的环境下莫名随机崩溃。遂发现QT自己有一个QStorageInfo,提供了一个blockSize();直接传入一个Qstring path即可,具体文档可以查阅QT手册https://doc.qt.io/qt-5/qstorageinfo.html...原创 2020-10-23 11:43:55 · 844 阅读 · 0 评论 -
【思维导图笔记】一图带你读懂 取模(求余)‘%’运算定义及其性质
文末的附图:定义就是除法中的求余 ,C语言中记作 a%b具体步骤求 整数商: c = [a/b];计算模或者余数: r = a - cb.注意:数学中,取模 != 取余取模运算在计算c的值时,向负无穷方向舍入(floor()函数)。取余运算在取c的值时,向0 方向舍入(fix()函数);例如a= -7,b=4 , a/b=1.75, 取模时向无穷方向取整C= -2 , 取余时向0方向取整 C=-1C取值的不同影响取模取余的运算结果取模的例子-7 Mod 4第一步,-7/..原创 2020-10-20 21:10:05 · 2845 阅读 · 1 评论 -
一张思维导图带你读懂getchar() gets() fgets() scanf() 的异同
getchar() gets() fgets() scanf() 的区别与不同已经把重点整理成了思维导图各个函数的细节可以在相关帮助文档找到,就不再赘述了1. getchar()定义于头文件 <stdio.h> int getchar(void); 从 stdin 读取下一个字符。 等价于 getc(stdin) 。参数 (无) 返回值 成功时为获得的字符,失败时为 EOF 。 若失败由文件尾条件产生,则另外设置 stdin 上的文件尾指示器(见feof() )。若失败由某些其他原创 2020-10-19 22:50:50 · 644 阅读 · 0 评论 -
傅里叶变换DFT频谱中为什么白色的、亮的是低频,黑色的、暗的是高频?
学习数字图像处理中傅里叶变换一节时出现了这样的疑问,为什么低频是白色的,高频是黑色的?找了一些资料,原来是对频率的理解不对。简单来说,就是因为傅里叶变换移频过后,低频部分到了中心位置,结合上述PPT知道,通常图像的低频占据了大部分信息,所以是白色的。...原创 2020-08-19 21:16:01 · 5720 阅读 · 1 评论 -
[给十年老帖再添点柴禾] 栈和堆的区别
原文链接:https://zhuanlan.zhihu.com/p/51612643,知识应该反复搬运(手动滑稽转自堆和栈的区别(转过无数次的文章) - hairetz的专栏 - 优快云博客并自己做了一些修改和补充预备知识—程序的内存分配一个由C/C++编译的程序占用的内存分为以下几个部分 1、栈区(stack):由编译器自动分配释放 ,存放函数的参数值,局部变量的值等。其 操作方式类似于数据结构中的栈。 2、堆区(heap):一般由程序员分配释放, 若程序员不释放,程序结束时转载 2020-06-25 16:47:35 · 270 阅读 · 0 评论 -
由入门C语言题目浅析gets()函数的用法
一、背景当执行下面的程序时,如果输入ABC,则知输出结果是()#include<stdio.h>#include<string.h>int main(){char ss[10] = “1,2,3,4,5”;gets(ss);strcat(ss,“6789”);printf("%s\n",ss);return 0;}在逛论坛的时候遇到了如上的一个问题,目测应该是二级题库或者水平考试的题目,题目本身不难,我也顺手给坛友回复了自己的看法:没曾想这个问题还没有结原创 2020-06-25 15:31:16 · 9261 阅读 · 3 评论 -
[Python验证] 已知某个家庭中有2个小孩,已知其中一个是女孩,则另一个是男孩的概率是多少?
已知某个家庭中有2个小孩,已知其中一个是女孩,则另一个是男孩的概率是多少?每隔一段时间,这种“月经题”就会反复出现。跟三门问题一样,大多是“什么时候验”的问题。除此之外,每个人对语言的理解也有不同,导致众多网友相互之间不服气。下面,我将用Python来测试一下,答案究竟是如何。首先我们约定,已有且仅有两个小孩“已知其中一个是女孩” ,我们认识为:两个小孩之中任有一个为女孩约定 生男生女的几率均为50%我们用0表示女孩,1表示男孩环境上 ,我们使用juyter + pyth原创 2020-06-20 17:27:22 · 2162 阅读 · 0 评论 -
[考研真题解] 下面给出一个排序算法,其中 n 是数据类型为 Type 的数组 A[ ]中元素总数。void unknown (Type a[ ], int n) 阅读此算法,说明它的功能;对于下面
下面给出一个排序算法,其中 n 是数据类型为 Type 的数组 A[ ]中元素总数。void unknown (Type a[ ], int n) {int d = 1, j;while ( d < n /3 ) d = 3*d+1;while ( d > 0 ) {for ( int i = d; i < n; i++ ) {Type temp = a[i];j = i;while ( j >= d && a[j-d] > temp ) {原创 2020-06-19 15:55:47 · 864 阅读 · 1 评论 -
[OpenCV] apporxPolyDP和convexHull有什么不同?轮廓多边形逼近和凸包的区别
apporxPolyDP和convexHull的区别?轮廓多边形逼近和凸包有什么不同?apporxPolyDP和convexHull的效果对比一、背景学习CV的过程中看到了这两个函数,简单记录一下1. apporxPolyDP轮廓多边形逼近 apporxCurve=cv2.apporxPolyDP(curve,epsilon,closed)2.convexHull凸包 hull=cv2.convexHull(points[,clockwise,[,returnPoints]])二、代码及效果原创 2020-06-15 21:07:35 · 822 阅读 · 0 评论 -
[starts]FindContours supports only CV_8UC1 images when mode != CV_RETR_FLOODFILL otherwise supports
问题不难,两天写错两次,在此记录一下问题很简单,当模式不等于CV RETR_FLOODFILL时,FindContours仅支持CV_8UC1图像否则仅支持CV_32SC1图像)在cvstartfindcours中我老是容易在,threshold中误传入原图像,这样img2会get一个三通道图,导致了后面的报错还会导致 scn == 3 || scn == 4 in function cv::cvtColor 等问题需要注意好细节问题...原创 2020-06-15 20:35:29 · 20693 阅读 · 5 评论 -
[Python] for或while循环后面加else的妙用
for或while循环中加else有什么用?循环后的else有什么作用?一、背景逛论坛的时候看到这样一个问题,想起自己从C、.原创 2020-06-14 23:28:22 · 4116 阅读 · 1 评论 -
[OpenCV / The Laplacian pyramid] 浅析拉普拉斯金字塔 / 利用拉普拉斯完成采样的恢复 学习笔记
拉普拉斯金字塔(The Laplacian pyramid)有什么用?如何实现上下采样的逆操作?是什么原理?拉普拉斯金字塔的应用?拉普拉斯金字塔恢复图片?拉普拉斯金字塔与高斯金字塔结合一、背景众所周知,上采样和下采样是不不可逆的操作。也就是:通过以上分析可知,向上采样和向下采样是相反的两种操作。但是,由于向下采样会丢失像素值,所以这两种操作并不是可逆的。也就是说,对一幅图像先向.上采样、再向下采样,是无法恢复其原始状态的;同样,对一幅图像先向下采样、再向上采样也无法恢复到原始状态。原创 2020-06-13 16:29:41 · 9730 阅读 · 0 评论 -
[OpenCV] cv.remap() 重映射学习笔记/map1 map2易混点
学习remap的时候发现map1和map2的参数跟我的直观理解略有差别,在次记录一下。一、背景把一幅图像内的像素点放置到另外一幅图像内的指定位置,这个过程称为重映射。OpenCV 提供了多种重映射方式,但是我们有时会希望使用自定义的方式来完成重映射。OpenCV 内的重映射函数 cv2.remap()提供了更方便、更自由的映射方式,其语法格式如下:dst=cv2.remap(src,map1,map2,interpolation[,borderMode[,borderValue]])式中:● dst原创 2020-06-10 15:02:33 · 12779 阅读 · 4 评论 -
[算法题答案]有n个长短不一的英文单词(均为小写),它们中最大长度是m,请设计高效的排序算法对其排序
一、背景有n个长短不一的英文单词(均为小写),它们中最大长度是m,请设计高效的排序算法对其排序题目是我编的。其实是记得群里有人问过“有n个长短不一的英文单词(均为小写),它们中最大长度是m…”,但是题目不完整,我也没有在百度上检索到该题题目,然后自己编了一下。如果有朋友有原题目,欢迎在平均区留言。二、题目分析与代码英文单词排序,我想到的主要是两种方法:桶排序 (Bucket sort)和通过Ascii码进行其他排序。但是题目中的n和m不确定,26个字母的关键字取值范围很大,采用传统桶排序可能不原创 2020-06-05 18:12:59 · 942 阅读 · 0 评论 -
[新更正·考研真题答案]设有大小不等的n个数据组,其数据总量为m,顺序存放在空间区D内,每个数据占一个存储单元,数据组的首地址由数组S给出,试编写将新数据x插入到第i个数据组的末尾且属于第i个数据组的
文章目录一、题目背景二、题目分析及代码部分1.分析2.代码三、实现效果一、题目背景某校考研真题1.设有大小不等的n个数据组,其数据总量为m,顺序存放在空间区D内,每个数据占一个存储单元,数据组的首地址由数组S给出,试编写将新数据x插入到第i个数据组的末尾且属于第i个数据组的算法,插入后,空间区D和数组S的相互关系仍保持正确。二、题目分析及代码部分1.分析如果我没有理解错题意的话,这道题还是比较简单的。主要就是维护 一个地址数组(S) + 一个类顺序表(D)。D这种类似于顺序表的东西,在考研原创 2020-06-02 16:23:50 · 2456 阅读 · 3 评论 -
[考研真题] 用 C 语言编写算法实现以平均值为界值(枢轴)的快速排序方法
文章目录一、背景二、分析1. 什么是快排(Quicksort)?2. 快排怎么做?三、代码部分一、背景某校考研真题:2. 快速排序算法中,如何选取一个界值(又称为轴元素),影响着快速排序的效 率,而且界值也并不一定是被排序序列中的一个元素。例如,我们可以用被排序序列中所有元素的平均值作为界值。 用 C 语言编写算法实现以平均值为界值 的快速排序方法(注:待排序数据存储在数组 R[ ]中, 数组最小下标为 S,数组最大下标为 T)。二、分析1. 什么是快排(Quicksort)?引入wiki定义:原创 2020-05-29 12:15:20 · 1657 阅读 · 1 评论 -
[NeRF]部分代码实现
文章目录part 1. viewing direction转3D Cartesian unit vectorpart2. Positional encoding声明:该本文代码与官方代码有差距,仅作个人练习之用。part 1. viewing direction转3D Cartesian unit vectorIn paper:In practice, we express d...原创 2020-05-08 17:25:18 · 2299 阅读 · 1 评论 -
Python/Java/C++/C#等主流编程语言的多线程对比
文章目录一、什么是多线程1.定义2.优点3.缺点二、Pyhon三、Java四、C++五、C#一、什么是多线程1.定义多线程(英语:multithreading),是指从软件或者硬件上实现多个线程并发执行的技术。具有多线程能力的计算机因有硬件支持而能够在同一时间执行多于一个线程,进而提升整体处理性能。具有这种能力的系统包括对称多处理机、多核心处理器以及芯片级多处理(Chip-level mul...原创 2020-04-30 12:20:33 · 4007 阅读 · 0 评论 -
【转载】激活函数函数有哪些?如何选择激活函数?
激活函数是神经网络中非线性的来源,因为如果去掉这些函数,那么整个网络就只剩下线性运算,线性运算的复合还是线性运算的,最终的效果只相当于单层的线性模型.(1)Sigmoid函数左端趋近于0,右端趋近于1,且两端都趋于饱和.关于函数饱和解释:参考https://www.cnblogs.com/tangjicheng/p/9323389.html如果我们初始化神经网络的权值为 [0,1] 之...转载 2020-04-29 23:34:07 · 1448 阅读 · 0 评论 -
【纯情少年不得不说的故事】什么是过拟合和欠拟合?如何解决?
文章目录一、过拟合1. 定义2. 常见原因3. 解决方案二、欠拟合1.定义2.常见原因3.解决办法三、大话过拟合欠拟合一、过拟合1. 定义在统计学中,过拟合(英语:overfitting,或称拟合过度)是指过于紧密或精确地匹配特定数据集,以致于无法良好地拟合其他数据或预测未来的观察结果的现象。[1]过拟合模型指的是相较有限的数据而言,参数过多或者结构过于复杂的统计模型。[2]发生过拟合时,模...原创 2020-04-29 23:18:53 · 961 阅读 · 0 评论 -
梯度爆炸与梯度消失是什么?有什么影响?如何解决?
文章目录一、梯度爆炸1.什么是梯度爆炸?2.有何影响?二、梯度消失1.定义2.有何影响?三、共同点1.产生原因2.解决办法a. 方案1-预训练加微调b. 方案2-梯度剪切、正则化c. 方案3-relu、leakrelu、elu等激活函数解决方案4-batchnorm/批规范化解决方案5-残差结构解决方案6-LSTM梯度消失与梯度爆炸其实差不多,两种情况下梯度消失经常出现,一是在深层网络中,二是采...原创 2020-04-29 14:30:15 · 40234 阅读 · 0 评论 -
[转载]什么是机器学习正则化?L1正则化?L2正则化?
什么是AI正则化?什么是机器学习正则化?什么是机器学习正则化?L1正则化?L2正则化?机器学习中,如果参数过多,模型过于复杂,容易造成过拟合(overfit)。即模型在训练样本数据上表现的很好,但在实际测试样本上表现的较差,不具备良好的泛化能力。为了避免过拟合,最常用的一种方法是使用使用正则化,例如 L1 和 L2 正则化。但是,正则化项是如何得来的?其背后的数学原理是什么?L1 正则化和 L2...转载 2020-04-29 14:26:29 · 1285 阅读 · 0 评论 -
【转载】OpenCV是怎么完成模板匹配的/ 模板匹配的原理
OpenCV 学习笔记(模板匹配)OpenCV是怎么完成模板匹配的?模板匹配的原理?模板匹配如何确定相似度,有哪些方法?模板匹配是在一幅图像中寻找一个特定目标的方法之一。这种方法的原理非常简单,遍历图像中的每一个可能的位置,比较各处与模板是否“相似”,当相似度足够高时,就认为找到了我们的目标。在 OpenCV 中,提供了相应的函数完成这个操作。matchTemplate 函数:在模板和输入...转载 2020-04-11 14:53:13 · 1221 阅读 · 0 评论 -
机器学习/统计学习算法分类整理【持续更新】
文章目录机器学习十大算法总结/机器学习十大经典算法简介一、.监督学习1. 线性回归2. Logistic 回归3.支持向量机算法(Support Vector Machine,SVM)4. 最近邻居/k-近邻算法 (K-Nearest Neighbors,KNN)二、 无监督学习三、 强化学习机器学习十大算法总结/机器学习十大经典算法简介有监督学习有哪些?无监督学习有哪些?强化学习有哪些?一...原创 2020-04-07 20:49:10 · 1857 阅读 · 0 评论 -
[非卷积5D] NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
不使用3D建模,使用静态图片进行训练,用(非卷积)深度网络表示场景的5D连续体表示,再通过ray marching进行渲染。paper:《NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis》NeRF: Representing Scenes as Neural Radiance Fields ...原创 2020-04-06 18:18:18 · 6230 阅读 · 0 评论 -
OpenCV学习笔记(六)【图像特征:harris角点检测、SIFT】
一、图像特征-harris角点检测二、Scale Invariant Feature Transform(SIFT)尺度不变量特征变换图像尺度空间在一定的范围内,无论物体是大还是小,人眼都可以分辨出来,然而计算机要有相同的能力却很难,所以要让机器能够对物体在不同尺度下有一个统一的认知,就需要考虑图像在不同的尺度下都存在的特点。尺度空间的获取通常使用高斯模糊来实现...原创 2020-04-04 16:30:54 · 737 阅读 · 0 评论 -
【转载】OpenCV形态学操作集合
感谢原作者辛勤付出,仅做笔记之用https://blog.youkuaiyun.com/danmeng8068/article/details/81061615https://blog.youkuaiyun.com/zhu_hongji/article/details/81480400https://www.cnblogs.com/pacino12134/p/9890492.html...原创 2020-04-02 16:40:25 · 296 阅读 · 0 评论 -
【总结】PyTorch多分类log_softmax、softmax的中文手册
【总结】PyTorch多分类log_softmax、softmax的区别与联系log_softmax、softmax在F和nn中存在,在此主要介绍nn1.softmaxtorch.nn.functional.softmax (Python function, in torch.nn.functional)torch.nn.Softmax (Python class, in torch.n...原创 2020-04-01 18:12:32 · 4489 阅读 · 1 评论