- 博客(13)
- 资源 (3)
- 收藏
- 关注
原创 focal_loss 多类别和二分类 Pytorch代码实现
import numpy as npimport torchimport torch.nn as nnimport torch.nn.functional as F# 支持多分类和二分类class FocalLoss(nn.Module): """ This is a implementation of Focal Loss with smooth label cr...
2019-06-12 17:23:48
16186
22
原创 Attention系列一之seq2seq传统Attention小结
正如标题所言,本文总结了一下传统的Attention,以及介绍了在seq2seq模型中使用attention方法的不同方式。摘要 首先seq2seq分为encoder和decoder两个模块,encoder和decoder可以使用LSTM、GRU等RNN结构,这也是之前transformer没出来之前常用的经典方法。(主要选取了tensorflow官方教程和pytorch教程的例子作对...
2019-04-15 15:51:26
1518
1
原创 Santander Customer Transaction Prediction Kaggle比赛 小结
之前参加了kaggle的一个Santander Customer Transaction Prediction比赛,共有达9038支队伍参赛,一个号称寻找magic的比赛。参加比赛的的忘不了被magic这个词所支配的恐惧...比赛链接 https://www.kaggle.com/c/santander-customer-transaction-prediction/overview...
2019-04-15 13:41:20
1609
2
原创 Named Entity Recognition with Bidirectional LSTM-CNNs 论文阅读笔记
该论文是发表于2016年。还算是比较早的论文了。虽然现在有更好的模型。比如BERT横空出世,相信未来也会源源不断的大牛来提出更多新的模型。但是读读总还是会收获的。之前自己也用BERT来进行中文NER的识别,代码放到了 https://github.com/xuanzebi/BERT-CH-NER 欢迎Star啊哈哈。论文网络模型图论文解读论文处理的是...
2019-03-29 23:11:39
2651
5
原创 Attention is all you need论文Transformer中的Positional Encoding代码实现及讲解
首先论文中说到因为没有用到RNN也没有用到CNN提取特征,所以句子中没有很好的应用位置信息。所以需要在input embedding后加上Positional Encoding 。所以论文中提出了一种Positional Encoding的实现方式,下面贴出代码的实现以及讲解。首先看下论文中提出的方式,pos为词的位置信息,dmodel为词向量embedding的维度。最后得到的向量大小...
2019-03-28 14:43:18
6428
2
原创 基于BERT的中文命名实体识别
代码和数据都存放在了github上:https://github.com/xuanzebi/BERT-CH-NER欢迎大家STAR啊,来让我收获人生的第一个STAR吧 2333~~~~~基于上课老师课程作业发布的中文数据集下使用BERT来训练命名实体识别NER任务。之前也用了Bi+LSTM+CRF进行识别,效果也不错,这次使用BERT来进行训练,也算是对BERT源码进行一个阅读...
2019-03-23 10:28:30
18978
19
原创 基于wiki的中文语料进行word2vec模型训练
最近看了一篇NDSS会议上的一篇论文,有关web安全方向和nlp方向的,论文题目为《Game of Missuggestions: Semantic Analysis of Search-Autocomplete Manipulations》。正好自己也想学学nlp。为将来毕业做准备。。。也算一个小白。。看到论文使用了词向量word2vec算法,便去研究了一下算法原理。看了很多中英文博客,...
2018-08-23 21:00:17
3687
2
原创 爬取矿大教务系统成绩
最近不太忙所以就把上次刚学python时,没能成功爬取教务系统成绩的代码又重新写了一下,但是这一写就是一段时间,其中想过很多方法,又尝试了很多方法,这过程中也摸索学到了一点知识,所以来总结一下吧。首先打开矿大教务系统登录主页,先分析一下网页。矿大教务系统首先分析网站源代码下面根据使用下方网址通过浏览器f12登陆进去后可以看到如下图所示的信息其中form表单有一个csrfto...
2018-07-06 10:06:00
6280
3
原创 机器学习实战之决策树
决策时是一个分类算法。本文主要讲了一下决策树的构造以及用绘图的形式把决策树绘画出来。决策树的构造本文使用ID3算法来划分数据集,通过计算每一个特征的香农熵来选取最优划分数据集的特征,之后在递归的构造决策树来遍历每一个特征。下面公式是计算香农熵,p(xi)是选择该分类的概率 ,n是分类的数目。算法步骤:利用calcShannonEnt函数计算原始数据的原始香农熵,即最后的一个特征来划分计算出来的香农...
2018-06-20 11:30:38
312
原创 全排列问题 java代码实现
import java.util.Arrays;import java.util.Scanner;/** * Created by 90684 on 2018/6/14. */// 题目:给n个数字,在给一个m,写出这n个数字的全排列,其中临近的两个数字和不能超过m。// 题解:采用递归的方法,数据交换public class test1 { public static ...
2018-06-14 20:17:22
787
原创 2018 codeM 初赛A卷 第二题 棋盘题 -java
import java.util.Scanner;/** * Created by 90684 on 2018/6/10. */// codeM 初赛A卷 第二题 /* 贪心算法 该题。start[i] end[j] 对于 i<=j 代价为j-i;否则为j+i; 所以找到最大的可以匹配的i,就相当于减少了2i的花费。 */public cla...
2018-06-10 11:48:05
388
原创 机器学习入门方法推荐(少走弯路)入门视频推荐
入门可以看看下列的几个课程。第一第二个公认的经典了。1、首先当然是吴恩达的经典机器学习了, 可以在万能的b站搜,也可以在网易公开课搜 吴恩达机器学习http://study.163.com/course/courseMain.htm?courseId=10045700292、台大林轩田教授的机器学习基石 也很好。b站 链接如下:点击打开链接 还有下部 机器学习技法 点击打开链接3、谷歌出了两个关...
2018-06-06 16:21:33
8201
原创 机器学习实战 K-近邻算法
K近邻分类器算法 预测约会网站配对# -*- coding: UTF-8 -*-from numpy import *import operatorimport matplotlibimport matplotlib.pyplot as plt# k 近邻算法第一个分类器def craetaDataSet(): group = array([[1.0, 1.1], [1.0,...
2018-06-06 16:09:25
225
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人