- 博客(104)
- 收藏
- 关注
原创 基于注意力机制的机器翻译——经典论文解读与代码实现
Seq2Seq + Decoder Attention的具体实现和论文里的公式解读,请参考:attention_seq2seq欢迎讨论与start!
2019-07-04 11:13:33
897
1
原创 关于selenium
功能自动化测试工具selenium篇 Python爬虫利器五之Selenium的用法 WebCollector+selenium抓取新浪微博数据 WebCollector爬取JS加载的数据 python爬虫的最佳实践(五)–selenium+PhantomJS的简单使用 安装Selenum的Chromedriver 关于python-bs4 Python在我SEO工作中的应用一 - 数
2016-07-29 13:27:45
606
原创 关于Nutch
Nutch 教程 nutch中bin/crawl和bin/nutch crawl的用法 Nutch1.7学习笔记1:基本环境搭建及使用
2016-07-29 09:55:07
580
原创 关于WebCollector
WebCollector 2.x 入门教程github使用 jsoup 对 HTML 文档进行解析和操作 JAVA爬虫 WebCollector Webcollector应用(一)
2016-07-27 08:06:49
749
原创 关于Hadoop
API document:Apache Hadoop Main 2.7.2 APIMapper:Mapper、Mapper.ContextMapReducer:在 Hadoop 上编写 MapReduce 程序GenericOptionsParser:Class GenericOptionsParserJob:Class JobMultipleInputs:Class MultipleIn
2016-07-25 11:02:29
426
原创 关于java
为什么要用static修饰内部类:Java静态类单例模式:JAVA设计模式之单例模式 、 JAVA Static方法与单例模式的理解 BlockingQueue:Interface BlockingQueue、Java多线程-工具篇-BlockingQueue InetAddress:Class InetAddressDataOutput:Interface DataOutputLinke
2016-07-25 10:51:36
535
原创 个性化语音——总结
时间 2016.5.4~2016.7.20成果: 基于Voice Conversion的demo:VC demo百度网盘分享基于TTS adaption的demo:TTS adaption demo百度网盘分享TTS demo:基于HMM的TTS demo百度网盘分享github:Voice Conversion Project AHOcoder(Linux 64bit):AHOcod
2016-07-21 09:33:26
9239
1
原创 RNN学习(三)
nn.Recurrent(start, input, feedback, [transfer, rho, merge]) start: the size of the output, or a Module that will be inserted between the input and the transfer.input: a module that processes the in
2016-06-27 17:17:00
1291
原创 Torch学习(二)
Modules are the bricks used to build neural networks. Each are themselves neural networks, but can be combined with other networks using containers to create complex neural networksCriterions compute
2016-06-21 18:03:16
2950
原创 Torch初学(一)
Tensor多维矩阵,可以使用LongStorage --- creation of a 4D-tensor 4x5x6x2 z = torch.Tensor(4,5,6,2) --- for more dimensions, (here a 6D tensor) one can do: s = torch.LongStorage(6) s[1] = 4; s[2] = 5; s[3] =
2016-06-21 13:32:19
13173
原创 RNN学习(二) 一些常见的RNN
参考LectureNotes4参考BackPropagation Through Time语言模型rnn 损失函数:交叉熵 Vanishing Gradient 和 Gradient Explosion Problems 问题解决办法: 改变对WhhW^{hh}的初始化方法不使用sigmoid,而使用ReLUDeep Bidirectional RNN:可以参考”Bidirection
2016-06-20 17:53:14
1511
原创 RNN学习(一) 神经网络概述
参考LectureNotes3神经网络可用于非线性分类 如图 神经元接受n个输入,产生一个输出神经元输出函数可以有 sigmoid 也可以表示称 binary logistic regression softmax 等等例如想知道”Museums in Paris are amazing”中Paris是否是一个命名实体。可以使用如下网络建立一个分类器。 假设我们用一个4维词向量
2016-06-20 13:57:54
922
原创 阅读"voice conversion using deep bidirectional long short-term memory based recurrent neural networks"
VC的两种方法: 基于规则:修改语音信号 ”Frequency warping based on mapping formant parameters”“Weighted frequency warping for voice conversion”基于统计:估计从源信号到目的信号的map函数 GMM:原理参考基于高斯混合模型的语音转换技术研究 ”Continuous probabli
2016-06-19 11:31:37
1451
原创 阅读"Semi-supervised Training of a Voice Conversion Mapping Function using a Joint-Autoencoder"
Stacked-Joint-Autoencoder(SJAE)架构:找到平行语料中源和目的特征的共同编码。最终DNN的组成:SJAE中源编码,目的解码。在非监督学习中,使用大量无关说话者的数据,会减少在监督学习中需要的平行语料的数据量。在此基础上,使用与源说话人和目的说话人相似的说话人的数据,进行非监督学习。半监督学习系统中包含如下几个部分: 在general-purposes databa
2016-06-17 13:35:36
1045
原创 Theano安装
参考 Ubuntu14.04安装Theano详细教程 参考Easy Installation of an Optimized Theano on Current Ubuntusudo apt-get install gfortransudo apt-get install libopenblas-devsudo apt-get install liblapack-devsudo apt-g
2016-06-15 15:30:12
757
原创 python使用
shape >>> import numpy as np >>> a = np.array([1, 2, 3, 4]) >>> a.shape (4,) >>> a.shape[0] 4 >>> c = np.array([[1, 2, 3, 4],[4, 5, 6, 7], [7, 8, 9, 10]]) >>> c.shape (3, 4) >>> c.shape[0]
2016-06-14 16:30:27
457
原创 HTS demo搭建
预备安装 sudo apt-get install libx11-devsudo apt-get install g++sudo apt-get install libc6-dev-i386 sudo apt-get install build-essentialsudo apt-get install libncurses5-devsudo apt-get install soxs
2016-06-12 15:10:46
4818
原创 Matlab安装
参考Ubuntu14.04安装Matlab2014amkdir ~/matlab_isosudo mount -o loop /media/majing/work/Software/MATLAB.R2014A/MATHWORKS_R2014A.iso ~/matlab_isocd ~/matlab_isosudo ./install选择”install manually without u
2016-06-12 11:59:48
1330
原创 CNTK安装
参考CNTK Binary Download and Configuration 1. sudo apt-get install g++ 2. 确保openmpi的安装版本:dpkg -l | grep openmpi 参考MPI error while compiling 3. wget https://www.open-mpi.org/software/ompi/v1.10/down
2016-06-12 11:41:48
4453
原创 Ubuntu安装Bazel
参考Installing BazelBazel是一个编译软件。sudo add-apt-repository ppa:webupd8team/javasudo apt-get updatesudo apt-get install oracle-java8-installerecho “deb http://storage.googleapis.com/bazel-apt stable jdk
2016-06-11 11:03:52
26419
1
原创 各类社区Blog
Ubuntu:Ubuntu中文论坛Tensorflow: Tensorflow中文社区CNTK 入门教程官方论坛 论文RNN WILDMLDeep Learning with TorchTorch Awesome Torch
2016-06-10 20:33:54
662
原创 Linux常见命令
查看显卡信息 lspci | grep -i vga卸载软件 sudo apt-get remove x2x,此时没卸载相关依赖,隔一段时间可用apt-get autoremove,参考如何在Ubuntu下彻底并安全的卸载软件? 3.
2016-06-10 09:10:19
621
原创 Torch安装
curl -s https://raw.githubusercontent.com/torch/ezinstall/master/install-deps | bashgit clone https://github.com/torch/distro.git ~/torch - -recursive cd ~/torch ./install.sh # and enter “yes”
2016-06-09 22:51:14
2708
原创 Tensorflow 安装
参考Github Tensorflow Setupsudo apt-get install python-pip python-devsudo pip install –upgrade https://storage.googleapis.com/tensorflow/linux/cpu/tensorflow-0.8.0-cp27-none-linux_x86_64.whl测试运行(注意,不要
2016-06-09 22:42:45
3447
原创 Ubuntu软件安装
pip: sudo apt-get install python-pip python-dev build-essentialsudo pip install –upgrade pip sudo pip install –upgrade virtualenv chrome wget https://dl.google.com/linux/direct/google-chrome-stabl
2016-06-09 21:18:57
762
原创 Ubuntu常遇问题及解决方案
报错:GPG 错误:http://archive.ubuntukylin.com:10006 xenial InRelease: 由于没有公钥,无法验证下列签名: NO_PUBKEY 8D5A09DC9B929006解决:sudo apt-get install uk-keyring 对于刚建立的Ubuntu,由于没安装更新,可能找不到uk-keyring,安装更新即可GPG是什么? 参考G
2016-06-09 21:10:20
3996
原创 《Lex 和 Yacc 》阅读笔记
第一章:Lex 和 Yacc最简单的Lex程序%%. | \n ECHO;%%作用类似于不带参数运行的UNIX cat命令用Lex识别单词 - 先列出要识别的一组动词: is am are were was be being been do
2015-11-04 08:03:32
1237
原创 GitHub使用
简单教程:http://jingyan.baidu.com/article/f7ff0bfc7181492e27bb1360.html
2015-10-08 16:16:30
651
原创 数组中重复的数字(没理解)
题目:在一个长度为n的数组里的所有数字都在0~n-1的范围内。数组中某些数字是重复的。请找出数组中任意一个重复的数字。方法1:排序。方法2:哈希表。方法3:
2015-10-08 16:12:41
409
原创 不能被继承的类
题目:用C++设计一个不能被继承的类。方法1:把构造函数设为私有函数。使用静态函数获得类型的实例。缺点:只能得到位于堆上的实例,而得不到位于栈上的实例。class SealedClass1 { public: static SealedClass1* GetInstance(){ return new SealedClass1(); }
2015-10-08 15:53:42
440
原创 不用加减乘除做加法
题目:写一个函数,求两个整数之和,要求在函数体内不得使用+,-,×\times,÷\div 四则运算符号。方法:两数异或并左移一位,知道不产生进位为止int Add(int num1, int num2){ int sum, carry; do{ sum = num1 ^ num2; carry = (num1 & num2) << 1;
2015-10-08 15:41:54
391
原创 求1+2+...+n(不太理解)
题目:求1+2+…+n,要求不能使用乘除法、for、while、if、else、switch、case等关键字及条件判断语句(A?B:C)。方法1:利用构造函数。定义一个类型,接着创建n个该类型的实例,则这个类型的构造函数将确定会被调用n次,将与累加相关的代码放到构造函数里。class Temp { public: Temp() { ++N; Sum += N; }
2015-10-08 11:59:01
738
原创 圆圈中最后剩下的数字(不太理解方法2)
题目:0,1,…,n-1这n个数字排成一个圆圈,从数字0开始每次从这个圆圈里删除第m个数字。求出这个圆圈里剩下的最后一个数字。(约瑟夫环问题)方法1:用环形链表(std::list)模拟,每当迭代器(Iterator)扫描到链表末尾的时候,把迭代器移到链表的头部,这就相当于按照顺序在一个圆圈里遍历。时间复杂度O(mn),空间复杂度O(n)。int LastRemaining(unsigned int
2015-10-08 11:18:16
671
原创 扑克牌的顺子
题目:从扑克牌中随机抽取5张牌,判断是不是一个顺子,即这5张牌是不是连续的。2~10为数字本身,A为1,J为11,Q为12,K为13,而大、小王可以看成任意数字。方法:首先把数组排序,再统计数组中0的个数,最后统计排序之后的数组中相邻数字之间的空缺总数。如果空缺的总数小于或者等于0的个数,则这个数组就是连续的,反之不连续。如果数组中的非0数字重复出现,也是不连续的。bool IsContinuous
2015-10-08 10:14:42
556
原创 n个骰子的点数
题目:把那个骰子仍在地上,所有骰子朝上一面的点数之和为s。输入n,打印出s的所有可能的值出现的概率。方法1:基于递归求骰子点数。n个骰子的所有点数的排列数为6n6^n。需要统计出每一个点数出现的次数,然后把每个点数出现的次数除以6n6^n就能求出每个点数出现的概率。int g_maxValue = 6;void PrintProbability(int number){ if (number
2015-10-07 23:15:13
387
原创 翻转单词顺序 VS 左旋转字符串
题目1:输入一个英文句子,翻转句子中单词的顺序,但单词内字符的顺序不变,标点符号和普通字母一样处理。 例如输入”I am a student.”, 则输出”student. a am I”。方法:第一步翻转句子中所有的字符,第二步翻转每个单词中字符的顺序。void Reverse(char* pBegin, char* pEnd){ if (pBegin == NULL || pEnd ==
2015-10-07 22:50:35
432
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人