- 博客(11)
- 资源 (1)
- 收藏
- 关注
转载 java replace用法
如果不是刚刚复习了下正则表达式,我可能也不会注意到,原来String的replaceAll跟replaceFirst用到了正则表达式!不多解释,看代码:1234String s = "my.test.txt";System.out.println(s.replace(".", "#"));System.out.println(s.replaceAll(".", "#"));System.out.p...
2018-05-28 19:24:21
5239
1
原创 解决python 读中文文件时编码不正确的问题
path = "D:/tempData/sougou" #文件夹目录 files= os.listdir(path) #得到文件夹下的所有文件名称 new_line=[]for file in files: #遍历文件夹 if not os.path.isdir(file): #判断是否是文件夹,不是文件夹才打开 f1= codecs.open...
2018-05-28 14:49:43
1038
原创 seq2seq logits和labels维度不一致问题
在decode阶段,训练结果的维度通常由trainingHelper中的sequence_length指定。training_logits的shape为batch_size*target_sequence_length*decoder_embeding_size,其中第二维度是每批target数据的固定长度,embeding_size是转换后的解码层维度,即decoder_embed_input向...
2018-05-24 18:02:47
2499
1
原创 tensorflow打印内部张量
例如想知道seq2seq.dynamic_decode过程的输出结果1.training_decoder_output保存了dynamic_decoder过程的结果,其形式为tuple(rnn_output,sample_id) traing_logits获取了training_decoder_output中的rnn_output 用k1获取shape,k2获取具体traing_log...
2018-05-24 17:41:00
1063
原创 SyntaxNet算法原理—— Andor论文:基于转移的全局优化神经网络
1.原理简介1.转移系统 采用简单的前馈神经网络(无循环)进行转移状态的计算2.特征构造采用的Chen 和 Manning(2014)的方法3.引入CRF全局优化算法采用柱搜索的方式避免局部优化算法带来的标注偏置问题。基于CRF损失函数对神经网络参数执行全反向传播训练2.模型表示转移系统的定义 S(x)代表状态的集合 S+代表初始状态 A(s,x)代表已确定的决策集合 转...
2018-04-23 13:33:54
856
原创 tensorflow入门——基于mnist数据集
from minist import imput_dataimport tensorflow as tfmnist = imput_data.read_data_sets("MNIST_data/", one_hot=True)x=tf.placeholder(tf.float32,[None,784])#占位符,其中[None,784]表示列为784,行不定y_=tf.placehold...
2018-04-19 20:04:37
184
原创 对依存句法分析的理解
1.概念 依存句法分析通常通过依存弧连接句子中的两两词语,以表示其句法关系,最终形成能表示整个句子句法关系的依存树。 {h,m,l}表示一条连接弧,h(head)表示核心词,m(modifier)表示修饰词。l表示连接弧类型(修饰关系)。h--->m表明m修饰h 对于每个句子,只有一个词语是总核心词(根节点),定义一个伪词w0作为总核心词s的父节点,w0---...
2018-04-19 19:50:33
7706
原创 python 将两个向量合并为字典
#wordkey为键名称的列表 #wordvalue为键对应的值列表#使用dict()函数和zip()将两个列表合并为字典vecdict=dict(zip(wordkey, wordvalue))
2018-04-17 16:46:10
2135
原创 gensim word2vec把训练好的模型保存成txt
import gensimimport codecsfrom gensim.models import word2vecimport refrom gensim.corpora.dictionary import Dictionaryimport pickleimport loggingimport numpy as np# 引入日志配置logging.basicConfig...
2018-04-17 16:43:21
8927
5
原创 beutifulsoup find_all_next(limit=n)通过某标签定位紧邻的元素
在解析简历时,需要获取上一份工作的公司,思路是先定位’工作经验‘所在的标签,再找到工作经历下面的公司所在标签exp1=soup.select('span.title')for k in range(len(exp1)): if exp1[k].get_text()=='工作经验': exp2=exp1[k].find_all_next(limit=5)
2018-01-30 15:43:32
2019
原创 Beautifulsoup使用 find_all()、select()从网页标签中提取子元素
例如先找到 class='info'的元素,继续在内部获取元素内的文字:p1=soup.find_all('p',class_='info') for each in p1: txtlist=each.find_all('span') for eachs in txtlist: txtstr=eachs.string或
2018-01-30 15:31:52
24265
3
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人