
代码知识积累
侠客儿青争ing
这个作者很懒,什么都没留下…
展开
-
bert tokenizer
参考:https://blog.youkuaiyun.com/u011984148/article/details/99921480原创 2020-09-29 21:26:17 · 1150 阅读 · 0 评论 -
tf2保存加载模型
第一 官方可以直接保存整个模型,将模型保存为HDF5文件# 创建模型实例model = create_model()# 保存模型到HDF5文件model.save('my_model.h5')# 读取模型model = keras.models.load_model('my_model.h5')第二 自定义当出现报错得时候 – NotImplementedError: Saving the model to HDF5 format requires the model to be a F原创 2020-09-24 22:00:37 · 1657 阅读 · 0 评论 -
python读写
很全转载 2020-09-07 17:07:47 · 99 阅读 · 0 评论 -
Word2Vec原理+代码
代码方面据说有两种方法使用word2Vec gensim应该是比较常用的Gensim中 Word2Vec 模型的期望输入是进过分词的句子列表,即是某个二维数组原理方面:两个模型:总而言之就是这样的在CBOW和skip-gram讲解完成后,我们会发现Word2Vec模型是一个超级大的神经网络(权重矩阵规模非常大)。举个例子,我们拥有10000个单词的词汇表,我们如果想嵌入300维的词向量,那么我们的输入-隐层权重矩阵和隐层-输出层的权重矩阵都会有 10000 x 300 = 300万个权重,原创 2020-09-05 21:06:11 · 256 阅读 · 0 评论 -
python jieba库
概述:作用:中文文本进行分词 得到单个词语 时用到的第三方库原理:在中文词库 得出汉字之间关联的概率, 形成词组分割使用:参考原创 2020-09-05 17:03:56 · 146 阅读 · 0 评论 -
text.Tokenizer:文本与序列预处理
转载转载 2020-09-01 21:59:17 · 200 阅读 · 0 评论 -
python format函数
转载 format解析笔记转载 2020-08-31 09:58:24 · 131 阅读 · 0 评论 -
python class函数解释
init()是Python中的构造函数,构造函数用于初始化类的内部状态,为类的属性设置默认值。两个下划线开头的函数是声明该属性为私有,不能在类的外部被使用或访问。_init__函数(方法)支持带参数类的初始化,也可为声明该类的属性(类中的变量)。__init__函数(方法)的第一个参数必须为self,后续参数为自己定义。call函数call()的本质是将一个类变成一个函数(使这个类的实例可以像函数一样调用)class A(object): def __init__(self, nam原创 2020-08-31 08:52:34 · 5768 阅读 · 0 评论 -
python正则 知识积累
re.sub()用法re.sub(pattern, repl, string, count=0, flags=0)pattern:被替换的部分–正则表示内的字符串repl:替换成什么string:被替换的完整字符count:(可选参数)模式匹配后替换的最大次数,默认0表示替换所有的匹配flags:可选参数,表示编译时用的匹配模式(如忽略大小写、多行模式等),数字形式,默认为0。实例:#单个匹配re.sub(r'[0-9]','*',s) 将每一个数字替换为一个星号re.sub(r'原创 2020-08-30 11:23:35 · 206 阅读 · 0 评论