- 博客(66)
- 收藏
- 关注
原创 解决git多进程文件无法提交问题
问题描述:问题解决:找到出问题的项目的根目录下,进入.git文件夹找到index.lock文件 删除即可问题出现的原因:进程突然崩溃 资源被锁住 之后便无法使用提交
2020-10-10 16:15:05
231
原创 bert tokenizer
参考:https://blog.youkuaiyun.com/u011984148/article/details/99921480
2020-09-29 21:26:17
1145
原创 tf2保存加载模型
第一 官方可以直接保存整个模型,将模型保存为HDF5文件# 创建模型实例model = create_model()# 保存模型到HDF5文件model.save('my_model.h5')# 读取模型model = keras.models.load_model('my_model.h5')第二 自定义当出现报错得时候 – NotImplementedError: Saving the model to HDF5 format requires the model to be a F
2020-09-24 22:00:37
1653
原创 pytorch 运行项目出现错误 :WinError 5 拒绝访问 --- 解决办法
实际操作好使!! 就是把anaconda python 权限开到最高级 操作之后 运行流畅
2020-09-13 10:26:13
2314
原创 安装 pytorch
anconda 新建环境conda create --name pytorch python=3.6 anaconda#其中加入最后一项anaconda命令建立虚拟环境时,会同时安装例如Notebook、Numpy、Scipy、Matplotlib、Pandas等数据分析包,用户也可以不加,选择后续安装。 2. 激活新环境 activate pytorch 3. 安装pytorch 打开[官网](https://pytorch.org/)得到安装代码 conda install pyto.
2020-09-08 20:08:39
354
原创 错误解决:FutureWarning: Passing (type, 1) or ‘1type‘ as a synonym of type is deprecated; in a future ver
出错原因 numpy版本太高解决方法一:直接 pip install numpy==1.16.0解决方法二:pycharm改设置第三种方法 :
2020-09-07 15:14:05
1355
原创 记录 自制闲聊机器人baseline
step:1:制作一个可以运行的baseline选择数据集处理数据集清洗语料–切割、正则化、向量化–统一格式、构建问答预料模式—问句 答句拆分保存模型系列文章目录提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加例如:第一章 Python 机器学习入门之pandas的使用提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结前言提示:这里可以添加本文要记录
2020-09-07 10:47:52
149
原创 Word2Vec原理+代码
代码方面据说有两种方法使用word2Vec gensim应该是比较常用的Gensim中 Word2Vec 模型的期望输入是进过分词的句子列表,即是某个二维数组原理方面:两个模型:总而言之就是这样的在CBOW和skip-gram讲解完成后,我们会发现Word2Vec模型是一个超级大的神经网络(权重矩阵规模非常大)。举个例子,我们拥有10000个单词的词汇表,我们如果想嵌入300维的词向量,那么我们的输入-隐层权重矩阵和隐层-输出层的权重矩阵都会有 10000 x 300 = 300万个权重,
2020-09-05 21:06:11
254
原创 python jieba库
概述:作用:中文文本进行分词 得到单个词语 时用到的第三方库原理:在中文词库 得出汉字之间关联的概率, 形成词组分割使用:参考
2020-09-05 17:03:56
142
原创 python class函数解释
init()是Python中的构造函数,构造函数用于初始化类的内部状态,为类的属性设置默认值。两个下划线开头的函数是声明该属性为私有,不能在类的外部被使用或访问。_init__函数(方法)支持带参数类的初始化,也可为声明该类的属性(类中的变量)。__init__函数(方法)的第一个参数必须为self,后续参数为自己定义。call函数call()的本质是将一个类变成一个函数(使这个类的实例可以像函数一样调用)class A(object): def __init__(self, nam
2020-08-31 08:52:34
5757
原创 python正则 知识积累
re.sub()用法re.sub(pattern, repl, string, count=0, flags=0)pattern:被替换的部分–正则表示内的字符串repl:替换成什么string:被替换的完整字符count:(可选参数)模式匹配后替换的最大次数,默认0表示替换所有的匹配flags:可选参数,表示编译时用的匹配模式(如忽略大小写、多行模式等),数字形式,默认为0。实例:#单个匹配re.sub(r'[0-9]','*',s) 将每一个数字替换为一个星号re.sub(r'
2020-08-30 11:23:35
202
原创 pip安装 time out
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple 库名
2020-08-26 15:51:29
153
原创 win10解决tensorflow2.0命令行导入成功,pycharm导入失败问题
会出现这样的原因是 pycharm没有配置好环境 未使用下载了tf的环境解释器 我是在anaconda新建子环境 tf2 因此要导入conda解释器 操作如下 成功解决
2020-08-14 09:40:21
601
原创 win10安装两个版本 tensorflow
安装两个版本方法:1.先设置一个虚拟环境 conda create -n tensorflow2.02.在此环境下使用conda命令安装(我一开始用的pip命令 总出错)conda install tensorflow==2.0.0重复以上操作可安装不同版本(我电脑原来有1.9版本的 新安装的2.0.0版本)安装遇到的问题:问题一:.AttributeError: module ‘tensorflow’ has no attribute 'compat‘问题原因:tensorflow 与ten
2020-08-01 12:16:18
1397
原创 文本分类ML
import pandas as pdimport osos.chdir(r'C:\Users\lujing\Desktop\NLP两周实践')train=pd.read_csv('train_set.csv',sep='\t')train.shape(200000, 2)train.head(10) label text 0 2 2967 6758 339 202
2020-07-24 22:26:49
820
原创 CountVectorizer()参数详解
CountVectorizer(input='content', encoding='utf-8', decode_error='strict', strip_accents=None, lowercase=True, preprocessor=None, tokenizer=None, stop_words=None, token_pattern='(?u)\b\w\w+\b', ngram_range=(1, 1), analyzer='word', max_df=1.0, min_df=1, ma
2020-07-23 15:25:33
4998
2
原创 NLP_代码表示文本向量
第一种表示方式 Count 次数from sklearn.feature_extraction.text import CountVectorizercorpus = [ 'This is the first document . ', 'this document is the second document.', 'the last one']vectorizer = CountVectorizer()vectorizer.fit_transform(corpus)
2020-07-23 15:12:23
278
原创 ML_7项目实践
预测模型项目模板—可以分为 分类 与 回归理解数据的时候 数据可视化的时候 多问几个问题准备3~5个准确度足够的算法优化-调参 找最好模型序列化 ---- 是 同一个模型然后 有新数据的时候继续以此训练大致总结技巧快速执行一遍某些流程要循环尝试每一个步骤–: 在模板的每一个步骤尝试做点什么,虽然直接可能不能提高准确度啥的 但是蝴蝶效应,可能之后的步骤便会因此 曲折...
2020-07-22 16:29:54
103
原创 文本分类_打卡2_数据分析
import pandas as pdimport osos.chdir(r'C:\Users\lujing\Desktop\NLP两周实践')train=pd.read_csv('train_set.csv',sep='\t')train.shape(200000, 2)train.head(10) label text 0 2 2967 6758 339 202
2020-07-22 16:14:39
163
原创 cs224n_句法分析
句法分析分为句法结构分析和依存关系分析两种。以获取整个句子的句法结构为目的的称为完全句法分析,而以获得局部成分为目的的语法分析称为局部分析,依存关系分析简称依存分析。句法结构分析一般而言,句法分析的任务有三个:判断输出的字符串是否属于某种语言消除输入句子中词法和结构等方面的歧义分析输入句子的内部结构,如成分构成、上下文关系等第二三个任务一般是句法分析的主要任务。依存句法分析 :就...
2020-05-06 18:48:27
332
原创 python3.7 +Win10+1.9版本安装
最终参考链接:https://blog.youkuaiyun.com/qq_37249443/article/details/89174097安装tensorflow遇到很多问题 总结如下1:安装语句一直没找到 ----直接pip install ###即可2:安装了2.1.0版本 导入显示路径不对-----查百度说是最新的2.1.0默认下载的是gpu版本,所以又卸载了重下3:安装过程中显示很...
2020-04-27 12:23:03
332
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人