
python
dabingsun
这个作者很懒,什么都没留下…
展开
-
python yield
yield: 较少内存消耗#定义def get_batch_data(self, data_x, data_y, batch): #会丢弃最后少部分的数据 steps = len(data_y) // batch for step in range(steps): batch_x, batch_y = [], [] batch_x = data_x[step*batch:(step+1)*batch]原创 2020-08-05 19:49:44 · 276 阅读 · 0 评论 -
python 字典排序
dict_ = {"key1":value1, "key2":value2, "key3":value3}#sorted(items(), key, reverse) reverse:True降序 False:升序dict_order=sorted(dict_.items(),key=lambda x:x[1],reverse=True)原创 2020-07-24 18:59:41 · 215 阅读 · 0 评论 -
python codecs
预留原创 2020-06-20 17:34:10 · 149 阅读 · 0 评论 -
运算效率(时间):pyhton 原生List和numpy的array比较
目录Numpy arraypython List运算时间Numpy array一个numpy array 是内存中一个连续块,并且array里的元素都是同一类(例如整数)。所以一旦确定了一个array,它的内存就确定了,那么每个元素(整数)的内存大小都确定了(4 bytes)。使用numpy内置函数计算数值型数据时,要比原生List快。python Listlis...原创 2020-04-02 15:52:35 · 1317 阅读 · 0 评论 -
数据增强之回译+EDA
目录数据增强回译EDA参考: EDA_Github 数据增强对训练数据的一种数据另类采样方式,目的是加强样本总体的数量和质量,也可以认为加入了噪音,目的是防止模型过拟合和提升模型的性能。在NLP领域,数据增强的研究较少,目前较稳定的和常使用的两种方式是回译和EDA(Easiest Data Augmentation)。回译使用翻译的方式,对源文本进...原创 2019-11-25 09:11:45 · 2894 阅读 · 0 评论 -
python 下载网络资源(针对压缩文件)
在做训练的时候需要调用预训练好的模型,模型存储在远程服务器上,需要在运行前下载到本地然后调用。需要使用到urllib模块,如果未安装,则需要在安装环境中使用如下命令安装pip install urllib调用下载模块:import osimport urllibimport sys#远程下载链接url='http://hello/download.zip'#下载到本地...原创 2019-11-20 20:53:52 · 1325 阅读 · 0 评论