
python开发
iSikai
这个作者很懒,什么都没留下…
展开
-
Pycharm远程调试服务器
最近每天调transformer,自己的显卡承受不了,需要链接远程服务器,但是写好再传到服务器比较麻烦,也没办法装图形化IDE。幸亏Pycharm提供了非常优秀的远程调试方法,和在本机操作没有任何区别。设置远程python解释器我们以新建项目为例,当它需求一个python解释器时,选择existing interpreter,点击旁边的…选择ssh interpreter,填写你的hos...原创 2020-04-21 15:59:42 · 634 阅读 · 1 评论 -
windows pycharm代码迁移到Linux服务器
前言最近实验吃紧,在用自己电脑训练的同时,也需要用机房电脑训练baseline,所以需要将运行在Windows下pycharm的代码迁移到Linux,主要需要做这两步:构建层次关系将\\改成/构建层次关系pycharm会自动修改python路径,建立层次关系/ex /data data.py /train main.py在pycharm中,可以在项目的任何地方(例如...原创 2020-03-17 23:37:03 · 1745 阅读 · 0 评论 -
优雅地使用批处理技巧大幅提升数据处理速度
假设,你遇到一份包含26万句子的数据集需要处理而处理速度仅仅为1it/s如果顺序执行,需要三四天的时间。一个解决办法就是,分而治之,分成n份并行执行,处理完之后再合并。具体流程如下:生成一个包含n个命令的批处理文件,例如可以发现,我们生成了一个批处理文件(windows:.bat,linux:.sh)...原创 2020-03-05 12:22:47 · 999 阅读 · 0 评论 -
Windows下安装使用Spacy英文库en_core_web_md,解决Warning: no model found for 'en_core_web_md'
spacy是一个强大的NLP数据处理工具,它使用二步的安装步骤:先安装spacy,再安装对应的语言包,但是第二步默认下载速度慢,手动安装常出问题。在Windows下安装,可以先使用conda安装spacy,注意不要像一些教程那样加上conda-forge的参数,这样会将你的下载源改成coda-forge,从而覆盖掉清华源。conda install spacy接下来是安装英文包,我是在这个...原创 2020-03-04 18:33:22 · 4333 阅读 · 5 评论 -
深度理解tf.gather和tf.gather_nd的用法
tf.gather和tf.gather_nd都是从tensor中取出index标注的部分,不同之处在于,gather一般只使用一个index来标注,而gather_nd可以使用多个index。例如:如何直观理解gather_nd的indices呢?在上例中,直观的理解就是,取出params中位于[0,0]和[1,1]处的tensor,放入index中对应的位置。换句话说,除去tenso...原创 2020-02-28 17:15:55 · 13665 阅读 · 1 评论 -
Tensorflow调试指南:tf.Print
TL;DRtf.Print(input,data)a=tf.Print(a,["value",a,"shape",tf.shape(a)])tensor a可以定义在代码的任意一个位置,只要在session.run时节点a有数据流过(否则你也不会想要debug它),data就会被打印到终端。Codeimport tensorflow as tfdef _test_(): w...原创 2020-02-28 11:39:39 · 1009 阅读 · 0 评论 -
Python List,Numpy和Tensorflow的加法运算符
a + b 对于Python List, Numpy 和Tensorflow的表现不同,这有时会导致一些困惑。List:拼接Numpy:element-wise plus要求a与b的size相同或者相容。Tensorflow:element-wiseList并不一定盛放数字,所以将+定义为element-wise plus是没意义的。...原创 2020-02-19 09:20:45 · 434 阅读 · 0 评论 -
[AllenNLP框架下工程化的AI实验01]以语言模型为例
摘要搭建语言模型,说明AllenNLP的疑点和潜规则。核心概念DataReaderVocabulary &NamespaceDataIteratorModelTrainerPredictor原创 2020-01-16 13:06:26 · 498 阅读 · 1 评论 -
解决一部分python FileNotFound问题:Python项目中的两个根目录
项目根目录显然是kglm-model-master,因此在allennlp的json配置文件里,应该这样填写在引入自己的package时同理但是如果在包内单个文件做单元测试,根目录是该文件所在目录。要访问到data文件夹则需要回退...原创 2020-01-13 15:41:13 · 428 阅读 · 0 评论