
工具使用
文章平均质量分 88
技术修行
人生如梦,技术无边,愿做行僧,修得真谛。
展开
-
Featuretools介绍
Featuretools的介绍1、简要介绍 Featuretools是一个执行自动特征工程的框架。它擅长于为深度学习把互相关联的数据集转换为特征矩阵。2、快速开始 下面是一个使用DFS(深度特征综合体 Deep Feature Synthesis)来实施自动化特征工程的例子。在这个例子中,我们应用DFS到一个由时间戳客户事务组成的多维表数据集。翻译 2017-11-17 22:35:47 · 7954 阅读 · 1 评论 -
知识图谱的neo4j使用版本的问题
neo4j使用的版本有社区版,企业版,区别的介绍。从功能的角度这两者在功能上没有本质区别。主要区别是如下几点:1、容量:社区版最多支持 320 亿个节点、320 亿个关系和 640 亿个属性,而企业版没有这个限制;2、并发:社区版只能部署成单实例,不能做集群。而企业版可以部署成高可用集群或因果集群,从而可以解决高并发量的问题;3、容灾:由于企业版支持集群,部分实例出故障不会影响整...原创 2019-03-24 14:24:13 · 5055 阅读 · 0 评论 -
Text2image 文本到图像的合成
文本到图像合成 用Thought Vectors这是一个为从描述合成图像的tensorflow实现,用的是Skip Thought Vectors模型。基于DCGAN(tf版本)来构建的。所使用的图像是GAN-CLS算法所使用的图像数据。依赖;-Python 2.7.6-Tensorflow-h5py-Theano : for skip thought vectors-scikit-learn :...翻译 2018-05-19 11:13:42 · 5851 阅读 · 1 评论 -
使用jTessBoxEditorFX进行ocr训练的实际操作步骤
使用jTessBoxEditorFX进行ocr训练实际的操作步骤如下。先把训练用样本图像准备好。1、打开 jTessBoxEditor ,选择 Tools -> Merge TIFF,打开对话框,选择训练样本所在文件夹,并选中所有要参与训练的样本图片,注意对话框中“文件类型”的选取png2、之后有打开对话框,输入“chi_my.font.exp0.tif”,格式为tiff。其中chi_my可...原创 2018-04-06 18:33:02 · 5437 阅读 · 5 评论 -
python下wordpdf转换总结
python下wordpdf转换总结 近期涉及到了关于doc文档读取的处理,也查了很久,为了便于大家使用,故集大成一下。Doc文档读取有如下几种:1、从doc读取文本 目前没有找到直接的方式,一般是先转为docx文件在处理。所使用工具为doc2doc(批量时可用),或人工另存处理。 还有可以用antiword(依赖linux环境),使用“./antiword” + doc文件名即可读取文件...原创 2018-03-30 09:56:29 · 873 阅读 · 0 评论 -
tesseract-ocr的完整安装及使用
在感兴趣的图像中文字识别处理上,个人发现一些教程都不完整。需要东找西找才能拼凑出来。故此次梳理了下windows上安装完整记录,在应用上是采用python编程。 首先前提下载相关packages。包括有tesseract-ocr的windows安装版(tesseract-ocr-setup-3.05.01),Pillow、pytesseract。还有tesseract-ocr的中文字体chi_...原创 2018-03-11 10:16:53 · 13218 阅读 · 1 评论 -
open3d的例程2
KDTreeOpen3D使用FLANN来快速创建KDTrees。#src/Python/Tutorial/Basic/kdtree.py import sysimport numpy as npsys.path.append("../..")from py3d import * if __name__ =="__main__": print("Testing kdtree in py3d....翻译 2018-03-03 13:35:28 · 3650 阅读 · 0 评论 -
open3d例程
Open3D是一个可以支持 3D数据处理软件快速开发的开源库。简要介绍下其例程。综合场景Open3D能集成所有RGB-D图像到单一TSDF volume,压缩为一个mesh。输入参数if __name__ =="__main__": parser =argparse.ArgumentParser(description= "integrate the whole RGB...翻译 2018-03-03 13:33:20 · 9832 阅读 · 1 评论 -
python下wordpdf转换总结
近期涉及到了关于doc文档读取的处理,也查了很久,为了便于大家使用,故集大成一下。Doc文档读取有如下几种:1、从doc读取文本 目前没有找到直接的方式,一般是先转为docx文件在处理。所使用工具为doc2doc(批量时可用),或人工另存处理。 2、从docx读取文本 一般使用python-docx库的方法,但只支持创建新文档和读取一些基本的文件数据,如文件大小和文件标...原创 2018-02-26 17:23:07 · 2057 阅读 · 0 评论 -
labelme的使用及问题解决
个人在试验mask-rcnn的过程中使用labelme进行标注,使用中遇到了如下问题: Unable to save: 'bytes' object has no attribute 'encode' 这个是在windows上python3上遇到的问题。需要修改代码,网上有怎么对应的方法,但没有提供现成的可用代码,故我修改后验证可用,然后共享出来,不用大家每次都去修改。共享的代码...原创 2018-02-11 17:21:33 · 10528 阅读 · 1 评论 -
为猪脸识别而进行自己数据集的构建、训练
在实际过程中走了弯路,特地进行说明记录,以备今后参考。思路是先构建VOC2007格式的猪脸数据集,在转换成tf格式,然后利用tf的objectdetectionapi进行训练。原因是把2种构建方式都熟悉一遍,并把所有流程过一遍。1、构架VOC2007格式的猪脸数据集前提:在某个目录下建立如下关系的子目录。原创 2017-12-13 22:29:53 · 7953 阅读 · 17 评论 -
使用opencv_python进行视频分析遇到的bgsegm问题
近期在使用opencv_python分析视频过程中总是遇到各种问题,如cv2.cv2的问题、还有使用opencv_python操作视频处理类的需求时总是遇到has no attribute 'bgsegm'等问题。从网上找了但缺少完整的说明,故特地说明下。遇到has no attribute 'bgsegm'等问题,说明安装的opencv_python版本需要更新了,或者没有安装c原创 2017-11-22 21:31:24 · 5800 阅读 · 2 评论 -
DSOD的安装介绍
DSOD:学习型深度监督对象检测器(来自scratch) 代码是基于SSD框架的(https://github.com/weiliu89/caffe/tree/ssd)。Introduction介绍 DSOD关注来自scratch的训练目标检测器(没有在ImageNet上的预训练模型时)的问题。以我们最好的经验来看,优先的事是从scratch用已有技翻译 2017-11-18 21:30:07 · 1463 阅读 · 0 评论 -
OpenPose的安装
从网上看到了OpenPose的介绍,感觉是好东西,虽然目前硬件不满足其要求,不能验证。但此次先把安装过程翻译了,以备后用。OpenPose的安装:操作系统支持Ubuntu 14 and 16.Windows 8 and 10.Nvidia Jetson TX2,安装指南参见doc/installation_jetson_tx2.md.翻译 2017-11-14 11:15:29 · 14360 阅读 · 7 评论 -
python 爬虫列表
Python爬虫开源项目代码,爬取微信、淘宝、豆瓣、知乎、新浪微博、QQ、去哪网等 代码整理转自https://www.cnblogs.com/liuyanpeng93/p/7710719.html整理了32个Python爬虫项目。整理的原因是,爬虫入门简单快速,也非常适合新入门的小伙伴培养信心。所有链接指向GitHub,祝大家玩的愉快1、WechatSogou [1]– 微信公众号爬...转载 2019-04-18 22:15:31 · 888 阅读 · 0 评论