
python
sand_clock
向前看
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python爬虫爬取糗事百科的段子
问题场景之后的项目需要爬虫抓取一些信息,找个例子练练手,特此记录。环境介绍Windows Python2.7 IDEA15通用抓取流程本文思路1、给爬虫一个目标即网页地址及参数 2、设置一些必要的参数 3、抓取网页源代码 4、提取数据 5、保存数据(本文是保存在文件里,多数是存在数据库里)目标CODE#!/usr/bin/env python# -*- coding: UTF-8 -*原创 2017-09-25 18:16:26 · 484 阅读 · 0 评论 -
python requests post方式抓取公开数据-示例
问题场景最近的项目需要抓取一些公开的网站数据,本文利用Python3下的requests方法举一个简单例子。环境介绍Windows Python3.6 IDEA15 Chrome目标本文试图抓取一个公开网站下搜索到的数据:http://dbsearch.clinicalgenome.org/search/思路打开Chrome浏览器,输入网址输入查询条件,并点击按钮右键->检查->Elem原创 2017-12-26 19:37:36 · 6959 阅读 · 0 评论 -
python多线程带返回值案例
问题场景业务需要对网页进行PDF转换,用到了python的pdfkit模块。因报告是成批下来,每批几百例需要转换,为了加快报告生成效率,python里采用了多线程写法。笔者语言是java,所以利用了**Runtime.getRuntime().exec(cmd)**进行调用。环境:jdk8, python 2.7, ideaCODEimport threadingimport asti...原创 2018-10-31 16:17:16 · 2125 阅读 · 0 评论 -
java生成PDF的几种方法
问题场景总结一下用java生成PDF的方法:A、itext-PdfStamper pdfStamper(俗称抠模板)B、itext-Document document(正常代码撰写)C、wkhtmltopdf(使用工具)分析比较方法优点缺点A代码简单模板要先提供,且字段长度固定、不灵活B模板可根据代码调整、但样式不如C灵活要维护的后台代码较多C...原创 2018-12-28 17:24:44 · 146190 阅读 · 23 评论