
python
文章平均质量分 78
lsr40
菜鸡一个,还请见谅
展开
-
【python】爬虫篇:python连接postgresql(一)
本文记录一下最近在做的事情,会把思考过程和解决问题的方案写出来。当然,由于本人技术有限,所以可能并不是最好的方案,还请大家见谅!(黑猫白猫只要抓到老鼠,不就是好喵?~)前言:事情是这样的,有一些文章,我要根据文章内容做分类,具体怎么分我会单独开一篇文章来讲这件事情,这篇文章的重点不是分类,而是分类前的准备!1、已有的东西:手头上有一些文章的url(这里就不说是什么平台了,避嫌)存在数据...原创 2018-10-25 14:20:54 · 8227 阅读 · 2 评论 -
【python】爬虫篇:python对于html页面的解析(二)
我,菜鸡,有什么错误,还望大家批评指出!!前言:根据自己写的上一篇文章,我继续更第二部分的内容,详情请点击如下链接【python】爬虫篇:python连接postgresql(一):https://blog.youkuaiyun.com/lsr40/article/details/83311860本文主要介绍了python通过bs4(BeautifulSoup)和xpath两种方法来获取爬到的...原创 2018-10-29 15:22:25 · 36263 阅读 · 2 评论 -
【python】结巴分词案例(英文词组识别)
本人菜鸡一只,今天来写写结巴分词!哇,距离上一次写文章已经20天过去了,最近这些天还真是挺忙的,主要是上上周到了跑月数据的节点,然后上周原始数据出了问题,我调了一周多才把这个错误解决了,还修复了一个隐藏的小bug在这里提醒下自己,用任何表在做关联的时候一定要好好检查,关联键是不是唯一的,否则会数据倍增!!其实在这一段时间里,还是有一点点自己学习的。首先整理了ES的一些API,还...原创 2019-09-25 17:25:34 · 10109 阅读 · 7 评论