
python
olahiuj
我的女朋友不抽烟不喝酒不傲娇不化妆不存在
展开
-
如何 收集 分析 优秀评论 学习 作文题目(误)
废话写在前面一切都要从一只蝙蝠说起。。正文“你们的作文标题,最好好好学习《renmin日报》的评论,很经典的”(语用:请给三个“好”字注音雾)考虑到评论比较多,就写了一个扒评论标题的东西,然后jieba分词、判断词性,对所得的标题模式去重计数之后按频率降序排序。当然结果不是特别理想,毕竟标题这个东西不太适合分词,太简洁了,就图一乐呵期间尝试了thulac和pkuseg,后面辣个好像装...原创 2020-03-16 20:01:35 · 403 阅读 · 0 评论 -
我的第一只Python爬虫
背景首先什么是爬虫网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。为了拓展视野、接触一些从未接触过的东西(废话),就有了这篇blog 难道你要我说我是闲得蛋疼来搞搞正咳咳,正题正题基础知识python(废话)urllib和urllib2 库的用法正则表达式挂逼一样的利器大概就是这样了顺便说一下原创 2016-08-04 12:32:42 · 504 阅读 · 0 评论 -
题库统计的小玩意_python
BG最近搞的一个扒学校题库的评测记录然后扔进数据库的小玩意,打算用matplotlib画个图统计一下玩一玩Code半成品import urllib2 as ubimport pymongoimport redef getPage(url): headers = {'User-Agent': 'Mozilla/5.0 (compatible; MSIE 5.5; Windows NT)'}原创 2016-12-22 20:21:41 · 364 阅读 · 0 评论 -
刷爆题库的小玩意_python
BGround抓网页什么的已经很熟♂练♂了,想要搞一搞模拟登陆了正题之前以前一直都是用urllib2的urlopen().read()开网页的,但是经常性的有UrlError这种神奇的错误(字面意思),搜了很久问了很久就找到了requests 调用的方法大概是import requestsresponse = requests.get(url, headers = headers)print原创 2016-12-24 12:02:58 · 1303 阅读 · 2 评论 -
抓取豆瓣2016年电影/分类_python
Description嗯,这次简单点 突然很想看电影,于是就抄起了python搞了一发豆瓣的电影年度清单,顺便统计了评分排名和分类之类的。还算简单吧 16年电影都在这个链接(大概)'https://movie.douban.com/j/search_subjects?type=movie&tag=%E7%83%AD%E9%97%A8&sort=time&page_limit=365&page_s原创 2017-01-20 22:53:44 · 1416 阅读 · 0 评论 -
微信 聊天 机器人 python itchat
正文调用itchat访问图灵机器人api聊天的小程序,应付一下过年的刷屏群发 之前搞的alice只能回英语,而且略呆傻 图灵api的key去注册账号就有了,网址戳这里 就是这样Code# -*- coding: utf-8 -*-import requests, jsonimport itchat, aiml, osfrom itchat.content import *@itchat.原创 2017-02-01 19:53:58 · 5143 阅读 · 3 评论 -
python pyaudio 百度语音识别api 图灵api 语音聊天机器人
最近有点颓,还是写写python缓解一下(不务正业xidea之前看到有拆笔记本屏幕做魔镜的觉得特别神奇,当时记得是要树莓派来着。现在自己搞搞发现百度的语音识别api还不错,加上以前注册的图灵ai大概也能搞个语音聊天机器人,主要还是笔记本上终于带了一个麦克风(哭泣然后搞搞就出来了;-P虽然写得略丑但是还是很有成就感的Code# -*- coding: utf-8 -*...原创 2018-02-12 17:40:57 · 5029 阅读 · 4 评论