技术
文章平均质量分 56
WiseDoge
未来的IT民工
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
用Python写一个文本转HTML的脚本
在 实验楼 上看的,自己看了一下感觉用处很大,代码也不难懂,特分享一下。给定一个.txt文件,将其转换成HTML网页。我们先来编写代码:#!/usr/bin/python# encoding: utf-8#util.pydef lines(file): """ 生成器,在文本最后加一空行 """ for line in file: yield转载 2016-04-10 21:03:04 · 7602 阅读 · 2 评论 -
一个简单的分布式的知乎爬虫
源代码地址:https://github.com/WiseDoge/ZhiHu_Spider一个分布式的网络爬虫,用于抓取知乎的用户详细信息,包括用户名、行业、位置、毕业院校、介绍、关注者、关注人等。 原理主机 负责分发任务。从起始位置开始,将当前用户的所有关注者提取出来,并压入Redis任务队列,然后随机的进入到其中一个关注者的主页,递归上述操作。 从机 负责抓取网页。连接至Redis原创 2016-09-16 22:23:45 · 4945 阅读 · 0 评论 -
用Python实现代理池(Proxy Pool)系统
项目的代码在这里:https://github.com/WiseDoge/ProxyPool 跨语言高性能IP代理池,Python实现。 注意:请运行程序前先更新一下抓取代理的函数。运行环境Python 3.5(请务必保证Python的版本在3.5以上,否则异步检验无法使用。)Redis Redis官网并没有提供Windows的安装版,Windows用户可以点击此处下载一个我自己编译原创 2017-03-07 18:45:23 · 11883 阅读 · 2 评论 -
BP神经网络的Python实现
测试代码和更多机器学习算法详见 https://github.com/WiseDoge/ML-by-Pythonimport numpy as npclass BPNetWork(object): """ 全连接神经网络,采用BP算法训练。 """ def __init__(self, layers, act_func='tanh'): """原创 2017-03-06 21:59:37 · 1474 阅读 · 0 评论 -
CART决策树的Python实现
完整的代码请见:https://github.com/WiseDoge/ML-by-Pythonfrom collections import defaultdictimport numpy as npclass TreeNode(object): """决策树节点""" def __init__(self, **kwargs): ''' attr_原创 2017-02-25 12:39:30 · 3129 阅读 · 0 评论 -
支持向量机(SVM)算法的Python实现
支持向量机(SVM)算法的Python实现更多机器学习算法的实现,详见 https://github.com/WiseDoge/ML-by-Pythonimport numpy as npclass SVC(object): """ 支持向量机(Support Vector Machine)二分类器, 默认的核函数是 多项式函数。 使用时,正类用1表示,负类用-1表原创 2017-02-25 12:36:00 · 5139 阅读 · 1 评论 -
常见机器学习算法的Python实现
内容K近邻算法感知机朴素贝叶斯分类器决策树(Decision Tree)随机森林(Random Forests)支持向量机(Support Vector Machine)线性回归(Linear Regression)逻辑斯蒂回归(Logistic Regression)Bagging算法神经网络(BP算法)隐马尔科夫模型(HMM)K-Means聚类算法LVQ聚类算法主成份分析法(PCA)原创 2017-02-25 08:45:24 · 1879 阅读 · 0 评论 -
利用爬虫抓取百度贴吧的图片
「近年来,百度贴吧已经成为一些同学生活中必不可少的一部分,利用空闲时间刷刷贴吧、看看帖子也成为一些人的日常。同学们经常会遇到这样一个问题,有一个图片帖,帖子中有大量自己喜欢的图片(如http://tieba.baidu.com/p/3242594565),于是便想把图图片保存到自己的电脑上以便以后之需,可是由于一个帖子中的图片实在太多(多达几百张),逐张保存非常耗费时间和精力,这时大家就希望有一种原创 2016-04-08 22:11:50 · 2041 阅读 · 2 评论 -
KD-Tree 算法的 C++ 实现
阅读本文前,建议查阅相关资料,了解 KNN 算法与 KD 树。基础知识如图所示,假设一个点 a 目前的最近邻点为 b,如果存在相对于 b 离 a 更近的点,那么这个点一定在以 a 为圆心,ab 为半径的圆内。 现右侧的区域是未知的,如果 a 到分界线的距离 l 大于目前的最近距离 L(圆半径),则没有必要在右侧的未知区域继续寻找最近邻点(如图一),反之,则要继续寻找(如图二)。 相应的,投射到多转载 2017-12-21 10:15:31 · 3727 阅读 · 1 评论
分享