Python爬虫入门教程 79-100 Python Portia爬虫框架-在Win7里面配置起来

最新推荐文章于 2024-04-30 18:30:22 发布

梦想橡皮擦

最新推荐文章于 2024-04-30 18:30:22 发布

阅读量2w

点赞数 6

CC 4.0 BY-SA版权

分类专栏：爬虫100例教程文章标签： python docker python爬虫入门教程 python爬虫教程 python爬虫

梦想橡皮擦-独家版权，禁止转载

本文链接：https://blog.youkuaiyun.com/hihell/article/details/108239023

爬虫100例教程专栏收录该内容

118 篇文章 ¥99.90 ¥299.90

订阅专栏

本文介绍了如何在Windows7上配置Portia可视化爬虫框架，包括安装Docker、设置虚拟目录、解决镜像下载速度慢的问题，以及启动Portia的详细步骤。过程中涉及到Docker Toolbox的使用和镜像加速器的切换。

写在前面

曾经有人问我，为何要写100篇关于爬虫的博客？我想说，因为吹牛吹过头了呗，100篇是真的难写。

希望在未来爬虫100例系列博客能在Python爬虫教学领域有那么一点点的位置。

今天开始，我将从一些成熟框架入手，继续提高你的爬虫知识面。

Portia是啥？

这个框架在最开始就计划写一下了，没想到拖到这里，Portia属于可视化爬虫，基本描述参照下述内容

Portia is a tool that allows you to visually scrape websites without any programming knowledge required. With Portia you can annotate a web page to identify the data you wish to extract, and Portia will understand based on these annotations how to scrape data from similar pages.

大意是：Portia是一个工具，它允许你在不需要任何编程知识的情况下可视化地抓取网站。看来是不用写代码就可以操作了，不过后面的实操告诉我，没那么简单~

github地址：https://github.com/scrapinghub/portia
文档地址：

了解本专栏

评论 43

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

梦想橡皮擦 如有帮助，来瓶可乐

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。