搜狗微信临时链接的转换

最新推荐文章于 2024-01-08 14:38:28 发布

原创最新推荐文章于 2024-01-08 14:38:28 发布 · 置顶 · 2.9k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#python微信爬虫 #python微信公众号文章 #python微信文章转链接 #微信文章链接转换

python 同时被 3 个专栏收录

2 篇文章

订阅专栏

1 篇文章

订阅专栏

1 篇文章

订阅专栏

搜狗微信临时链接的转换

本文主要叙述的是如何获取搜狗微信的链接并转换成永久链

本文主要叙述的是如何获取搜狗微信的链接并转换成永久链

最近一直研究微信文章的爬取，这里是我总结的一些方法。

目前获得微信公众号文章最佳的路径就是搜狗微信，这大大减少了爬虫的工作量，但是搜狗微信上面的链接是临时的，需要我们去对链接进行转化，让然，如果只是获取一次文章，可以直接爬取，如果需要永久保存，就少不了对链接的转换。这边我提供两种方法。

对搜狗微信的分析

我们进入搜狗微信的主页查看源码发现有两个链接，
这里的链接是临时的，有效访问时间也就是几个小时的时间，

这里还有个分享链接，但是搜狗已取消了分享按钮，但是字段依然存在，

分享的链接的时效会久一点，但是也不是永久的，这个链接每次访问都会返回一个新的临时链接。

获取uin和key来转换永久链接

目前网上给的方案是通过这两个字段进行访问处理临时链接：
但uin和key又是什么？
uin：微信用户唯一标识。（这就意味着如果访问过于频繁可能被封号）
key：转换临时链接到永久链接的凭据，分为公众号key（仅对当前公众号下的文章有效），万能key（可用于任何公众号的转换），有效期约为40分钟~2小时。
通过fiddler我们可以抓取uin和key，但是这样的方法具有一定的局限性，不适合大规模的试用，如果只是学习可以尝试进行抓包处理。
这大大地加大了成本，所以并不推荐使用这种方法。

通过模拟浏览器然后安装插件获取永久链接

项目源码：https://github.com/yeyuzhao/weixin_article_spider，如果可以请帮我点个小星星。

我们先访问搜狗首页，分析各个类目的url规则，提取分享搜狗微信链接url。（目前各个类目只可以查看十四五页这样，比较具有局限性，如果进行搜索也只可以拿到前十页的数据）
然后根据获取到的url，进行浏览器模拟访问，加载西瓜插件，每次请求网页，西瓜插件都会返回永久链接。
在浏览器启动就加载插件：

用抓取到的分享url进行访问：
js的加载可能会有一定的延时，所以需要控制速度。通过左侧的插件我们可以发现除了阅读量还有热度分析和推荐文章查看源码我们可以发现

在这里插入图片描述
原链接是：http://weixin.sogou.com/api/share?timestamp=1564983001&signature=qIbwYnI6KU9tBso4VCd8lYSesxOYgLcHX5tlbqlMR8N6flDHs4LLcFgRw7FjTAOR9o10ANaKDMEchDmiGRDczmJWZPZyHi9AfJQ1KPvSpW04ymo38yYFtIonENAOsPjlGv9PJ4b90lCqeq5IFG803gviL5slc9F90OikALrf65S5C-yXnwBItTIOUuRm9E4Fjbox5zrNQLg0QpF1LE1GmsrSZ3SL5-0muXkNk=
微信永久链接（长链接）：http://mp.weixin.qq.com/s?__biz=MzAxMDU0MDYwMQ==&mid=2653021489&idx=1&sn=09d858882e821b63368cd9b92ae83b7e&chksm=809b8667b7ec0f71242aeacbfadd8f7fb86acac058f3416b34d95b21549c5b1baaab4da3635e&scene=27#wechat_redirect

如果在搜狗微信里进行搜索，访问会出现ip报错，其实并不是真正的检测出ip问题，而是正常请求时他会触发一个js时间，然后组成一个新的url，我们请求的url是一个问题url，所以最佳的解决方案就是拿分享链接，进行访问，按上面的步骤提取出永久链接就ok了。
综上，就是处理搜狗微信文章链接的办法，感谢大家的阅读。
祝大家好运！

博客等级

码龄7年

2
原创

1
点赞

10
收藏

1
粉丝

关注

私信

热门文章

分类专栏

python 2篇
微信 1篇
公众号 1篇
文章 1篇
转链接 1篇
linux 1篇
crontab 1篇
model
module 1篇

展开全部收起

下一篇：: crontab找不到模块

最新评论

搜狗微信临时链接的转换
著名北漂胖大海: 现在没有分享链接了用上插件也不是每个都能转换成功永久地址是哪里出了问题？
搜狗微信临时链接的转换
weixin_45076146: 现在链接是这样的https://weixin.sogou.com/link?url=dn9a_-gY295K0Rci_xozVXfdMkSQTLW6cwJThYulHEtVjXrGTiVgS3Dc2Zld3265K0-hLgJ4dVJf3cAPr6BQKlqXa8Fplpd9de6ou4FK9q7hEtxE41g1auLNkQ11anK_AYZJtyPo-5c61MUQ4-xeuQi4sPfKbUfHtj2H9NcsfWeOUh6Yh7V0BBAShVxS0jnort8dIolRvELbSA0nAvwSdOLnN7VXP49UIzJEJowT8o8rdJ5i8eQzEe8U8OVPbWFXudTCzgeo0JYY-UZGbO56rA..&type=1&query=南京航空航天大学，应该怎么办啊

最新文章

crontab找不到模块

目录

展开全部

收起

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。