Python爬取腾讯视频评论的思路详解

2018年11月30日作者：画师-开言原文

一、前提条件

安装了Fiddler了（用于抓包分析）
谷歌或火狐浏览器
如果是谷歌浏览器，还需要给谷歌浏览器安装一个SwitchyOmega插件，用于代理服务器
有Python的编译环境，一般选择Python3.0及以上

声明：本次爬取腾讯视频里 《最美公里》纪录片的评论。本次爬取使用的浏览器是谷歌浏览器

二、分析思路

1、分析评论页面

我们很快就能发现 _=？的规律，它是从1576567187273加1。而cursor=？的规律看不出来。这个时候找到它的规律呢？

（1）百度一下，看前人有没有爬取过类型的网站，根据他们的规律和方法，去找出规律；

（2）羊毛出在羊身上。我们需要有的大胆想法——会不会这个cursor=?可以根据上一个JS页面得到呢？这只是很多大胆想法中的一个，我们就一个想法一个想法的试试。

我们就采用第二种方法，去js里面找。复制其中一个url为：

url = https://video.coral.qq.com/varticle/3242201702/comment/v2?callback=_varticle3242201702commentv2&orinum=10&oriorder=o&pageflag=1&cursor=6460163812968870071&scorecursor=0&orirepnum=2&reporder=o&reppageflag=1&source=132&_=1576567187273

去浏览器里面打开，在里面搜索一下此url的下一个url的cursor=？的值。我们发现一个惊喜！

总结

以上所述是小编给大家介绍的Python爬取腾讯视频评论，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对来客网网站的支持！
如果你觉得本文对你有帮助，欢迎转载，烦请注明出处，谢谢！