Fiddler的应用-爬取b站视频评论

发布时间：2022-11-22 10:10:13人气：1502

在爬虫开发的过程中，一般情况下我们用浏览器自带的抓包工具即可完成分析，即按住F12后进入的开发者模式，但在开发者模式中，有些数据并没有抓得那么全，无法抓取到所有我们想要的数据，这个时候我们就要借助专业的抓包工具了，下面我们就用Fiddler抓取b站视频评论为例，简单讲解Fiddler的应用。

Fiddler 是一个 http 调试代理，它能够记录所有的你电脑和互联网之间的 http 通讯，Fiddler 可以也可以让你检查所有的 http 通讯，设置断点，以及 Fiddle 所有的 “进出” 的数据（如 cookie,html,js,css 等文件）。Fiddler 要比其他的网络调试器要更加简单，因为它仅仅暴露 http 通讯还有提供一个用户友好的格式。联系本站客服在网上下载安装即可，安装完成后打开的是这样的一个界面：

Fiddler的应用-爬取b站视频评论.png

打开b站视频评论区，发现评论同样是Ajax动态加载的，在加载出的数据中，发现一个名为main？csrf...的包，点击进去，在预览下的data中发现replies，点开后发现正是加载出的评论。

点开其中一条评论，发现在这个包中只提供了评论中可见的子评论，‘点击查看’的其他子评论获取不到，XHR中也没有捕获到新的包。

这个时候就该我们的Fiddler登场了，看看能不能抓到更多我们所需的包，打开Fiddler后，点击‘查看更多’，可以发现Fiddler会刷新出一组包，找到Host为api.bilibili.com的包，在浏览器的开发者模式中，我们可以发现评论是Json数据，所以选择api.bilibili.com包中的Json，在data中，我们打开replies，可以发现加载出的子评论。