Skip to content

bilibili(B站)视频评论爬虫,爬取多级评论,用户信息,评论信息等内容

Notifications You must be signed in to change notification settings

sczzr/BilibiliCommentsCrawler

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Bilibili(B站)视频评论爬虫

​ 使用bilibili评论api爬取多个视频评论,能更快更全面的爬取数据,比Selenium爬取更快,避免浏览器崩溃的问题,不需要安装额外的驱动。

功能:

  1. 能够爬取到多个视频评论:将需要爬取的视频名字和对应的BV号填入 video_list.csv 即可,BV号可以从视频的网址中截取(例如BV1Pj411S7LW)

  2. 能够全面爬取评论和用户数据:能够爬取到一级评论和对应的二级评论,及评论相关数据(用户昵称、用户当前等级、用户性别、评论内容、被回复用户昵称、评论层级、评论点赞数量和回复时间)

  3. 保存的文件都在result目录下,并以视频名称命名。

安装:

requests是 一个用于发送HTTP请求的库,非Python标准库,需要额外安装。 安装方法:打开终端或命令提示符,输入以下命令:

pip install requests

爬取结果示例:

​ 输出结果是UTF-8格式,如果打开是乱码请更换打开方式(pycharm,记事本等)或者检查编码格式。

image

About

bilibili(B站)视频评论爬虫,爬取多级评论,用户信息,评论信息等内容

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%