《 评论区浓度查询器(测试版)》
网站入口:[http://39.108.80.241:8888/]
github:[https://github.com/Andl-Liu/FanCardStatisticsProject_WEB]
b站专栏: [https://www.bilibili.com/read/cv12295243]
主要功能:
- 统计b站视频评论区中粉丝装扮的数量与占比
- 生成b站视频评论区的词云图片
- 可通过滑块调整要统计的评论的时间段
使用方法:
进入网址,在搜索框中输入要查询的视频的BV号,点击一键查询,之后服务器会将评论区的数据爬取到数据库中,并在爬取完毕后跳转页面。为了防止b站反爬,我设置了每爬取500条评论后休息5s。
在展示页面中,上半部分为粉丝装扮统计,下半部分为词云,中间是一个滑块。可以通过点击中间的进度条来调整要统计的评论的时间段。
目前存在的问题:
- 数据库使用的是sqlite,并发性不太好,可能会出现锁数据库的情况,如若出现请等待后再次尝试
- 目前经我的测试,连续爬了4w条评论的情况下未被b站锁ip,但不能保证
- 界面太丑,我觉得这个其实是我这个小项目里最难的部分