采集/下载小视频
操作流程
- 分析页面
- 抓取页面
- 抓取小视频
- 保存小视频
比如抓取pearvideo网站的视频
选取要抓取的页面https://www.pearvideo.com/popular
,分析此页面的视频,通过点击页面的链接知道视频的页面https://www.pearvideo.com/video_1707347
然后抓取小视频,下载保存小视频
通过以上分析不难得出
- 每一页的获取是通过
https://www.pearvideo.com/popular_loading.jsp?reqType=1&categoryId=&start=20&sort=15&mrd=0.24415926264194443
- 视频的获取是通过
https://www.pearvideo.com/video_1707347
页面的ajax请求https://www.pearvideo.com/videoStatus.jsp
来获取视频的参数 - 分析视频的参数获得视频的地址,这里注意一个地址的更换,假地址:
https://video.pearvideo.com/mp4/adshort/20201117/1605695463779-15486835_adpkg-ad_hd.mp4
真地址:https://video.pearvideo.com/mp4/adshort/20201117/cont-1707347-15486835_adpkg-ad_hd.mp4
最后示例代码如下
|
|
知识点汇总
- 正则的使用
re.findall
re.sub
- requests的使用,尤其是
headers
params
- requests的json处理,
response.json()
- request的二进制数据处理,
response.content