小红书图片-无水印批量下载


从 Network 获取图片的地址


图片是有水印的


无水印图片地址拼接
https://ci.xiaohongshu.com/ + fileId


从网页源代码中获取包含图像信息的 script


取出里面符合转化为 json 格式的数据
从而遍历出图像 fileId 
    imageList = re.findall('"imageList":(.*?),"cover"', response.text)[0]
    json_data = json.loads(imageList)
    pprint.pprint(json_data)
    print(type(json_data)) 


可以看到 4 张图片对应的 fileId 如下 



拼接地址后的无水印图片


获取笔记所有图片
python test_xiaohongshu.py https://www.xiaohongshu.com/discovery/item/63737a170000000024012228


获取首页所有图片
python test_xiaohongshu.py https://www.xiaohongshu.com/user/profile/5aa7eaa14eacab296b9c80c2



评论

此博客中的热门博文

Twitter视频下载地址分析