一、分析音频下载相关链接地址

1. 分析专辑音频列表页面

  在 PC端用 Chrome 浏览器中打开 喜马拉雅 网站,打开 Chrome开发者工具,随意打开一个音频专辑页面,Chrome开发者工具中返回如下图结果:

Python 爬取喜马拉雅音频-LMLPHP

  经过分析专辑音频列表地址为

  其中:

  返回的页面内容是 json 格式,相比于 html 源码,json 还是很容易处理的,下载音频只需要用到如下参数:

2. 分析音频下载链接地址

  随意播放一个音频,在Chrome开发者工具中返回如下图结果:

Python 爬取喜马拉雅音频-LMLPHP

  经过分析专辑音频下载链接为

  其中

  返回的页面内容也是 JSON 格式,其中 tracksForAudioPlay 字段包含了音频的相关信息,其 src 就是音频下载地址。

二、编写代码

1. 安装相关依赖模块

  本程序使用 requests 访问 web 页面,因此需要安装 requests 模块

2. 编写代码

  提取专辑内的音频列表信息,如下:

Python 爬取喜马拉雅音频-LMLPHP

  提取音频下载地址,如下:

Python 爬取喜马拉雅音频-LMLPHP

  下载音频文件,如下:

Python 爬取喜马拉雅音频-LMLPHP

  完整源码:

Python 爬取喜马拉雅音频-LMLPHP

05-25 08:09