前言
嘿!一直在学习从没停下,最近的话一直没咋更新,因为小编也在忙着学编程~
哈哈哈,今天刚好有时间嘛 那就给学习爬虫的小伙伴儿更新一期简单的爬虫案例实战给大家啦!
很多人学习蟒蛇,不知道从何学起, 很多人学习python,掌握了基本语法之后,不知道在哪里寻找案例上手, 很多已经做了案例的人,却不知道如何去学习更多高深的知识, 那么针对这三类人,我给大家提供一个好的学习平台,免费获取视频教程,电子书,以及课程的源代码! QQ群:101677771 欢迎加入,一起讨论一起学习!

于是最后我还是选择了一种最简单,最方便的一种方法: python爬虫,

正文
1)思路
进入某音乐主页输入任意歌手,比如李XX为列,
- 音乐从哪里来?---网站的服务器里
- 怎么从网址里得到音乐?---向网站发起网络请求
- 最后用tkinter做成一个界面下载框即可
2)环境
本文用到的环境如下:Python3、Pycharm,requests、tkinter模块,
模块安装:pip install + 模块名 环境有问题可以直接找我解答,(安装包、视频、激活码都有)
3)代码演示
3.1 打开审查元素F12
找到头档案地址:
headers = {
'Referer': 'https://y.qq.com/portal/search.html',
'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) '
'Chrome/77.0.3865.90 Safari/537.36 '
}
3.2 附完整项目
# -*- coding: utf-8 -*-
from tkinter import *
import requests
import json
import os
headers = {
'Referer': 'https://y.qq.com/portal/search.html',
'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) '
'Chrome/77.0.3865.90 Safari/537.36 '
}
def downlaod_song():
music_info_list = []
name = entry.get()
page = '1'
num = '10'
url = f'https://c.y.qq.com/soso/fcgi-bin/client_search_cp?p={page}&n={num}&w={name}'
response = requests.get(url).text
# 将response切分成json格式 类似字典 但是现在还是字符串
music_json = response[9:-1]
music_data = https://www.cnblogs.com/pythonQqun200160592/archive/2021/12/21/json.loads(music_json)
music_list = music_data['data']['song']['list']
for music in music_list:
music_name = music['songname'] # 歌曲的名字
singer_name = music['singer'][0]['name'] # 歌手的名字
songmid = music['songmid']
media_mid = music['media_mid']
music_info_list.append((music_name, singer_name, songmid, media_mid))
# 获取vkey
music_data = https://www.cnblogs.com/pythonQqun200160592/archive/2021/12/21/[]
for music in music_info_list:
music_name = music[0]
singer_name = music[1]
songmid = music[2]
url = 'https://u.y.qq.com/cgi-bin/musicu.fcg?data=https://www.cnblogs.com/pythonQqun200160592/archive/2021/12/21/{"req":{"module":"CDN.SrfCdnDispatchServer","method":"GetCdnDispatch","param":{"guid":"8846039534","calltype":0,"userip":""}},"req_0":{"module":"vkey.GetVkeyServer","method":"CgiGetVkey","param":{"guid":"8846039534","songmid":["%s"],"songtype":[0],"uin":"1152921504784213523","loginflag":1,"platform":"20"}},"comm":{"uin":"1152921504784213523","format":"json","ct":24,"cv":0}}' % songmid
response = requests.get(url).json() # 如果你获取的资料 是 {} .json() 他会直接帮我们转换成字典
purl = response['req_0']['data']['midurlinfo'][0]['purl']
full_media_url = 'http://dl.stream.qqmusic.qq.com/' + purl
music_data.append(
{
'music_name': music_name,
'singer_name': singer_name,
'full_media_url': full_media_url
}
)
if not os.path.exists('歌曲下载'):
os.mkdir('歌曲下载')
for music in music_data:
music_name = music['music_name']
singer_name = music['singer_name']
full_url = music['full_media_url']
music_response = requests.get(full_url, headers=headers).content # 获取到二进制资料
with open('歌曲下载/%s-%s.mp3' % (music_name, singer_name), 'wb')as fp:
fp.write(music_response)
# 添加资料到串列框的最后
text.insert(END, '正在下载:%s' % music_name)
# 文本框向下滚动
text.see(END)
# 更新(不更新就一直卡在那,显示同样的内容)
text.update()
# 1.创建视窗
root = Tk()
# 2.视窗标题
root.title('QQ音乐')
# 3.视窗大小以及显示位置,中间是小写的x
root.geometry('550x400+550+230')
# 视窗显示位置
# 4.标签控制元件
lable = Label(root, text='请输入需要下载的歌手或歌曲:', font=('微软雅黑', 10))
lable.grid(row=0, column=0)
# 5.输入控制元件
entry = Entry(root, font=('微软雅黑', 25))
entry.grid(row=0, column=1)
# 6.串列框控制元件
text = Listbox(root, font=('微软雅黑', 16), width=45, height=10)
# # columnspan组件所跨月的列数
text.grid(row=1, columnspan=2)
# 7.按钮控制元件
button = Button(root, text='开始下载', width=10, font=('微软雅黑', 10), command=downlaod_song)
button.grid(row=2, column=0, sticky=W)
button1 = Button(root, text='退出', width=10, font=('微软雅黑', 10), command=root.quit)
button1.grid(row=2, column=1, sticky=E)
# 讯息回圈,显示视窗
root.mainloop()
4)效果展示?
以李XX为例子下载的歌曲:

想下载什么下载什么哦~

0 评论