python基于爬蟲+django,打造個(gè)性化API接口
今天也是同事在做微信小程序的開發(fā),需要音樂(lè)接口的測(cè)試,可是用網(wǎng)易云的開放接口比較麻煩,也不能進(jìn)行測(cè)試,這里也是和我說(shuō)了一下,所以就用爬蟲寫了個(gè)簡(jiǎn)單網(wǎng)易云歌曲URL的爬蟲,把數(shù)據(jù)存入mysql數(shù)據(jù)庫(kù),再利用django封裝裝了一個(gè)簡(jiǎn)單的API接口,給同事測(cè)試使用。
原理創(chuàng)建django項(xiàng)目,做好基礎(chǔ)的配置,在views里寫兩個(gè)方法,一個(gè)是從mysql數(shù)據(jù)庫(kù)中查數(shù)據(jù)然后封裝成API,一個(gè)是爬蟲方法,數(shù)據(jù)扒下來(lái)以后,通過(guò)django的ORM把數(shù)據(jù)插入到mysql數(shù)據(jù)庫(kù)中。這里的路由也是對(duì)應(yīng)兩個(gè),一個(gè)是爬蟲的請(qǐng)求路由(就是運(yùn)行路由),一個(gè)是接口路由,MODEL層里也是為了方便,就設(shè)了兩個(gè)字段,一個(gè)是歌曲名稱,一個(gè)是URL地址。
代碼如下views文件代碼
from django.shortcuts import render,HttpResponseimport requestsfrom lxml import etreefrom .models import Api# Create your views here.def api_wy(request): api = Api.objects.all() return render(request, 'index.html',locals())def pc(request): url = ’https://music.163.com/discover/toplist?id=3779629’ headers = { ’user-agent’: ’Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3861.400 QQBrowser/10.7.4313.400’ } data = requests.get(url=url, headers=headers) html = etree.HTML(data.text) music_list = html.xpath(’//ul[@class='f-hide']/li/a’) music_lis = [] # 存放歌曲信息 for music in music_list: music_name = music.xpath(’./text()’)[0] # 獲取歌曲名稱 music_id_all = music.xpath(’./@href’)[0] # 獲取a標(biāo)簽內(nèi)容 music_id = music_id_all.split(’=’)[-1] # 將a標(biāo)簽內(nèi)容進(jìn)行數(shù)據(jù)清洗,提取歌曲的id download_music = music_name + ’ ’ + f’http://music.163.com/song/media/outer/url?id={music_id}.mp3’ # 將歌曲名稱和url進(jìn)行拼接 music_lis.append(download_music) print(download_music) for url in music_lis: try: url_name = url.split(’ ’)[0] # 獲取名稱 url_music = url.split(’ ’)[1] # 獲取url Api.objects.create(name=url_name,url=url_music) print('正在插入數(shù)據(jù)') except: print('charushibai') return HttpResponse('正在下載')
URL路由文件
from django.contrib import adminfrom django.urls import pathfrom api.views import api_wy,pcurlpatterns = [ path(’admin/’, admin.site.urls), path(’api/’,api_wy), path('pc/',pc),]
Models層面
from django.db import models# Create your models here.class Api(models.Model): name = models.CharField(’歌曲名稱’, max_length=100) url = models.CharField('歌曲地址',max_length=300) class Meta: verbose_name = ’歌曲API’ verbose_name_plural = verbose_name def __str__(self): return self.name
其他的也就沒(méi)什么可說(shuō)的了,也是一個(gè)比較簡(jiǎn)單的測(cè)試需求,就是為了省點(diǎn)事情才弄得好了,今天就到這了,拜拜
以上就是python基于爬蟲+django,打造個(gè)性化API接口的詳細(xì)內(nèi)容,更多關(guān)于python api接口的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
