100字范文,内容丰富有趣,生活中的好帮手!
100字范文 > 高德地图python爬虫 商家_Python3 | 通过百度地图API获取商家详细信息

高德地图python爬虫 商家_Python3 | 通过百度地图API获取商家详细信息

时间:2022-02-07 00:30:35

相关推荐

高德地图python爬虫 商家_Python3 | 通过百度地图API获取商家详细信息

python爬取你想要的数据,近期由于业务需求,用python爬取了高德地图一些地点的数据,爬出来数据大致情况如下:

image

下面是基本流程:

2.安装网络爬取第三方库,主要是下面三个(pip install 安装);

from urllib.parse import **quote**

from urllib import **request**

import **json**

3.创建网络爬虫爬取数据,并对数据进行解析(这块就直接上代码了);

from urllib.parse import quote

from urllib import request

import json

# import xlwt

web_key = '**********' #自己高德的地图的key密钥

url = "/v3/place/text"

cityname = "南京" # 自己需要搜索城市

classfiled = "汽车站" # 自己需要搜索的目的地信息(比如想搜索医院,直接替换成医院即可)

i=0 # 爬取的页面信息,i=2时即爬取第2页的数据。当 result['count']=0 时即此页面已经无信息,爬取所有数据时可以用此终止循环

req_url = **url** + "?key=" + **web_key** + '&extensions=all&keywords=' + quote(**classfiled**) + '&city=' + quote(**cityname**) + '&citylimit=true' + '&offset=25' + '&page=' + **str( i) **+ '&output=json'

data = ''

f=request.urlopen(req_url)

data = f.read()

data = data.decode('utf-8')

result=json.loads(data)

# print(result['count']) # 等于0时,即代表此页面已经无信息

result['pois'][0] #显示数据记录格式

处理过会,基本的网页信息就出来了

image

以上的数据是以字典的形式打印出来的,把自己需要获取的字段提出出来就可以了:

for i in range(len(result['pois'])):

print('名称:',result['pois'][i]['name']

,'\n类型:',result['pois'][i]['type']

,'\n省份:',result['pois'][i]['pname']

,'\n城市:',result['pois'][i]['cityname']

,'\n地区:',result['pois'][i]['adname']

,'\n乡镇:',result['pois'][i]['business_area']

,'\n详细地址:',result['pois'][i]['address']

,'\n经纬度:',result['pois'][i]['location']

,'\n图片链接:',result['pois'][i]['photos'][0]['url']

,'\n'

)

部分数据结果如下:

image

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。