100字范文,内容丰富有趣,生活中的好帮手!
100字范文 > 爱彼迎房源爬取价格和名称

爱彼迎房源爬取价格和名称

时间:2019-06-21 04:56:19

相关推荐

爱彼迎房源爬取价格和名称

爱彼迎是用javascripe渲染的,不能使用静态网页获取法,因此调用selenium库

from selenium import webdriverfrom bs4 import BeautifulSoupimport bs4import time from selenium.webdriver.firefox.options import Optionsdef getHTMLText(url):try:options = Options()//让浏览器不跳出来options.add_argument('-headless')driver = webdriver.Firefox(options=options)driver.get(url)time.sleep(10)//等待加载text=driver.page_source//返回网页渲染后的页面信息print("解析成功")return textexcept:print("解析失败")def parsePage(html)://bs4解析网页信息soup = BeautifulSoup(html,'html.parser')time.sleep(2)try:#爬下名字NAME = []name = soup.find_all("div",class_="_qrfr9x5")//找到对应标签后用煲汤法找出对应元素for i in name:NAME.append(i.text)//存储起来#爬下价格PRICE = []Price = soup.find_all("div",class_="_1ixtnfc")for i in Price:cont = i.find_all('span')PRICE.append(cont[1].text)result = []//将两个信息放进同一个数组中length = len(NAME)for i in range(length):result.append([NAME[i],PRICE[i]])print("信息存储成功")return result except:print("信息存储失败")def save_to_txt(result):f = open('price_village5.txt','a+',encoding='utf-8')//追加写入,不覆盖之前的信息length = len(result)for i in range(length):f.write(str(result[i][0])+" "+str(result[i][1])+"\n")f.close()def main(): start_url = '/s/深圳/homes?refinement_paths[]=%2Fhomes&current_tab_id=home_tab&selected_tab_id=home_tab&screen_size=large&hide_dates_and_guests_filters=false&place_id=ChIJkVLh0Aj0AzQRyYCStw1V7v0&s_tag=6kIFXvRQ&section_offset=4&items_offset='depth= 15for i in range(depth):try:url = start_url + str(20*i)html = getHTMLText(url)infoList = parsePage(html)save_to_txt(infoList)except:continuemain()

部分民宿信息截图

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。