100字范文,内容丰富有趣,生活中的好帮手!
100字范文 > python多线程爬取段子_python爬虫(爬取段子)

python多线程爬取段子_python爬虫(爬取段子)

时间:2019-02-09 02:12:00

相关推荐

python多线程爬取段子_python爬虫(爬取段子)

python爬取段子

爬取某个网页的段子

第一步

不管三七二十一我们先导入模块

#/s?id=1598724756013298998&wfr=spider&for=pc 段子所在的网址

import re

import requests #如果没这模块运行CMD pip install requests

第二步

获取网站的内容

#/s?id=1598724756013298998&wfr=spider&for=pc 段子所在的网址

import re

import requests #如果没这模块运行CMD pip install requests

response = requests.get(/s?id=1598724756013298998&wfr=spider&for=pc)

data = response.text

第三步

找到段子所在的位置

#/s?id=1598724756013298998&wfr=spider&for=pc 段子所在的网址

import re

import requests #如果没这模块运行CMD pip install requests

response = requests.get('/s?id=1598724756013298998&wfr=spider&for=pc') #这个编辑器的长度关系没法放一行

data = response.text

#按F12选择自己想要的内容所在的位置copy出来

new_list = re.findall('(.*?)

',data ) # (.*?)是我们要的内容

第四部

保存文件

#/s?id=1598724756013298998&wfr=spider&for=pc 段子所在的网址

import re

import requests #如果没这模块运行CMD pip install requests

response = requests.get('/s?id=1598724756013298998&wfr=spider&for=pc') #这个编辑器的长度关系没法放一行

data = response.text

#按F12选择自己想要的内容所在的位置copy出来

new_list = re.findall('(.*?)

',data ) # (.*?)是我们要的内容

for a in new_list:

with open(r'D:\图片\段子.txt', 'a') as fw:

fw.write(a)

fw.flush()

本文分享 CNBlog - 加载时间中.....。

如有侵权,请联系 support@ 删除。

本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。