100字范文,内容丰富有趣,生活中的好帮手!
100字范文 > Python爬虫案例详解:爬取电影top250写入Excel

Python爬虫案例详解:爬取电影top250写入Excel

时间:2024-09-24 08:27:04

相关推荐

Python爬虫案例详解:爬取电影top250写入Excel

解析数据我们需要使用BeautifulSoup这个功能模块来把充满尖括号的html数据变为更好用的格式。from bs4 import BeautifulSoup这个是说从(from)bs4这个功能模块中导入BeautifulSoup,是的,因为bs4中包含了多个模块,BeautifulSoup只是其中一个。soup = BeautifulSoup(html.text, html.parser)这句代码就是说用html解析器(parser)来分析我们requests得到的html文字内容,soup就是我们解析出来的结果。For循环豆瓣页面上有25部电影,而我们需要抓取每部电影的标题、导演、年份等等信息。就是说我们要循环25次,操作每一部电影。for item in soup.find_all(div,"info"):就是这个意思。首先我们在豆瓣电影页面任意电影标题【右键-检查】(比如“肖申克的救赎”),打开Elements元素查看器。

有需要Python学习资料的小伙伴吗?感兴趣者可以关注小编后私信学习资料反正闲着也是闲着呢,不如学点东西啦 :)

find_all(div,"info"),find是查找,find_all就是查找全部,查找什么呢?查找标记名是div并且class属性是info的全部元素,也就是会得到25个这样的元素的集合

for item in 集合:的含义就是针对集合中的每个元素,循环执行冒号:后面的代码,也就是说,下面的几行代码都是针对每部电影元素(临时叫做item)执行的.

获取电影标题title=item.div.a.span.string中item代表的是上面图片中的整个div元素(class=info),那

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。