100字范文,内容丰富有趣,生活中的好帮手!
100字范文 > 爬取网页表格到Excel ?别再复制粘贴了 太慢!

爬取网页表格到Excel ?别再复制粘贴了 太慢!

时间:2024-07-12 16:28:28

相关推荐

爬取网页表格到Excel ?别再复制粘贴了 太慢!

这种情况,可能你也遇到过:

做报表时需要一些外部数据,通常上网找。

比如,你要做一份手机产品调研,需要导入各品牌手机的参数,做对比分析。

◎ 中关村网的OPPO手机参数

这种网上数据,一般呈表格状。

你心想,既然Excel也是做表的,那复制下来不就完事了?

然后开始左点鼠标,非常“细心”选取表格,以确保不把多余又无关紧要的内容弄下来。

而这个过程,往往很磨人……

◎ 操作示范

贴了下来之后,问题还一堆:

排版失效,行列对不准,字体都挤在了一起。

表格原来的文本颜色,字体大小也被复制了下来,搞得你要重做一次排版。

文本含有超链接,还要你浪费时间去清除。

与其这样,那还不如截图下来更爽……可这就意味着数据不能动了。

事实上,这类网页表格,在网页源代码里,被统一称为table。

而Excel可以通过识别源代码,帮你毫无保留、原汁原味地将table的内容爬取下来。

爬完效果长这样:

◎ 操作示范

帮你调整好排版、字体颜色统一;

还自带筛选功能任你玩,想展示什么数据都可以。

◎ 中关村网的OPPO手机参数

那么问题来了,这是怎么做出来的呀?

呐,解题宝宝不瞒你,就是靠菜单栏一个按钮叫自网站,

用它来帮我们导入网站数据。

◎ 按钮位置

以下,听我详细教你怎么做叭。

1 自网站导入数据

Step 1

复制要爬取的网站的链接。

打开数据-自网站,复制进基本的URL框里,然后按确定。

◎ 操作演示

接下来就出现了导航器。

其中显示出命名为table0、table1、table2……等全部从该网站爬取下来的表格。

◎ 效果演示

Step 2

选择你要的表格,只能选一张,然后按加载。

等大概10秒左右,表格就出来啦。

◎ 操作演示

等待时长,取决于要爬取的数据有多大。

当数据量越大,你等待的时间就越长,这堆庞大数据造成电脑死机、卡顿的几率就越高。

所以,如果你要爬的数据量很大,尤其是当表格上千行、字数过万时;

你最好,先把电脑里一些占用内存较高的程序关掉,比如杀毒软件、音乐软件、视频语音之类。

◎ 爬完之后的样子

2 同步更新设置

爬下来的表格,实际上等同于「同步显示」网站的数据。

所以,你可以实现当网站的数据更新,这份表格也刷新,只显示最新数据。

超级贴心有没有,不用再麻烦你手动编辑修改。

尤其是要爬取时刻在变化的数字数据,如股市指数、网站日活、电商成交记录等……

能让表格自己每天更新,就再好不过了。

操作方式

点击数据-连接属性,这时你打开了查询属性设置框。

勾选允许后台刷新、刷新频率和打开文件时刷新数据这三个选项即完成。

◎ 爬完之后的样子

今天的教程较易,总共就两步:先爬下来,再设置更新。

想找网站练手的话,宝宝可以百度搜关键「会员套餐」,随便打开一个页面,通常都有表格。

各位粉丝宝宝,

有什么不明白的Excel问题,

欢迎在下方评论区留言,

我会24小时内回复你哒。

如果觉得这篇文章帮到你,

请动动手指“分享”到朋友圈,

转发给更多需要的好友呐。

最后,祝你早日成为Excel高手,

解题宝宝相信,你一定可以!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。