100字范文,内容丰富有趣,生活中的好帮手!
100字范文 > 刚刚用python爬取一千个微信朋友圈数据 他们的秘密原来这么多。

刚刚用python爬取一千个微信朋友圈数据 他们的秘密原来这么多。

时间:2022-06-11 13:41:34

相关推荐

刚刚用python爬取一千个微信朋友圈数据 他们的秘密原来这么多。

当下我们饮食起居基本上依靠微信,但微信不单单是1个即时通信软件,更像是仿真模拟的日常生活世界。你所处的微信朋友圈是咋样,慢慢地你的思想也会变的咋样。近几日在学习 itchat,并且写了1个网络爬虫,扒取了我全部的微信朋友圈的数据统计。并对其中的一些数据统计进行分折,发现了许多很有趣的事。

微信朋友圈网络爬虫

此次的爬虫程序应用的库有众多,其中爬取微信数据采用的是 itchat。你可以先去下载程序安装。安装完成以后,你就能使用 itchat.login() 这一函数登陆你自己的微信朋友圈。它会弹出一个快速登录的微信二维码,你用手机扫码登陆即可。

然后使用 itchat.get_friends() 這個函数就能得到自个朋友圈的基本信息,这些信息是1个 json 统计数据返回。之后我就能依据这些返回的信息,开展正则匹配爬取.获取想要的信息,再完成深入分析。

我的微信朋友的性别比例

刚刚用python爬取一千个微信朋友圈数据,他们的秘密原来这么多。

观察获取的统计数据,很容易就能依据关键词发觉性别是存储在1个词典里边,它的 key 是「Sex」,男生值为 1,女性为 2,其余是未知性别的(就是说没有填的)。

在代码里我定义了1个函数 parse_friends() 根据1个 for 循环,把取得到的数据利用 for 循环储存到 text 字典里。随后再利用 draw() 函数画出柱形图。柱形图采用的是 plt 库,刚刚也写过一段文字,喜欢的同学们可不可以去查阅。

刚刚用python爬取一千个微信朋友圈数据,他们的秘密原来这么多。

刚刚用python爬取一千个微信朋友圈数据,他们的秘密原来这么多。

最后打印的结果:

刚刚用python爬取一千个微信朋友圈数据,他们的秘密原来这么多。

很尴尬的是我微信朋友圈的一千 多的好友男生和女生比例十分的不协调,男多女少啊。这让我回想到之前高中班里 50 个人,女孩就 7 个,之后让我们班的女孩自此就多了一个女子组合称谓「七仙女」。

我的微信好友个性签名的自定义词云图

要为进一步加强剖析我的微信好友大概都有哪些特性,我把微信好友的个性签名一块儿爬取,深入分析制作成词云。

个性签名是储存在 Signature 这一 key 中,因为一些签名包括些小表情,起初爬取会变为 emoji、span、class 这些我们不相干的词。全部需用先替换成掉,另一个,也有类似于 <>/= 这类的标记,也需用写个简洁的正则替换成掉,再把整个拼起来,获得 text 字串。

刚刚用python爬取一千个微信朋友圈数据,他们的秘密原来这么多。

获得的统计数据最终存放到当前目录名为「text.txt」文本中。

刚刚用python爬取一千个微信朋友圈数据,他们的秘密原来这么多。

深入分析微信朋友签名的函数我定义成:parse_signature(),完整代码如下:

刚刚用python爬取一千个微信朋友圈数据,他们的秘密原来这么多。

爬取梳理了签名的统计数据,接着就是制作出词云。这儿采用的是 wordCloud 来开展词云的制作。刚刚的文章就有详细介绍过词云的制作,喜欢的同学都可以查阅这篇文章。

词云的制作我定义了1个:draw_signature() 函数,详细代码如下图所示

勤奋,拼搏,全世界,起居,自身。这种词在.我 1K 多人的微信好友中冒出的最多。大伙儿都十分的优异,都十分的积极进取。

小编整理了一些java进阶学习资料和面试题,需要资料的请加JAVA高阶学习Q群:701136382 这是小编创建的java高阶学习交流群,加群一起交流学习深造。群里也有小编整理的最新最全的java高阶学习资料!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。