推荐专题：

100字范文 > Python:6小时爬完上交所和深交所的年报问询函

Python:6小时爬完上交所和深交所的年报问询函

时间：2022-05-05 15:38:48

相关推荐

Python:6小时爬完上交所和深交所的年报问询函

原文链接：/news/0e57c635cd225.html

目录

一、任务描述二、解决思路三、网页分析 1. 数据包位置2. 翻页3. 下载PDF4. 深交所网页和上交所网页的区别四、PDF转TXT五、核心代码 1. 获取上交所问询函列表2. 爬取PDF并直接转为TXT3. 遍历文件夹中所有TXT和DOC文件并生成列表六、最终爬取结果主要参考链接

昨天开组会的时候导师说想搞年报问询函的研究，但是买数据库太贵了。我说放着我来 ( ′)ψ。

一、任务描述

分别从上交所和深交所的官网上爬取年报问询函的记录

二、解决思路

解析网页获取全部的年报问询函列表及相应的文件链接打开第一步获取的文件链接，读取 PDF 数据，并直接转成 TXT 格式的文字

主要参考链接

温馨提示：文中链接在微信中无法生效。请点击底部「阅读原文」

Python文件处理：递归批处理文件夹子目录内所有 txt 数据Python 爬虫怎么处理 json 内容Python3 在线读取 PDF 原文链接：/news/0e57c635cd225.html

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。

相关阅读

年报成色几何从上交所问询函中看玄机

2023-10-27

茂业商业延期回复上交所关于年报问询函

2019-07-10

茂业商业：将延期回复上交所年报问询函

2021-06-10

应收账款问题多贵州百灵回复深交所年报问询函

2021-05-06

扩展阅读

: 上交所 深交所发布2022年国庆节中秋节休市安排

: 上交所 深交所发布关于2022年国庆节中秋节休市安排的公告

: 资本盛宴上交所 港交所 深交所齐聚第五届中国医药创新与投资大会共话医药

: 20连板后康华生物回复深交所问询：流通股份规模较小股价易受市场资金影响

: “讲故事”！汉鼎宇佑年报遭深交所质疑金融科技“炒概念”？

: 上交所明确要求：上市公司年报审计及相关业务涉及前述证券业务必须聘请具备证券资格的

最近发布

自己的情绪认知100字

2024-07-25

最新个人工作自我鉴定100字(精选13篇)

2024-07-25

小学五年级日记100字【五篇】 - 小学作文

2024-07-25

爱的道歉：16封给女朋友的精彩信件概览

2024-07-25

钟扬中的事迹总结100字

2024-07-25

中学生日记100字-给自己一个反省

2024-07-25

推荐专题

小鹿斑比读后感100字悲惨世界读后感100字我的房间日记100字暑假自我评价100字红孩子读后感100字描写桃花的作文100字春天的作文100字优美段落摘抄100字汉字的故事100字初中军训感言100字一千零一夜简介100字感悟作文100字护蛋日记100字范文100字西游记故事梗概100字