虽然获取到了微信公众号文章的链接,但没法获取到包含文章内容的 html。
花了一个小时来研究怎么获取页面,最后还是失败了。
虽然获取到了微信公众号文章的链接,但没法获取到包含文章内容的 html。
花了一个小时来研究怎么获取页面,最后还是失败了。
要一个人在家一周,有些孤独,有些茫然,想起来写总结。
不太清楚总结怎么写,就和以前一样,把过去的东西列出来看看吧,帮助自己回顾一番。
这是 2019 上半年的总结,也是大二第二学期的学期总结。
爬取微信公众号的文章,之前一直觉得应该很难,我搞不定,但是尝试了一下发现,其实这和之前爬取的网站没有太大的区别。
本文记录了 2019 年 8 月 7 日爬取某一特定微信公众号的所有文章链接的方式,读者请注意时效性。
为了管理自己平时各种各样的账号密码,我使用了一个加密了的 xlsx 文件来记录,同时使用了密码生成规则。为了方便生成密码,使用 python 写了一个小工具。
由于代码比较简单,因此不做过多说明,仅做记录。
将登陆学校信息门户的部分专门封装成一个模块,需要的时候导入。
以前写的爬虫无法登录到学校的信息门户上去了,因为门户的新 JS 代码将表单的密码先加密了一次,再将其与别的表单数据 POST 过去。使用的是 AES 加密的 CBC 模式。
本文前半部分是我的 python 组长雁横给组员们讲解的信息门户的密码加密思路,然后由我总结成文,后半部分是我自己写的加密代码实现,使用 python 的PyCryptodome
库来进行加密。
尝试使用 python 的configparser
来读取ini
配置文件,但是遇到了No Section
的错误。
最终发现其实是路径出了问题。
我在自己一个学习群里设定了一个周总结制度,这篇博客记录一下如何使用 excel 函数来实现计算打卡相册的积分。这里其实我用的是 wps 表格,但是函数一样,所以我就分类在 excel 里面。
我在自己一个学习群里设定了一个打卡相册制度,这篇博客记录一下如何使用 sumif 函数来实现计算打卡相册的积分。这里其实我用的是 wps 表格,但是函数一样,所以我就分类在 excel 里面。
这是我以前写的第一篇博客的补档,由于图片太多于是就发在了 CSDN,现在不愁图片的问题了,于是就在整理电脑文件时把这篇博客在个人博客这边发一下。