CSDN个人博客阅读评论信息的爬取 CSDN个人博客阅读评论信息的爬取 用来爬取CSDN上个人博客的信息,包括阅读次数,评论数等等 因为CSDN更换了界面,原来的爬虫已经失效,… Read More »
自动检测CSDN博客文章阅读次数的爬虫 自动检测CSDN博客文章阅读次数的爬虫 平时没事会去CSDN上看一看博客里有什么变化,如果文章有评论或者有了私信,CSDN上都不会通知你,这就… Read More »
好玩的API调用之—天气预报的API调用与爬虫 好玩的API调用之—天气预报的API调用与爬虫 平时写程序经常需要用到一些服务,像翻译,天气预报,星座什么的,我一般都是用Python写… Read More »
关于《Python写网络爬虫》第一章总结 关于《Python写网络爬虫》第一章总结 1. 关于爬虫错误处理 比如在爬虫里 下载网页时, 我们可能会遇到一些无法控制的错误, 比如… Read More »
使用爬虫多种姿势爬取学校OnlineJudge上的题目 爬虫每日篇—-使用爬虫多种姿势爬取学校OnlineJudge上的题目。学校的oj里有两千多道题,到访问的时候必须连校园网,在外面就看不到了,所以我想着把上面所有的题都弄下来,然后把所有题目集合到一起做一个.chm方便用的时候看。效果如下图。
使用python爬取有道首页做一个翻译程序 今天想写一篇关于python爬虫的博文,正好这几天有几百个单词要翻译,而翻译软件我最常用的就是有道,去有道首页抓个包看一下,是htt… Read More »
强大的BeautifulSoup库 BeautifulSoup简直就是神器,省去了复杂的正则表达式,而且还能自动将字符编码,下面是关于我在爬虫中使用BeautifulSoup库的总结,最常用,最好用的一些功能。下面会把我使用的示例HTML代码放出来。