或许很快乐

好吧,时隔两个星期(好像还不久嘛),我终于再次动笔开始写我的毕业总结了。之前有过两次落笔,原因分别是毕业典礼以及部门旅游,然后又因为不成体系,思路分散,结果只写了一部分,并没有完成。而今天动笔的动机自然是陈老师的回信了。

阅读全文

浅析决策树算法

数据挖掘十大算法之C4.5以及CART算法。

阅读全文

浅析朴素贝叶斯算法

数据挖掘十大算法之朴素贝叶斯算法。

阅读全文

浅析k近邻算法

数据挖掘十大算法之k近邻算法。

阅读全文

假装很开心

现在开始写年终总结应该不算晚吧,17年的最后一天和18年的第一天本质上也就只有日期不同了吧,就如同周日和周一一样。虽然今年没有什么值得夸耀的事情,但是还是要记录一下,就像是照片一样,不是为了彰显而是为了存在。

阅读全文

《think_python》读书笔记

最近在图书馆发现了一本书《Think Python:How to Think Like a Computer Scientist》,看起来还不错的样子,于是就拿来看了,是一本蛮适合入门Python的书,还能查漏补缺,个人还是蛮推荐的。可以尝试看完廖雪峰的python教程然后看这本。

阅读全文

目标爬虫清单

想了想决定,把想要爬的网站都汇总起来,一方面是这样更方便清晰,另一方面也是督促自己每天都编程。

完成后会顺带写上关键点和一些心得。

先定个小目标,爬他100个

阅读全文

Python动态爬取的两种方式

在不断爬取网站的同时,我们会发现有一些页面是动态生成的,无法简单的通过之前的做法获取的所需要的信息。所以我们需要新的爬取解析方式,目前流行的两大思路是模拟浏览器行为爬取动态页面逆向分析爬取

阅读全文

数字杭电模拟登录

项目介绍

这是一个简单的小项目,可以用一句话来简单概括:

模拟登录数字杭电并爬取个人成绩

阅读全文

Python爬坑问题集合

本文用于一些常见奇葩问题,致力于记录在 Python 开发过程中出现的各类问题。

阅读全文