Articles published by ModerRAS

ModerRAS

ZeroMQ使用

写在开始最近有在看一些消息队列的东西,偶然之间找到了一个据说是速度最快的消息队列,这个就是我要说的这个ZeroMQ,使用难度也不是很高,但是这个似乎只是封装了一层网络层,所以有一些消息队列的逻辑还是要自己写了,介绍一下使用方法,当然我只介绍Python版本的那个.使用方法导入zmq包然后创建一个Context对象,然后再使用内部的socket函数来建立连接.介绍一下ZeroMQ里面的几种状态...

ModerRAS

September 5, 2017

No comments

Scrapy爬虫架构分析

写在开始scrapy是一个很有名的Python的网络爬虫框架,然后这个好像是设计成单机并行的爬虫,所以可能有些设计的并不是很好,但是也是一个很不错的架构,可以拿来参考一下.scrapy架构这是一张很好的说明scrapy架构的图源自scrapy文档组件Scrapy Engine引擎负责控制数据流在系统中所有组件中流动，并在相应动作发生时触发事件。详细内容查看下面的数据流(Data Flow)...

ModerRAS

September 3, 2017

No comments

分布式爬虫架构

写在开始最近有在看一点分布式爬虫的一点东西,然后找到了一点关于分布式爬虫的架构的设计,这里收藏一下.架构其实很简单的说,这个架构是从知乎里面一个人的回答的一个问题里面扒出来的.这个架构把一个爬虫拆成了三部分:下载网页的部分抓取数据的部分持久化的部分如果我没记错的话.然后这里面又有一些其他的细节.下载网页的部分和抓取数据的部分是通过一个消息中间件来连接起来的.抓取数据的部分和持久化的部分也是通...

ModerRAS

September 3, 2017

No comments

virtualenv的使用

写在开始最近做一点东西,顺便又用到了virtualenv,所以顺便再记录一下使用方法,省得以后再搜.安装sudo apt install virtualenv就可以了,有人说安装pip之后直接pip install virtualenv也行,这个没试过.创建一个虚拟环境先mkdir anenv,然后创建一个虚拟环境virtualenv anenv或者手动指定Python版本virtualen...

ModerRAS

August 27, 2017

No comments

写一些关于遗传算法的理解以及基本套路

写在开始最近又在看一点遗传算法方面的文章了,然而这一次突然看懂了,所以顺便来写一点理解.关于遗传算法以下来自维基百科:遗传算法（英语：genetic algorithm (GA) ）是计算数学中用于解决最佳化的搜索算法，是进化算法的一种。进化算法最初是借鉴了进化生物学中的一些现象而发展起来的，这些现象包括遗传、突变、自然选择以及杂交等。一些实现方面的理解这个算法的重点我认为是在如何编码基因和...

ModerRAS

August 26, 2017

No comments