KLara project:分布式YARA恶意软件扫描系统

KLara project:分布式YARA恶意软件扫描系统。Klara 项目旨在帮助威胁情报研究人员使用 Yara 搜索发现新的恶意软件。

为了有效的匹配出恶意软件,研究人员往往需要搜集大量的样本,并需要对一系列收集/恶意文件启动Yara规则,然后再将结果返回。在某些情况下,Yara规则需要调整。但扫描大量的文件需要花费很长时间。相反,如果能使用自定义的架构,那么扫描10TB大小的文件也仅仅只需要30分钟左右。

Klara是一个用Python编写的分布式系统,它允许研究人员扫描一个或多个带有样本集合的Yara规则,在扫描完成后,研究人员可以通过电子邮件和Web界面获得通知。

特性

现代化的web界面,使研究人员可以通过电子邮件/API获取结果

强大的API,允许自动提交Yara作业,检查它们的状态并获取结果。API文档即将发布。

分布式系统,在商用硬件上运行

架构

Klara利用Yara的强大功能,使用dispatcher-worker模式分配扫描。每个worker服务器连接到一个dispatcher,以检查是否有新的作业可用。如果有,它将检查是否在自己的文件系统上提供了所需的扫描存储库,如果是,它将使用研究人员提交的规则开始执行Yara扫描

Klara试图解决的主要问题是尽可能的在一个合理的时间范围内,对大量恶意软件样本(>1TB)运行Yara作业。

Klara安装

Klara运行依赖

GNU/Linux (推荐使用Ubuntu 16.04 或最新的LTS版)

MySQL / MariaDB DB

Python 2.7

Python virtualenv package

Yara(安装在workers)

Klara的安装由以下四部分组成:

数据库安装

Woker安装

Dispatcher安装

Web界面安装

组件间的连接关系图示:

+----------+ +----------------+

| | | |

+---------->+ Database +

| | | | | (optional) |

| +----------+ | | |

+------+------+ | +-------+--------+

| | | |

+----->| Dispatcher |

| | | | | |

| +------+------+ | | v

| | | | +-------+--------+

| | | | | |

| | | | | |

+---+----+ +----+---+ +----+---+ ^------+ Web server |

| | | | | | | |

| Worker | | Worker | | Worker | | |

| | | | | | +----------------+

+--------+ +--------+ +--------+

Workers使用简单的HTTP REST API连接到Dispatcher。Dispatcher和Web服务器使用TCP连接来连接MySQL/MariaDB数据库。因此,组件可以被安装在分离的机器/虚拟机上。唯一的要求是它们之间允许TCP连接。

安装指南

https://github.com/KasperskyLab/klara/tree/master/install

下载

https://github.com/KasperskyLab/klara