本文共 1566 字,大约阅读时间需要 5 分钟。
Beats是Elastic Stack技术栈中轻量级的日志采集器,Beats家族包括以下五个成员:
Filebeat:轻量级的日志采集器,可用于收集文件数据。
Metricbeat:5.0版本之前名为Topbeat,搜集系统、进程和文件系统级别的 CPU 和内存使用情况等数据。
Packetbeat:收集网络流数据,可以实时监控系统应用和服务,可以将延迟时间、错误、响应时间、SLA性能等信息发送到Logstash或Elasticsearch。
Winlogbeat:搜集Windows事件日志数据。
Heartbeat:监控服务器运行状态。
ELK架构中使用Logstash收集、解析日志,但是Logstash对内存、cpu、io等资源消耗比较高。相比 Logstash,Beats所占系统的CPU和内存几乎可以忽略不计。
Elasticsearch、Logstash、Kibana组合成为ELK Stack,Beats+ELK Stack=Elastic Stack
Filebeat是使用GO语言开发,工作原理如下:当Filebeat启动时,它会启动一个或者多个prospector监控日志路径或日志文件,每个日志文件会有一个对应的harvester,harvester按行读取日志内容并转发至后台程序。Filebeat维护一个记录文件读取信息的注册文件,记录每个harvester最后读取位置的偏移量。
下面是一个简单的Filebeat配置,采集2个文件夹下的日志并转发至Logstash。
filebeat: prospectors: - paths: - /dir1/access_log.* input_type: log document_type: dir1_log - paths: - /dir2/ofbiz.log.* input_type: log document_type: dir2_logoutput: logstash: hosts: ["10.90.4.9:5044"]
在Logstash中根据 document_type定义解析日志的正则并输出到ELasticsearch集群。
input { beats{ host => "192.2.11.145" port => 5044 }}filter { if[type]=="dir1_log"{ grok { match => { "message" => "%{ COMBINEDAPACHELOG}"} } } else if ([type]=="dir2_log") { grok { match => { "message" => "%{ TIMESTAMP_ISO8601:time}\s*%{ NUMBER:logtime} \[\s*%{ JAVAFILE:class}\:%{ NUMBER:lineNumber}\s*\:%{ LOGLEVEL:level}\s*\]\s*(?([\s\S]*))"} } }}output { elasticsearch { hosts => ["10.90.4.9","10.90.4.8","10.90.4.7"] }}