​前言

Loki是Grafana Labs团队的开源项目,是一个水平可扩展,高可用性,多租户的日志聚合系统,它的设计非常简洁易于操作。

受Prometheus启发的,可以水平扩展、高可用以及支持多租户的日志聚合系统,使用了和Prometheus相同的服务发现机制,将标签添加到日志流中而不是构建全文索引,从promtail接收到的日志和应用的Metrics指标就有相同的标签集,不仅提供了更好的日志和指标之间的上下文切换,还避免了对日志进行全文索引。

日常的网络运维中,如果能把网络设备的日志收集起来,集中查看,在处理故障或日常巡检时,会比较方便一些

如果没有专业的日志收集硬件或软件设备,那么可以搭建Loki进行收集,并使用Grafana查看收集好的日志

本文的主要内容如下:

  • 如何安装部署loki
  • 如何配置网络设备的syslog
  • 如何使用rsyslog收集到网络设备的日志
  • 如何配置Grafana并查看日志

环境准备

1台主机,可以是云主机、虚机,可以根据日志的多少来决定配置的大小,本实验中的配置是4C8G的

OS为Debian11,但其他发行版如CentOS,大部分情况下也是适用的

该主机将会安装loki,rsyslog、promtail

*本文档不再介绍如何安装Grafana

安装部署Loki

下载最新的版本https://github.com/grafana/loki/releases/​[1]在Linux中安装时可下载loki-linux-amd64.zip

解压可执行文件到目标目录

unzip -d /usr/local/bin/ loki-linux-amd64.zip

创建用户

useradd -r -s /sbin/nologin loki

创建配置文件

mkdir -pv /etc/loki /data/loki

chown -R loki:loki /etc/loki

编辑Loki的配置文件

auth_enabled: false

server:
http_listen_port: 3100
grpc_listen_port: 9096

common:
path_prefix: /data/loki
storage:
filesystem:
chunks_directory: /data/loki/chunks
rules_directory: /data/loki/rules
replication_factor: 1
ring:
instance_addr: 10.20.20.20
kvstore:
store: inmemory

schema_config:
configs:
- from: 2020-10-24
store: boltdb-shipper
object_store: filesystem
schema: v11
index:
prefix: index_
period: 24h

ruler:
alertmanager_url: http://localhost:9093

请修改以上几项内容

instance_addr,修改为安装主机的IP地址

alertmanager_url:修改为alertmanager的url,本次并未使用alertmanager,所以写的localhost

编辑Systemd[2]的服务配置文件vim /lib/systemd/system/loki.service

[Unit]
Description=Loki service
After=network.target

[Service]
Type=simple
User=loki
ExecStart=/usr/local/bin/loki-linux-amd64 -config.file /etc/loki/loki-my-config.yaml

[Install]
WantedBy=multi-user.target

启动并设置为开机自启动

systemctl start loki; systemctl enable loki

systemctl status loki

安装并配置promtail

从https://github.com/grafana/loki/releases[3] 下载安装包

下载示例的配置文件

wget https://raw.githubusercontent.com/grafana/loki/master/cmd/promtail/promtail-local-config.yaml

也可以直接使用如下的示例配置,注意个别地址需要修改,已进行注释

server:
http_listen_port: 9080
grpc_listen_port: 0

positions:
filename: /etc/promtail/positions.yaml

clients:
# 将地址修改为实际的 loki Server 的地址
- url: http://10.20.20.20:3100/loki/api/v1/push


scrape_configs:
- job_name: loki
static_configs:
- targets:
- localhost
labels:
job: syslog
env: prod
location: whcq
vendor: loki
hostname: m-loki
__path__: /var/log/network/m-loki-127.0.0.1.log

- job_name: syslog
static_configs:
- targets:
- localhost
labels:
job: syslog
env: prod
location: whcq # 设备的机房或者所在的位置
vendor: huawei # 品牌
hostname: Test-S6720-254 # 主机名
__path__: /var/log/network/Test-S6720-254-10.20.99.254.log # 日志的路径

- job_name: syslog
static_configs:
- targets:
- localhost
labels:
job: syslog
env: prod
location: shbd
vendor: cisco
hostname: Test-C3560G
__path__: /var/log/network/192.168.99.254-192.168.99.254.log

调整promtail执行文件和配置文件的路径

mv promtail-linux-amd64 /usr/local/bin/

mkdir -pv /etc/promtail; mv promtail-local-config.yaml config-promtail.yml

创建用户并修改文件的权限

useradd -r promtail

chown promtail:promtail /tmp/positions.yaml

编辑 Promtail.servicevim /lib/systemd/system/promtail.service

[Unit]
Description=Promtail service
After=network.target

[Service]
Type=simple
User=promtail
ExecStart=/usr/local/bin/promtail -config.file /etc/promtail/config-promtail.yml

[Install]
WantedBy=multi-user.target

启动服务

systemctl start promtail

systemctl enable promtail

使用rsyslog收集到网络设备的日志

  • 搭建并配置rsyslog

配置文件如下vim /etc/rsyslog.conf

# provides UDP syslog reception
module(load="imudp")
input(type="imudp" port="514")

# provides TCP syslog reception
module(load="imtcp")
input(type="imtcp" port="514")



$template IpTemplate,"/var/log/network/%HOSTNAME%-%FROMHOST-IP%.log"
*.* ?IpTemplate
& ~

%HOSTNAME%-%FROMHOST-IP%.log是日志文件的名字,表示主机名 发送源主机的IP

重启服务

systemctl restart rsyslog

配置交换机发送日志到Loki

  • Cisco交换机
# 设置发送日志的源端口
logging source-interface Vlan99

# 设置目标主机
logging 10.20.20.20
  • 华为交换机
# 根据实际情况修改源接口,或者不配置
info-center loghost source Vlanif999

# 设置 syslog 的目标主机
info-center loghost 10.20.20.20

# 默认情况下是Info级别,所以此命令可以不执行
info-center source default channel loghost log level informational
  • 配置Grafana

导入ID为13639的Dashboard

配置Variables,建议的配置如下

查看日志

参考资料:

[1]https://github.com/grafana/loki/releases/: https://github.com/grafana/loki/releases/

[2]Systemd: https://www.wolai.com/5YUVEN1zqVdZG2inbWBKh9

[3]https://github.com/grafana/loki/releases: https://github.com/grafana/loki/releases​