当前位置: 首页 > news >正文

【AWS】基于Docker搭建监控系统基础(二)

背景

上一章讲到了认识服务器,这一章讲如何从安装docker到安装基本的监控设施
这章你会知道:Docker、Grafana、Loki、Prometheus、Protmail、Node-Exploer

基本信息:AWS EC2实例 服务器系统版本Ubuntu

安装Docker

`curl-fsSLhttps://get.docker.com|sh`安装docker

docker --version 查看docker版本,确认是否安装,如果安装失败,请自行排查问题

sudosystemctl startdocker--启动dockersudosystemctlenabledocker--关闭docker

这些指令在安装后尝试几次就好,重要是后续会以compose(容器组件)的形式启动
记得添加权限,免得报错

sudousermod-aGdockerubuntu --给docker添加权限
dockerps<-a>--查看


不报错即可,这里是已经搭好了,所以会有东西

dockercompose version --查看compose版本 如果有则不需要另外安装,没有请自行搜索相关教程

文件目录准备

infra
├── grafana
├── loki
├── prometheus
└── promtail
基于建立infra一级目录,然后建立其余的文件目录
举例:

mkdirinfra --创建infracdinfra --进入mkdirxxx --在该目录下再创建

最终我们要做的框架是
Grafana = 展示层
Loki = 日志存储
Promtail = 日志采集
Prometheus = 指标采集
Node Exporter = 服务器指标 (这个由Compose启动时安装下载即可)
cAdVisor = 容器指标 (这个由Compose启动时安装下载即可)

Compose文件准备与安装部署

yaml和yml文件是一个意思,配置时注意一下就好了
docker config

安装部署Loki

wgethttps://raw.githubusercontent.com/grafana/loki/main/cmd/loki/loki-local-config.yamlvimloki-local-config.yaml 编辑查看mkdir-p~/infra/loki/data 创建loki data文件 确认 common: path_prefix: /loki

配置文件

auth_enabled:falseserver:http_listen_port:3100grpc_listen_port:9096log_level:debuggrpc_server_max_concurrent_streams:1000common:instance_addr:127.0.0.1path_prefix:/lokistorage:filesystem:chunks_directory:/tmp/loki/chunksrules_directory:/tmp/loki/rulesreplication_factor:1ring:kvstore:store:inmemoryquery_range:results_cache:cache:embedded_cache:enabled:truemax_size_mb:100limits_config:metric_aggregation_enabled:trueenable_multi_variant_queries:trueschema_config:configs:-from:2020-10-24store:tsdbobject_store:filesystemschema:v13index:prefix:index_period:24hpattern_ingester:enabled:truemetric_aggregation:loki_address:localhost:3100ruler:alertmanager_url:http://localhost:9093frontend:encoding:protobuf

编写Compose 文件

vimdocker-compose.yml
services:grafana:image:grafana/grafanacontainer_name:grafanaports:-"3000:3000"volumes:-./grafana-data:/var/lib/grafanarestart:unless-stoppedloki:image:grafana/loki:latestcontainer_name:lokiports:-"3100:3100"command:-config.file=/etc/loki/local-config.yamlvolumes:-./loki/loki-local-config.yaml:/etc/loki/local-config.yaml-./loki/data:/lokirestart:unless-stopped

启动docoker compose

dockercompose up-d启动dockercompose down 关闭dockerps查看docker容器状态curllocalhost:3100/ready 访问 http://你的服务器ip:3000 登录grafana 默认账户 admin 密码 admin

配置Grafana数据源

登录后访问Grafana->Connections->Add new connection 选择loki
URL填写http://loki:3100
save&testing 保存

安装部署Promtail

作用: 采集日志 ↓ 发送给 Loki ↓ Grafana 展示 日志链路: Linux日志 ↓ Promtail ↓ Loki ↓ Grafana
vim~/infra/promtail/promtail.yaml 编辑promtail配置文件

配置文件样板:

server:http_listen_port:9080positions:filename:/tmp/positions.yamlclients:-url:http://loki:3100/loki/api/v1/pushscrape_configs:-job_name:syslogstatic_configs:-targets:-localhostlabels:job:sysloghost:ec2__path__:/var/log/syslog

向docker-compose.yml追加

promtail:image:grafana/promtail:latestcontainer_name:promtailvolumes:-./promtail/promtail.yaml:/etc/promtail/config.yml-/var/log:/var/logcommand:--config.file=/etc/promtail/config.ymlrestart:unless-stopped
dockercompose up-ddockerps出现 promtail 即配置完成

安装部署Node Exporter

Compose追加

node-exporter:image:prom/node-exportercontainer_name:node-exporterports:-"9100:9100"volumes:-"/:/host:ro,rslave"command:-'--path.rootfs=/host'restart:unless-stopped
dockercompose up-d启动curllocalhost:9090/metrics 访问 看里面有 node_cpu_seconds_total node_memory_MemTotal_bytes之类的参数指标即可

安装部署prometheus

vimprometheus/prometheus.yml
global:scrape_interval:15sscrape_configs:-job_name:prometheusstatic_configs:-targets:-prometheus:9090-job_name:nodestatic_configs:-targets:-node-exporter:9100
dockercompose up-d启动 然后挂载刚刚装的promtail和prometheuscurllocalhost:9100/metrics 访问查看是否有返回,报错则自行查阅解决 访问 http://服务器ip:9090/query 查询up 应该有prometheus和node=1

安装部署cAdvisor

compose追加

cadvisor: image: gcr.io/cadvisor/cadvisor:latest container_name: cadvisor ports: -"8080:8080"volumes: - /:/rootfs:ro - /var/run:/var/run:ro - /sys:/sys:ro - /var/lib/docker:/var/lib/docker:ro restart: unless-stopped

prometheus追加采集

- job_name: cadvisor static_configs: - targets: - cadvisor:8080
dockercompose restart prometheus --重启单个容器dockercompose restart --全部重启curlhttp://服务器ip:9090/query up{job="prometheus"}1up{job="node"}1up{job="cadvisor"}1



以上基础搭建就完成了接下来是grafana的展示层dashboard的搭建

Grafana Dashboard搭建

点击搜索栏或者crtl+k 搜索Import DashBoard

Node Exporter数据源

UID=1860 grafana官方模板 或者 较新的10180


可以用来查看:
CPU使用率
内存占用
磁盘IO
网卡流量
负载Load
文件系统

Loki数据源

UID=13639

查看loki日志
可以用来查看:
按容器看日志
按服务看日志
关键字搜索
错误统计

cAdvisor数据源

Cadvisor exporter
UID=14282

可以用来查看:
容器数量
容器状态
资源占用排行

注意事项和心得

具体的一些安装部署、监控指标怎么看都什么意思等排障和扫盲,待下篇会讲,这里只简单讲。

  • 注意容器的network模式 是host还是bridge 这个很重要,会影响到容器之间的访问,模式不一致容易踩坑
  • 安装部署后一定要立马检查部署是否成功
  • 服务器记得开放进站端口范围(入口)[3000、9100、9090等],用于自己访问或者白名单访问,不要被攻击啦!!!~
http://www.cnnetsun.cn/news/3078549.html

相关文章:

  • Spring Boot Actuator安全防护:Nginx与APISIX字符绕过漏洞深度解析与配置实践
  • Python逆向网易云音乐评论加密:AES+RSA混合加密实战解析
  • TEA系列加密算法实战:从C到Python的跨平台轻量级实现
  • 影刀RPA新手教程:电商创业者完全指南——从零到一搭建第一个自动化选品采价流程
  • GLM5.2本地部署实战:从环境搭建到性能优化全解析
  • 美团王兴的白发
  • 中兴F50怎么安装UFI-TOOLS并远程访问?完整图文教程
  • Python爬虫经典案例003:正则表达式精通指南——文本数据的精准提取技巧
  • 2026顶配单!好用的降AIGC网站全测评,效率直接拉满!
  • FileLock | 文件防删除保护工具
  • 一线观察:长期体验长春汽车贴膜后发现的技术细节
  • 市场正规的画册设计公司口碑
  • 【 Godot 4 学习笔记】Blender到Godot4
  • Flutter 应用加固方法 从 Dart 混淆到 IPA 层面的保护方案
  • 质量好的号卡随身wifi公司
  • 线上AI接口大面积超时:一次从告警到修复的完整排查记录
  • Claude API 接入前的 4 项必备准备:账号、模型、环境、成本控制
  • 龙芯3B6000平台部署Nexus 3私有仓库:Docker容器化实践指南
  • STM32G4 CubeMX实战:手把手教你用SPI搞定DRV8353S电机驱动(附完整代码)
  • 生成式AI机器人潜力初显,企业部署需把握四大关键步骤
  • .env相关配置案例
  • LDPC编码(低密度奇偶校验码)
  • 本地 AI 自动化工具 OpenClaw 部署全流程,附常见故障修复(含安装包)
  • 【共创季稿事节】鸿蒙ArkTS-margin外边距深度解析
  • 【银河麒麟】virt-manager虚拟机之间网络不通问题
  • 别再纠结哪家大模型最强了——模型解耦才是 2026 年 AI 架构的正确姿势
  • fallbackFactory与feign.sentinel.enabled=true
  • 2026年最新八字排盘软件APP推荐 新手必看!
  • RAG 看起来简单,一上线就翻车?逐个排查 5 个环节
  • 2026 主流云手机 72 小时高负载实测:红手指 / 傲晨云 / 多多云 / 雷电云横向对比测评