Grafana 配置涉及多个方面,包括数据源、仪表盘、告警、用户权限等。以下是一个详细的配置指南,涵盖主要配置项和最佳实践:
1. 安装与启动
安装方式:
Docker:docker run -d -p 3000:3000 --name=grafana grafana/grafana-enterprise
二进制包:从 官网 下载对应系统的安装包。
默认访问:
浏览器打开 http://localhost:3000
初始账号:admin / admin(首次登录需修改密码)。
2. 数据源配置
Grafana 支持多种数据源(如 Prometheus、MySQL、InfluxDB、Elasticsearch 等)。
添加数据源:
左侧菜单栏点击 Configuration(齿轮图标)→ Data Sources → Add data source。
选择数据源类型(如 Prometheus)。
填写配置:
URL:数据源地址(如 http://localhost:9090)。
Auth:如需认证,勾选 Basic Auth 或 Bearer Token。
Save & Test:验证连接成功。
3. 仪表盘配置
创建仪表盘:
点击 Create(加号图标)→ Dashboard。
点击 Add Visualization 添加图表。
面板配置:
Query:选择数据源并编写查询语句(如 Prometheus 的 PromQL)。
Visualization:选择图表类型(折线图、柱状图、仪表盘等)。
Panel Title:设置面板名称。
Save:保存仪表盘(可设置文件夹和权限)。
4. 告警配置
前提:需配置告警通道(如邮件、Slack、Webhook)。
步骤:
告警通道设置:
Configuration → Alerting → Alertmanagers 添加 Alertmanager。
Notification channels 配置通知渠道。
创建告警规则:
在图表编辑界面,切换到 Alert 标签页。
设置告警条件(如 avg() > 阈值)、评估间隔和通知渠道。
5. 用户与权限管理
用户角色:
Viewer:仅查看仪表盘。
Editor:可编辑仪表盘。
Admin:管理数据源、用户等。
配置路径:
Administration → Users and Access 管理用户。
仪表盘权限:在仪表盘设置中通过 Permissions 分配。
6. 配置文件
Grafana 主配置文件通常为 grafana.ini(位于 /etc/grafana/ 或安装目录)。
关键配置项:
ini
[server]
http_port = 3000
domain = localhost
[database]
type = sqlite3 # 默认使用 SQLite,生产环境建议 PostgreSQL
[security]
admin_user = admin
admin_password = strong_password # 建议修改
[auth]
disable_login_form = false
[smtp]
enabled = true
host = smtp.gmail.com:587
user = your_email@gmail.com
password = your_password
环境变量:所有配置可通过环境变量覆盖(格式:GF_<Section>_<Key>,如 GF_SECURITY_ADMIN_PASSWORD)。
7. 插件管理
安装插件:
bash
grafana-cli plugins install <plugin-name>
常用插件:
数据源插件:grafana-clock-panel、grafana-piechart-panel。
面板插件:从 Grafana 插件市场 查找。
8. 持久化与备份
数据存储:
仪表盘元数据默认存储在 SQLite/PostgreSQL 中。
建议定期备份数据库和配置文件。
导出/导入仪表盘:
通过仪表盘设置中的 Export/Import 功能迁移 JSON 文件。
9. 最佳实践
使用版本控制:将仪表盘 JSON 文件存入 Git。
分离环境:区分开发、测试、生产环境的 Grafana 实例。
监控 Grafana 自身:通过内置的 /metrics 端点暴露 Prometheus 指标。
定期更新:保持 Grafana 版本更新以获取新功能和安全补丁。
10. 故障排查
日志位置:默认在 /var/log/grafana/grafana.log。
常见问题:
数据源连接失败:检查网络、认证信息。
图表无数据:验证查询语句和时间范围。
告警不触发:检查 Alertmanager 配置和告警规则。
示例:监控服务器 CPU 使用率
数据源:Prometheus(已监控节点)。
查询:100 - (avg by(instance) (rate(node_cpu_seconds_total{mode="idle"}[5m])) * 100)。
图表:折线图,设置 Y 轴单位为百分比。
告警:当 CPU 使用率 >80% 持续 5 分钟时发送通知。
通过以上配置,你可以快速搭建一个功能完整的监控平台。根据实际需求调整数据源、仪表盘和告警规则。
上一条:购软平台是axoniq中国代理商
下一条:grafana模板