部署开源夜莺运维监控平台V3版本 – 运维派
官方地址
https://github.com/didi/nightingale
Go
夜莺运维平台是滴滴开源的一个运维平台有着滴滴公司最佳实践
夜莺拆成了四个子系统,分别是:
用户资源中心(RDB)、
资产管理系统(AMS)、
任务执行中心(JOB)
监控告警系统(MON)
具体介绍请看官网,这里重点说明下部署步骤
我这里采用的docker部署
第一步github拉取代码镜像到服务器指定位置
也可以去http://116.85.64.82/ 拉取最新版本的tar包
拉取完成如图所示
第二步配置启动项
下载docker-compose
curl -L https://github.com/docker/compose/releases/download/1.25.0-rc4/docker-compose-`uname -s`-`uname -m` -o /usr/local/bin/docker-compose chmod +x /usr/local/bin/docker-compose
Go
利用docker-compose下载生成并启动镜像
cd /home/yeying-master/nightingale-master/dockerfiles docker-compose up #启动
启动完成docker ps 会生成如图所示四个容器
注意端口不要被占用,否则无法正常启动
若无报错则可正常访问
初始账号密码为 root root.2020至此 master节点搭建完成
第三步配置node节点
wget http://116.85.64.82/n9e.tar.gz tar -xf n9e.tar.gz
解压后如图所示
[root@yeyin-master ~]# ll -rwxr-xr-x. 1 root root 3065 10月 9 23:02 control drwxr-xr-x. 4 root root 4096 10月 9 23:03 etc -rwxr-xr-x. 1 root root 22834094 10月 8 19:50 n9e-agent -rwxr-xr-x. 1 root root 20181862 10月 8 19:50 n9e-ams -rwxr-xr-x. 1 root root 22098532 10月 8 19:50 n9e-index -rwxr-xr-x. 1 root root 20610070 10月 8 19:50 n9e-job -rwxr-xr-x. 1 root root 22062651 10月 8 19:50 n9e-judge -rwxr-xr-x. 1 root root 22890758 10月 8 19:49 n9e-monapi -rwxr-xr-x. 1 root root 23874802 10月 9 22:49 n9e-rdb -rw-r--r--. 1 root root 97333889 10月 9 23:03 n9e.tar.gz -rwxr-xr-x. 1 root root 23887629 10月 8 19:50 n9e-transfer -rwxr-xr-x. 1 root root 20424816 10月 8 19:50 n9e-tsdb drwxr-xr-x. 2 root root 101 9月 28 10:07 sql
Go
将 control n9e-agent /etc/address.yml /etc/agent.yml /etc/identity.yml 打包 拷贝到/home/n9e/
如图所示
修改配置文件vim address.yml将全局192.168.106.132改成master节点的主机的ip
:%s/192.168.106.132/ip/g
Go
配置开机自启服务
vim /usr/lib/systemd/system/agent.service Description=n9e agent After=network-online.target Wants=network-online.target [Service] # modify when deploy in prod env User=root Group=root Type=simple Environment="GIN_MODE=release" ExecStart=/home/n9e/n9e-agent WorkingDirectory=/home/n9e Restart=always RestartSec=1 StartLimitInterval=0 [Install] WantedBy=multi-user.target
Go
systemctl restart agent
systemctl enable agent
检查无报错说明启动正常
systemctl status agent
进入web平台
即可看到刚才添加的node节点的主机信息
任务执行中心可以批量执行任务
用户中心可以批量加入服务器
监控大盘可以产看相应的服务器监控内容,这点还是比较直观的
赞 (0)