前言
今天安装agent的时候, 忽然报错, 下面把检查思路记一下
问题排查
问题截图如下:

根据上图我们可以得知, agent平台在调用作业平台的时候, 传的业务ID是3, 并且提示业务不存在.
我们顺着线索, 去CMDB中查看,发现业务ID为3的已经下架了, 所以提示找不到业务为3的项目。
但是有一个问题, 明明我安装的时候业务选择的是6,并不是3,他怎么去调用业务ID为3的项目去了?

因为蓝鲸并不是比较出名的开源软件, 在尝试查社区搜关键字未果以后,变尝试自己解决。
恢复已经下架的业务
那么既然,业务被下架了, 所以导致找不到ID为3的业务,那我们尝试把业务3恢复一下看看如何.
删除以后, 发现重装还是出错.
1 | start job failed: 组件调用异常:IP 10.0.5.57 does not belong to this Business(code=1237104) |
但是我在报错中发现了一个问题, 它报错的IP并不是我安装agent的IP. 竟然是Proxy的IP。
原因
因为我们安装的是P-agent, 因为不是直连安装的时候需要去登录Proxy机器安装。而此时故障原因也定位清楚了。
因为Proxy机器安装的时候, 是在业务ID为3下安装的,所以P-agent安装的时候需要去调用job平台去执行脚本,而job平台执行的时候是需要获得业务ID的,所以节点管理会保存Proxy的业务ID。
但是此时, 我们的业务以及下架了,所以找不到此业务。
解决方法
在当前业务下, 重装Proxy即可
思考
实际上, 这种解决方法,在当前业务下架的时候还是会出现此类现象。
比较健全的方法,应该是把安装 Proxy 节点的工作,移植到蓝鲸业务下。