You are viewing a plain text version of this content. The canonical link for it is here.
Posted to users-cn@cloudstack.apache.org by "yan_5386@163.com" <ya...@163.com> on 2014/11/28 07:22:37 UTC

回复: 回复: kvm主机加入cloudstack4.0.2失败

CS加入主机的时候,执行命令cloud-setup-agent  -m 10.6.27.103 -z 1 -p 1 -c 1 -g f20023a3-34a2-3ac5-91bd-f99a046ae76a -a --pubNic=cloudbr0 --prvNic=cloudbr0 --guestNic=cloudbr0  写入配置文件agent.properties


一直在路上
 
发件人: 谢福平
发送时间: 2014-11-28 14:06
收件人: users-cn
主题: 回复: kvm主机加入cloudstack4.0.2失败
你好,谢谢你的答复。
我的这个文件agent.properties,确实有问题:
workers=5
#host= The IP address of management server
host=10.6.27.103
#port = The port management server listening on, default is 8250
port=8250
#cluster= The cluster which the agent belongs to
cluster=default
#pod= The pod which the agent belongs to
pod=default
#zone= The zone which the agent belongs to
zone=default
这里不只需要改host,其它的参数好像也不对,如pod,zone的信息,也没有进来
  
请问这个文件是什么时候生成的,为什么我的这个文件不对呢
  
正常节点的agent.properties内容:
guest.network.device=cloudbr2
workers=5
private.network.device=cloudbr2
port=8250
resource=com.cloud.hypervisor.kvm.resource.LibvirtComputingResource
pod=1
zone=1
guid=2f5167d8-b5ff-3714-8c7e-2e8a4d6d43c2
public.network.device=cloudbr2
cluster=1
local.storage.uuid=fd93ad47-8d6b-4561-a1d9-71a93a0c81c9
domr.scripts.dir=scripts/network/domr/kvm
LibvirtComputingResource.id=6
host=10.6.27.2
  
  
 
 
------------------ 原始邮件 ------------------
  发件人: "yan_5386@163.com";<ya...@163.com>;
发送时间: 2014年11月28日(星期五) 中午1:39
收件人: "users-cn"<us...@cloudstack.apache.org>; 
主题: 回复: kvm主机加入cloudstack4.0.2失败
 
 
Connecting to localhost:8250            //kvm主机为什么连接这个本地IP    /etc/cloudstack/agent/agent.properties 配置文件中的host改为CS 地址,重启agent试一下呢
 
 
yan_5386@163.com
发件人: 谢福平
发送时间: 2014-11-28 13:24
收件人: users-cn
主题: kvm主机加入cloudstack4.0.2失败
环境信息: kvm主机,CS4.0.2,基本网络模式
问题描述:增加主机时,管理节点报错,日志如下。每次加入失败,会将主机的SELINUX配置恢复默认,libvirt服务也会停止。
2014-11-28 13:13:26,816 INFO  [cloud.resource.ResourceManagerImpl] (catalina-exec-15:null) Trying to add a new host at http://10.6.31.4 in data center 1
2014-11-28 13:13:27,204 DEBUG [utils.ssh.SSHCmdHelper] (catalina-exec-15:null) Executing cmd: lsmod|grep kvm
2014-11-28 13:13:28,324 DEBUG [utils.ssh.SSHCmdHelper] (catalina-exec-15:null) lsmod|grep kvm output:kvm_intel              52570  0 
kvm                   314739  1 kvm_intel
2014-11-28 13:13:29,330 DEBUG [utils.ssh.SSHCmdHelper] (catalina-exec-15:null) Executing cmd: cloud-setup-agent  -m 10.6.27.103 -z 1 -p 1 -c 1 -g f20023a3-34a2-3ac5-91bd-f99a046ae76a -a --pubNic=cloudbr0 --prvNic=cloudbr0 --guestNic=cloudbr0
2014-11-28 13:13:31,394 DEBUG [cloud.server.StatsCollector] (StatsCollector-1:null) HostStatsCollector is running...
2014-11-28 13:13:37,120 DEBUG [cloud.consoleproxy.ConsoleProxyManagerImpl] (consoleproxy-1:null) Skip capacity scan due to there is no Primary Storage UPintenance mode
2014-11-28 13:13:37,517 DEBUG [network.router.VirtualNetworkApplianceManagerImpl] (RouterStatusMonitor-1:null) Found 0 routers. 
2014-11-28 13:13:44,931 DEBUG [utils.ssh.SSHCmdHelper] (catalina-exec-15:null) cloud-setup-agent  -m 10.6.27.103 -z 1 -p 1 -c 1 -g f20023a3-34a2-3ac5-91bd-f99a046ae76a -a --pubNic=cloudbr0 --prvNic=cloudbr0 --guestNic=cloudbr0 output:[Failed]
ore Libvirt ...           bvirt
Try to restore your system:
Restore SElinux ...           
2014-11-28 13:14:07,120 DEBUG [cloud.consoleproxy.ConsoleProxyManagerImpl] (consoleproxy-1:null) Skip capacity scan due to there is no Primary Storage UPintenance mode
2014-11-28 13:14:07,517 DEBUG [network.router.VirtualNetworkApplianceManagerImpl] (RouterStatusMonitor-1:null) Found 0 routers. 
2014-11-28 13:14:24,049 DEBUG [cloud.server.StatsCollector] (StatsCollector-1:null) VmStatsCollector is running...
2014-11-28 13:14:24,865 DEBUG [cloud.server.StatsCollector] (StatsCollector-1:null) StorageCollector is running...
2014-11-28 13:14:31,395 DEBUG [cloud.server.StatsCollector] (StatsCollector-3:null) HostStatsCollector is running...
2014-11-28 13:14:37,120 DEBUG [cloud.consoleproxy.ConsoleProxyManagerImpl] (consoleproxy-1:null) Skip capacity scan due to there is no Primary Storage UPintenance mode
2014-11-28 13:14:37,517 DEBUG [network.router.VirtualNetworkApplianceManagerImpl] (RouterStatusMonitor-1:null) Found 0 routers. 
  
在主机侧,日志一直在打印
2014-11-28 13:18:13,560 INFO  [utils.nio.NioClient] (Agent-Selector:null) Connecting to localhost:8250
2014-11-28 13:18:13,560 ERROR [utils.nio.NioConnection] (Agent-Selector:null) Unable to connect to remote
2014-11-28 13:18:18,561 INFO  [utils.nio.NioClient] (Agent-Selector:null) Connecting to localhost:8250
2014-11-28 13:18:18,561 ERROR [utils.nio.NioConnection] (Agent-Selector:null) Unable to connect to remote
2014-11-28 13:18:23,562 INFO  [utils.nio.NioClient] (Agent-Selector:null) Connecting to localhost:8250
2014-11-28 13:18:23,563 ERROR [utils.nio.NioConnection] (Agent-Selector:null) Unable to connect to remote
  
初步分析,是主机的哪些配置文件有问题。但是不知道如何进一步定位,求高手指导。
主机目前已经配置的内容:
一个网桥:管理,存储,来宾共用
hostname:已经配置/etc/hosts
SELINUX=permissive
防火墙增加:
-A INPUT -p tcp -m tcp --dport 22 -j ACCEPT
-A INPUT -p tcp -m tcp --dport 1798 -j ACCEPT
-A INPUT -p tcp -m tcp --dport 16509 -j ACCEPT
-A INPUT -p tcp -m tcp --dport 5900:6100 -j ACCEPT
-A INPUT -p tcp -m tcp --dport 49152:49216 -j ACCEPT
配置文件
/etc/libvirt/qemu.conf
/etc/libvirt/libvirtd.conf
/etc/sysconfig/libvirtd 
都已经修改过了,确定没有问题

Re: 回复: kvm主机加入cloudstack4.0.2失败

Posted by Darren Tang <da...@gmail.com>.
楼上兄弟正解。
在你添加的那台kvm主机中执行 :
cloud-setup-agent  -m 10.6.27.103 -z 1 -p 1 -c 1 -g
f20023a3-34a2-3ac5-91bd-f99a046ae76a
-a --pubNic=cloudbr0 --prvNic=cloudbr0 --guestNic=cloudbr0
这个命令,查看到哪一步骤报错。
如果没有报错,那么该主机已经被加入cs。然后删除该主机,重新添加即可。以便重新生成agent配置文件。或手动更新。

在 2014年11月28日 下午2:37,yan_5386@163.com <ya...@163.com>写道:

> 你好,把这个命令复制下,放到KVM主机上执行以下
>
>
>
> 一直在路上
>
> 发件人: 谢福平
> 发送时间: 2014-11-28 14:26
> 收件人: users-cn
> 主题: 回复: 回复: kvm主机加入cloudstack4.0.2失败
> 但我的日志中有如下内容,请查邮件最初的管理日志:
> 2014-11-28 13:13:44,931 DEBUG [utils.ssh.SSHCmdHelper]
> (catalina-exec-15:null) cloud-setup-agent -m 10.6.27.103 -z 1 -p 1 -c 1 -g
> f20023a3-34a2-3ac5-91bd-f99a046ae76a -a --pubNic=cloudbr0 --prvNic=cloudbr0
> --guestNic=cloudbr0 output:[Failed]
>
> 说明执行这个脚本失败了,然后导致配置信息都没有写到agent.properties中。
> 是这样吗?
>
>
> 如果是这个意思,怎呢看命令cloud-setup-agent会为什么失败,日志中能得到的信息很少啊:
> 2014-11-28 13:13:29,330 DEBUG [utils.ssh.SSHCmdHelper]
> (catalina-exec-15:null) Executing cmd: cloud-setup-agent -m 10.6.27.103 -z
> 1 -p 1 -c 1 -g f20023a3-34a2-3ac5-91bd-f99a046ae76a -a --pubNic=cloudbr0
> --prvNic=cloudbr0 --guestNic=cloudbr0
> 2014-11-28 13:13:31,394 DEBUG [cloud.server.StatsCollector]
> (StatsCollector-1:null) HostStatsCollector is running...
>
>
> ------------------ 原始邮件 ------------------
>   发件人: "yan_5386@163.com";<ya...@163.com>;
> 发送时间: 2014年11月28日(星期五) 下午2:22
> 收件人: "users-cn"<us...@cloudstack.apache.org>;
> 主题: 回复: 回复: kvm主机加入cloudstack4.0.2失败
>
>
>
> CS加入主机的时候,执行命令cloud-setup-agent  -m 10.6.27.103 -z 1 -p 1 -c 1 -g
> f20023a3-34a2-3ac5-91bd-f99a046ae76a -a --pubNic=cloudbr0 --prvNic=cloudbr0
> --guestNic=cloudbr0  写入配置文件agent.properties
>
>
> 一直在路上
> 发件人: 谢福平
> 发送时间: 2014-11-28 14:06
> 收件人: users-cn
> 主题: 回复: kvm主机加入cloudstack4.0.2失败
> 你好,谢谢你的答复。
> 我的这个文件agent.properties,确实有问题:
> workers=5
> #host= The IP address of management server
> host=10.6.27.103
> #port = The port management server listening on, default is 8250
> port=8250
> #cluster= The cluster which the agent belongs to
> cluster=default
> #pod= The pod which the agent belongs to
> pod=default
> #zone= The zone which the agent belongs to
> zone=default
> 这里不只需要改host,其它的参数好像也不对,如pod,zone的信息,也没有进来
>
> 请问这个文件是什么时候生成的,为什么我的这个文件不对呢
>
> 正常节点的agent.properties内容:
> guest.network.device=cloudbr2
> workers=5
> private.network.device=cloudbr2
> port=8250
> resource=com.cloud.hypervisor.kvm.resource.LibvirtComputingResource
> pod=1
> zone=1
> guid=2f5167d8-b5ff-3714-8c7e-2e8a4d6d43c2
> public.network.device=cloudbr2
> cluster=1
> local.storage.uuid=fd93ad47-8d6b-4561-a1d9-71a93a0c81c9
> domr.scripts.dir=scripts/network/domr/kvm
> LibvirtComputingResource.id=6
> host=10.6.27.2
>
>
> ------------------ 原始邮件 ------------------
>   发件人: "yan_5386@163.com";<ya...@163.com>;
> 发送时间: 2014年11月28日(星期五) 中午1:39
> 收件人: "users-cn"<us...@cloudstack.apache.org>;
> 主题: 回复: kvm主机加入cloudstack4.0.2失败
> Connecting to localhost:8250            //kvm主机为什么连接这个本地IP
> /etc/cloudstack/agent/agent.properties 配置文件中的host改为CS 地址,重启agent试一下呢
> yan_5386@163.com
> 发件人: 谢福平
> 发送时间: 2014-11-28 13:24
> 收件人: users-cn
> 主题: kvm主机加入cloudstack4.0.2失败
> 环境信息: kvm主机,CS4.0.2,基本网络模式
> 问题描述:增加主机时,管理节点报错,日志如下。每次加入失败,会将主机的SELINUX配置恢复默认,libvirt服务也会停止。
> 2014-11-28 13:13:26,816 INFO  [cloud.resource.ResourceManagerImpl]
> (catalina-exec-15:null) Trying to add a new host at http://10.6.31.4 in
> data center 1
> 2014-11-28 13:13:27,204 DEBUG [utils.ssh.SSHCmdHelper]
> (catalina-exec-15:null) Executing cmd: lsmod|grep kvm
> 2014-11-28 13:13:28,324 DEBUG [utils.ssh.SSHCmdHelper]
> (catalina-exec-15:null) lsmod|grep kvm output:kvm_intel              52570
> 0
> kvm                   314739  1 kvm_intel
> 2014-11-28 13:13:29,330 DEBUG [utils.ssh.SSHCmdHelper]
> (catalina-exec-15:null) Executing cmd: cloud-setup-agent  -m 10.6.27.103 -z
> 1 -p 1 -c 1 -g f20023a3-34a2-3ac5-91bd-f99a046ae76a -a --pubNic=cloudbr0
> --prvNic=cloudbr0 --guestNic=cloudbr0
> 2014-11-28 13:13:31,394 DEBUG [cloud.server.StatsCollector]
> (StatsCollector-1:null) HostStatsCollector is running...
> 2014-11-28 13:13:37,120 DEBUG [cloud.consoleproxy.ConsoleProxyManagerImpl]
> (consoleproxy-1:null) Skip capacity scan due to there is no Primary Storage
> UPintenance mode
> 2014-11-28 13:13:37,517 DEBUG
> [network.router.VirtualNetworkApplianceManagerImpl]
> (RouterStatusMonitor-1:null) Found 0 routers.
> 2014-11-28 13:13:44,931 DEBUG [utils.ssh.SSHCmdHelper]
> (catalina-exec-15:null) cloud-setup-agent  -m 10.6.27.103 -z 1 -p 1 -c 1 -g
> f20023a3-34a2-3ac5-91bd-f99a046ae76a -a --pubNic=cloudbr0 --prvNic=cloudbr0
> --guestNic=cloudbr0 output:[Failed]
> ore Libvirt ...           bvirt
> Try to restore your system:
> Restore SElinux ...
> 2014-11-28 13:14:07,120 DEBUG [cloud.consoleproxy.ConsoleProxyManagerImpl]
> (consoleproxy-1:null) Skip capacity scan due to there is no Primary Storage
> UPintenance mode
> 2014-11-28 13:14:07,517 DEBUG
> [network.router.VirtualNetworkApplianceManagerImpl]
> (RouterStatusMonitor-1:null) Found 0 routers.
> 2014-11-28 13:14:24,049 DEBUG [cloud.server.StatsCollector]
> (StatsCollector-1:null) VmStatsCollector is running...
> 2014-11-28 13:14:24,865 DEBUG [cloud.server.StatsCollector]
> (StatsCollector-1:null) StorageCollector is running...
> 2014-11-28 13:14:31,395 DEBUG [cloud.server.StatsCollector]
> (StatsCollector-3:null) HostStatsCollector is running...
> 2014-11-28 13:14:37,120 DEBUG [cloud.consoleproxy.ConsoleProxyManagerImpl]
> (consoleproxy-1:null) Skip capacity scan due to there is no Primary Storage
> UPintenance mode
> 2014-11-28 13:14:37,517 DEBUG
> [network.router.VirtualNetworkApplianceManagerImpl]
> (RouterStatusMonitor-1:null) Found 0 routers.
>
> 在主机侧,日志一直在打印
> 2014-11-28 13:18:13,560 INFO  [utils.nio.NioClient] (Agent-Selector:null)
> Connecting to localhost:8250
> 2014-11-28 13:18:13,560 ERROR [utils.nio.NioConnection]
> (Agent-Selector:null) Unable to connect to remote
> 2014-11-28 13:18:18,561 INFO  [utils.nio.NioClient] (Agent-Selector:null)
> Connecting to localhost:8250
> 2014-11-28 13:18:18,561 ERROR [utils.nio.NioConnection]
> (Agent-Selector:null) Unable to connect to remote
> 2014-11-28 13:18:23,562 INFO  [utils.nio.NioClient] (Agent-Selector:null)
> Connecting to localhost:8250
> 2014-11-28 13:18:23,563 ERROR [utils.nio.NioConnection]
> (Agent-Selector:null) Unable to connect to remote
>
> 初步分析,是主机的哪些配置文件有问题。但是不知道如何进一步定位,求高手指导。
> 主机目前已经配置的内容:
> 一个网桥:管理,存储,来宾共用
> hostname:已经配置/etc/hosts
> SELINUX=permissive
> 防火墙增加:
> -A INPUT -p tcp -m tcp --dport 22 -j ACCEPT
> -A INPUT -p tcp -m tcp --dport 1798 -j ACCEPT
> -A INPUT -p tcp -m tcp --dport 16509 -j ACCEPT
> -A INPUT -p tcp -m tcp --dport 5900:6100 -j ACCEPT
> -A INPUT -p tcp -m tcp --dport 49152:49216 -j ACCEPT
> 配置文件
> /etc/libvirt/qemu.conf
> /etc/libvirt/libvirtd.conf
> /etc/sysconfig/libvirtd
> 都已经修改过了,确定没有问题
>

回复: 回复: kvm主机加入cloudstack4.0.2失败

Posted by "yan_5386@163.com" <ya...@163.com>.
你好,把这个命令复制下,放到KVM主机上执行以下



一直在路上
 
发件人: 谢福平
发送时间: 2014-11-28 14:26
收件人: users-cn
主题: 回复: 回复: kvm主机加入cloudstack4.0.2失败
但我的日志中有如下内容,请查邮件最初的管理日志:
2014-11-28 13:13:44,931 DEBUG [utils.ssh.SSHCmdHelper] (catalina-exec-15:null) cloud-setup-agent -m 10.6.27.103 -z 1 -p 1 -c 1 -g f20023a3-34a2-3ac5-91bd-f99a046ae76a -a --pubNic=cloudbr0 --prvNic=cloudbr0 --guestNic=cloudbr0 output:[Failed]
 
说明执行这个脚本失败了,然后导致配置信息都没有写到agent.properties中。
是这样吗?
  
 
如果是这个意思,怎呢看命令cloud-setup-agent会为什么失败,日志中能得到的信息很少啊:
2014-11-28 13:13:29,330 DEBUG [utils.ssh.SSHCmdHelper] (catalina-exec-15:null) Executing cmd: cloud-setup-agent -m 10.6.27.103 -z 1 -p 1 -c 1 -g f20023a3-34a2-3ac5-91bd-f99a046ae76a -a --pubNic=cloudbr0 --prvNic=cloudbr0 --guestNic=cloudbr0
2014-11-28 13:13:31,394 DEBUG [cloud.server.StatsCollector] (StatsCollector-1:null) HostStatsCollector is running...
  
  
------------------ 原始邮件 ------------------
  发件人: "yan_5386@163.com";<ya...@163.com>;
发送时间: 2014年11月28日(星期五) 下午2:22
收件人: "users-cn"<us...@cloudstack.apache.org>; 
主题: 回复: 回复: kvm主机加入cloudstack4.0.2失败
 
 
 
CS加入主机的时候,执行命令cloud-setup-agent  -m 10.6.27.103 -z 1 -p 1 -c 1 -g f20023a3-34a2-3ac5-91bd-f99a046ae76a -a --pubNic=cloudbr0 --prvNic=cloudbr0 --guestNic=cloudbr0  写入配置文件agent.properties
 
 
一直在路上
发件人: 谢福平
发送时间: 2014-11-28 14:06
收件人: users-cn
主题: 回复: kvm主机加入cloudstack4.0.2失败
你好,谢谢你的答复。
我的这个文件agent.properties,确实有问题:
workers=5
#host= The IP address of management server
host=10.6.27.103
#port = The port management server listening on, default is 8250
port=8250
#cluster= The cluster which the agent belongs to
cluster=default
#pod= The pod which the agent belongs to
pod=default
#zone= The zone which the agent belongs to
zone=default
这里不只需要改host,其它的参数好像也不对,如pod,zone的信息,也没有进来
  
请问这个文件是什么时候生成的,为什么我的这个文件不对呢
  
正常节点的agent.properties内容:
guest.network.device=cloudbr2
workers=5
private.network.device=cloudbr2
port=8250
resource=com.cloud.hypervisor.kvm.resource.LibvirtComputingResource
pod=1
zone=1
guid=2f5167d8-b5ff-3714-8c7e-2e8a4d6d43c2
public.network.device=cloudbr2
cluster=1
local.storage.uuid=fd93ad47-8d6b-4561-a1d9-71a93a0c81c9
domr.scripts.dir=scripts/network/domr/kvm
LibvirtComputingResource.id=6
host=10.6.27.2
  
  
------------------ 原始邮件 ------------------
  发件人: "yan_5386@163.com";<ya...@163.com>;
发送时间: 2014年11月28日(星期五) 中午1:39
收件人: "users-cn"<us...@cloudstack.apache.org>; 
主题: 回复: kvm主机加入cloudstack4.0.2失败
Connecting to localhost:8250            //kvm主机为什么连接这个本地IP    /etc/cloudstack/agent/agent.properties 配置文件中的host改为CS 地址,重启agent试一下呢
yan_5386@163.com
发件人: 谢福平
发送时间: 2014-11-28 13:24
收件人: users-cn
主题: kvm主机加入cloudstack4.0.2失败
环境信息: kvm主机,CS4.0.2,基本网络模式
问题描述:增加主机时,管理节点报错,日志如下。每次加入失败,会将主机的SELINUX配置恢复默认,libvirt服务也会停止。
2014-11-28 13:13:26,816 INFO  [cloud.resource.ResourceManagerImpl] (catalina-exec-15:null) Trying to add a new host at http://10.6.31.4 in data center 1
2014-11-28 13:13:27,204 DEBUG [utils.ssh.SSHCmdHelper] (catalina-exec-15:null) Executing cmd: lsmod|grep kvm
2014-11-28 13:13:28,324 DEBUG [utils.ssh.SSHCmdHelper] (catalina-exec-15:null) lsmod|grep kvm output:kvm_intel              52570  0 
kvm                   314739  1 kvm_intel
2014-11-28 13:13:29,330 DEBUG [utils.ssh.SSHCmdHelper] (catalina-exec-15:null) Executing cmd: cloud-setup-agent  -m 10.6.27.103 -z 1 -p 1 -c 1 -g f20023a3-34a2-3ac5-91bd-f99a046ae76a -a --pubNic=cloudbr0 --prvNic=cloudbr0 --guestNic=cloudbr0
2014-11-28 13:13:31,394 DEBUG [cloud.server.StatsCollector] (StatsCollector-1:null) HostStatsCollector is running...
2014-11-28 13:13:37,120 DEBUG [cloud.consoleproxy.ConsoleProxyManagerImpl] (consoleproxy-1:null) Skip capacity scan due to there is no Primary Storage UPintenance mode
2014-11-28 13:13:37,517 DEBUG [network.router.VirtualNetworkApplianceManagerImpl] (RouterStatusMonitor-1:null) Found 0 routers. 
2014-11-28 13:13:44,931 DEBUG [utils.ssh.SSHCmdHelper] (catalina-exec-15:null) cloud-setup-agent  -m 10.6.27.103 -z 1 -p 1 -c 1 -g f20023a3-34a2-3ac5-91bd-f99a046ae76a -a --pubNic=cloudbr0 --prvNic=cloudbr0 --guestNic=cloudbr0 output:[Failed]
ore Libvirt ...           bvirt
Try to restore your system:
Restore SElinux ...           
2014-11-28 13:14:07,120 DEBUG [cloud.consoleproxy.ConsoleProxyManagerImpl] (consoleproxy-1:null) Skip capacity scan due to there is no Primary Storage UPintenance mode
2014-11-28 13:14:07,517 DEBUG [network.router.VirtualNetworkApplianceManagerImpl] (RouterStatusMonitor-1:null) Found 0 routers. 
2014-11-28 13:14:24,049 DEBUG [cloud.server.StatsCollector] (StatsCollector-1:null) VmStatsCollector is running...
2014-11-28 13:14:24,865 DEBUG [cloud.server.StatsCollector] (StatsCollector-1:null) StorageCollector is running...
2014-11-28 13:14:31,395 DEBUG [cloud.server.StatsCollector] (StatsCollector-3:null) HostStatsCollector is running...
2014-11-28 13:14:37,120 DEBUG [cloud.consoleproxy.ConsoleProxyManagerImpl] (consoleproxy-1:null) Skip capacity scan due to there is no Primary Storage UPintenance mode
2014-11-28 13:14:37,517 DEBUG [network.router.VirtualNetworkApplianceManagerImpl] (RouterStatusMonitor-1:null) Found 0 routers. 
  
在主机侧,日志一直在打印
2014-11-28 13:18:13,560 INFO  [utils.nio.NioClient] (Agent-Selector:null) Connecting to localhost:8250
2014-11-28 13:18:13,560 ERROR [utils.nio.NioConnection] (Agent-Selector:null) Unable to connect to remote
2014-11-28 13:18:18,561 INFO  [utils.nio.NioClient] (Agent-Selector:null) Connecting to localhost:8250
2014-11-28 13:18:18,561 ERROR [utils.nio.NioConnection] (Agent-Selector:null) Unable to connect to remote
2014-11-28 13:18:23,562 INFO  [utils.nio.NioClient] (Agent-Selector:null) Connecting to localhost:8250
2014-11-28 13:18:23,563 ERROR [utils.nio.NioConnection] (Agent-Selector:null) Unable to connect to remote
  
初步分析,是主机的哪些配置文件有问题。但是不知道如何进一步定位,求高手指导。
主机目前已经配置的内容:
一个网桥:管理,存储,来宾共用
hostname:已经配置/etc/hosts
SELINUX=permissive
防火墙增加:
-A INPUT -p tcp -m tcp --dport 22 -j ACCEPT
-A INPUT -p tcp -m tcp --dport 1798 -j ACCEPT
-A INPUT -p tcp -m tcp --dport 16509 -j ACCEPT
-A INPUT -p tcp -m tcp --dport 5900:6100 -j ACCEPT
-A INPUT -p tcp -m tcp --dport 49152:49216 -j ACCEPT
配置文件
/etc/libvirt/qemu.conf
/etc/libvirt/libvirtd.conf
/etc/sysconfig/libvirtd 
都已经修改过了,确定没有问题

回复: 回复: kvm主机加入cloudstack4.0.2失败

Posted by 谢福平 <75...@qq.com>.
但我的日志中有如下内容,请查邮件最初的管理日志:
 2014-11-28 13:13:44,931 DEBUG [utils.ssh.SSHCmdHelper] (catalina-exec-15:null) cloud-setup-agent -m 10.6.27.103 -z 1 -p 1 -c 1 -g f20023a3-34a2-3ac5-91bd-f99a046ae76a -a --pubNic=cloudbr0 --prvNic=cloudbr0 --guestNic=cloudbr0 output:[Failed]

 说明执行这个脚本失败了,然后导致配置信息都没有写到agent.properties中。
 是这样吗?
  

 如果是这个意思,怎呢看命令cloud-setup-agent会为什么失败,日志中能得到的信息很少啊:
 2014-11-28 13:13:29,330 DEBUG [utils.ssh.SSHCmdHelper] (catalina-exec-15:null) Executing cmd: cloud-setup-agent -m 10.6.27.103 -z 1 -p 1 -c 1 -g f20023a3-34a2-3ac5-91bd-f99a046ae76a -a --pubNic=cloudbr0 --prvNic=cloudbr0 --guestNic=cloudbr0
2014-11-28 13:13:31,394 DEBUG [cloud.server.StatsCollector] (StatsCollector-1:null) HostStatsCollector is running...
  
  
 ------------------ 原始邮件 ------------------
  发件人: "yan_5386@163.com";<ya...@163.com>;
 发送时间: 2014年11月28日(星期五) 下午2:22
 收件人: "users-cn"<us...@cloudstack.apache.org>; 
 
 主题: 回复: 回复: kvm主机加入cloudstack4.0.2失败

 


CS加入主机的时候,执行命令cloud-setup-agent  -m 10.6.27.103 -z 1 -p 1 -c 1 -g f20023a3-34a2-3ac5-91bd-f99a046ae76a -a --pubNic=cloudbr0 --prvNic=cloudbr0 --guestNic=cloudbr0  写入配置文件agent.properties


一直在路上
 
发件人: 谢福平
发送时间: 2014-11-28 14:06
收件人: users-cn
主题: 回复: kvm主机加入cloudstack4.0.2失败
你好,谢谢你的答复。
我的这个文件agent.properties,确实有问题:
workers=5
#host= The IP address of management server
host=10.6.27.103
#port = The port management server listening on, default is 8250
port=8250
#cluster= The cluster which the agent belongs to
cluster=default
#pod= The pod which the agent belongs to
pod=default
#zone= The zone which the agent belongs to
zone=default
这里不只需要改host,其它的参数好像也不对,如pod,zone的信息,也没有进来
  
请问这个文件是什么时候生成的,为什么我的这个文件不对呢
  
正常节点的agent.properties内容:
guest.network.device=cloudbr2
workers=5
private.network.device=cloudbr2
port=8250
resource=com.cloud.hypervisor.kvm.resource.LibvirtComputingResource
pod=1
zone=1
guid=2f5167d8-b5ff-3714-8c7e-2e8a4d6d43c2
public.network.device=cloudbr2
cluster=1
local.storage.uuid=fd93ad47-8d6b-4561-a1d9-71a93a0c81c9
domr.scripts.dir=scripts/network/domr/kvm
LibvirtComputingResource.id=6
host=10.6.27.2
  
  
 
 
------------------ 原始邮件 ------------------
  发件人: "yan_5386@163.com";<ya...@163.com>;
发送时间: 2014年11月28日(星期五) 中午1:39
收件人: "users-cn"<us...@cloudstack.apache.org>; 
主题: 回复: kvm主机加入cloudstack4.0.2失败
 
 
Connecting to localhost:8250            //kvm主机为什么连接这个本地IP    /etc/cloudstack/agent/agent.properties 配置文件中的host改为CS 地址,重启agent试一下呢
 
 
yan_5386@163.com
发件人: 谢福平
发送时间: 2014-11-28 13:24
收件人: users-cn
主题: kvm主机加入cloudstack4.0.2失败
环境信息: kvm主机,CS4.0.2,基本网络模式
问题描述:增加主机时,管理节点报错,日志如下。每次加入失败,会将主机的SELINUX配置恢复默认,libvirt服务也会停止。
2014-11-28 13:13:26,816 INFO  [cloud.resource.ResourceManagerImpl] (catalina-exec-15:null) Trying to add a new host at http://10.6.31.4 in data center 1
2014-11-28 13:13:27,204 DEBUG [utils.ssh.SSHCmdHelper] (catalina-exec-15:null) Executing cmd: lsmod|grep kvm
2014-11-28 13:13:28,324 DEBUG [utils.ssh.SSHCmdHelper] (catalina-exec-15:null) lsmod|grep kvm output:kvm_intel              52570  0 
kvm                   314739  1 kvm_intel
2014-11-28 13:13:29,330 DEBUG [utils.ssh.SSHCmdHelper] (catalina-exec-15:null) Executing cmd: cloud-setup-agent  -m 10.6.27.103 -z 1 -p 1 -c 1 -g f20023a3-34a2-3ac5-91bd-f99a046ae76a -a --pubNic=cloudbr0 --prvNic=cloudbr0 --guestNic=cloudbr0
2014-11-28 13:13:31,394 DEBUG [cloud.server.StatsCollector] (StatsCollector-1:null) HostStatsCollector is running...
2014-11-28 13:13:37,120 DEBUG [cloud.consoleproxy.ConsoleProxyManagerImpl] (consoleproxy-1:null) Skip capacity scan due to there is no Primary Storage UPintenance mode
2014-11-28 13:13:37,517 DEBUG [network.router.VirtualNetworkApplianceManagerImpl] (RouterStatusMonitor-1:null) Found 0 routers. 
2014-11-28 13:13:44,931 DEBUG [utils.ssh.SSHCmdHelper] (catalina-exec-15:null) cloud-setup-agent  -m 10.6.27.103 -z 1 -p 1 -c 1 -g f20023a3-34a2-3ac5-91bd-f99a046ae76a -a --pubNic=cloudbr0 --prvNic=cloudbr0 --guestNic=cloudbr0 output:[Failed]
ore Libvirt ...           bvirt
Try to restore your system:
Restore SElinux ...           
2014-11-28 13:14:07,120 DEBUG [cloud.consoleproxy.ConsoleProxyManagerImpl] (consoleproxy-1:null) Skip capacity scan due to there is no Primary Storage UPintenance mode
2014-11-28 13:14:07,517 DEBUG [network.router.VirtualNetworkApplianceManagerImpl] (RouterStatusMonitor-1:null) Found 0 routers. 
2014-11-28 13:14:24,049 DEBUG [cloud.server.StatsCollector] (StatsCollector-1:null) VmStatsCollector is running...
2014-11-28 13:14:24,865 DEBUG [cloud.server.StatsCollector] (StatsCollector-1:null) StorageCollector is running...
2014-11-28 13:14:31,395 DEBUG [cloud.server.StatsCollector] (StatsCollector-3:null) HostStatsCollector is running...
2014-11-28 13:14:37,120 DEBUG [cloud.consoleproxy.ConsoleProxyManagerImpl] (consoleproxy-1:null) Skip capacity scan due to there is no Primary Storage UPintenance mode
2014-11-28 13:14:37,517 DEBUG [network.router.VirtualNetworkApplianceManagerImpl] (RouterStatusMonitor-1:null) Found 0 routers. 
  
在主机侧,日志一直在打印
2014-11-28 13:18:13,560 INFO  [utils.nio.NioClient] (Agent-Selector:null) Connecting to localhost:8250
2014-11-28 13:18:13,560 ERROR [utils.nio.NioConnection] (Agent-Selector:null) Unable to connect to remote
2014-11-28 13:18:18,561 INFO  [utils.nio.NioClient] (Agent-Selector:null) Connecting to localhost:8250
2014-11-28 13:18:18,561 ERROR [utils.nio.NioConnection] (Agent-Selector:null) Unable to connect to remote
2014-11-28 13:18:23,562 INFO  [utils.nio.NioClient] (Agent-Selector:null) Connecting to localhost:8250
2014-11-28 13:18:23,563 ERROR [utils.nio.NioConnection] (Agent-Selector:null) Unable to connect to remote
  
初步分析,是主机的哪些配置文件有问题。但是不知道如何进一步定位,求高手指导。
主机目前已经配置的内容:
一个网桥:管理,存储,来宾共用
hostname:已经配置/etc/hosts
SELINUX=permissive
防火墙增加:
-A INPUT -p tcp -m tcp --dport 22 -j ACCEPT
-A INPUT -p tcp -m tcp --dport 1798 -j ACCEPT
-A INPUT -p tcp -m tcp --dport 16509 -j ACCEPT
-A INPUT -p tcp -m tcp --dport 5900:6100 -j ACCEPT
-A INPUT -p tcp -m tcp --dport 49152:49216 -j ACCEPT
配置文件
/etc/libvirt/qemu.conf
/etc/libvirt/libvirtd.conf
/etc/sysconfig/libvirtd 
都已经修改过了,确定没有问题