- A+
所属分类:技术
GI是继承了10gR2版本的CRS所有的进程结构和功能特性,GI的 核心进程都是在10gR2的原有核心进程的基础上的扩展。
一、10gR2RAC的核心进程
对于集群管理软件CRS主要有如下几个组件构成: CSS(cluster synchronization service)、CRS(cluster ready services)和EVM(Event manager)
1、CSS负责维护集群的一致性,主要功能是通过ocssd守护进程实现的,ocssd以oracle用户进程运行,运行级别为实时。主要通过读取VF中的投票信息来维护集群的一致性。
2、CRS组件负责对集群的所有应用程序资源进程管理,并实现应用程序的高可用,crs组件功能主要是通过crsd守护进程实现,该进程以root用户运行。crsd会通过OCR 中的信息获得集群中的节点列表以及集群需要管理的应用程序资源列表。标准的应用程序资源包括:数据库资源、数据服务资源、ASM资源、监听程序资源、VIP资源、ONS资源和gsd资源。crsd进程通过对应的racg模块对所有的应用程序资源进行管理,包括资源的启动、关闭、检查、清除等操作。
3、EVM负责产生并记录集群事件。
二、11gR2版本的核心进程如下;
资源分类如下:
集群初始化 资源(组件):ora.gipc、ora.gpng、ora.mdns、ora.asm、ora.cssd
集群存储管理资源(组件):ora.asm、ora.<磁盘组名>.dg
应用程序资源(组件):ora.crsd、ora.LISTENER.lsnr、ora.net1.network、ora.<节点名>.vip、 ora.scan.vip、ora.gns、ora.gns.vip、ora<数据库名>.db、ora.<数据库名>.<服务名>.srv
通过上图可以看出cssd进程仍然是读取VF中的信息来保证集群的一致性;crsd进程读取OCR中的集群节点列表和需要管理的资源;EVM记录集群的事件信息。核心进程没有太大变化。
案例分析:
如果集群中的某个资源、服务启动失败该怎样解决
1、首先明确11gR2中是由crsd进程来管理资源和服务的,所以需要先判断crsd进程的状态信息。
ps -ef | grep crsd
结果显示由root用户运行的进程crsd是正常的,说明集群的核心进程是没有问题的,下面就应该通过crsctl命令来手动启动下具体的资源和服务来确定对应的报错信息,进而判断资源启动失败的原因。
2、要明确一点crs启动的资源是所有的应用程序资源而集群初始化资源和集群存储资源不是由crsd进程来管理的。
3、在安装GI跑root.sh脚本时资源的添加顺序是这样的:
先添加集群的初始化资源,再添加集群的存储资源主要是ASM,最后添加CRS层面(应用程序)的资源,所以crsd进程只管理CRS层面的资源。
先添加集群的初始化资源,再添加集群的存储资源主要是ASM,最后添加CRS层面(应用程序)的资源,所以crsd进程只管理CRS层面的资源。
- 我的微信
- 这是我的微信扫一扫
- 我的电报
- 这是我的电报扫一扫