ASM自10g开始作为Grid的一部分,对于存储管理层的一个重大变革。重要性和丰富的功能就不多说了,主要的一点,是完全免费的。所以对于高端存储望而却步,而且不希望投入很多的投入在存储上,可以考虑ASM来很实惠的完成存储管理。 10g,11g的asm还是存在一定的差别,在10g中通过dbca可以直接在里面配置asm,到了11g,把asm的功能从dbca里分离开来,单独有一个asmca来配置ASM,而且需要在安装grid包的场景下才可以使用。 问题1: 启用ASM出错。 ASM的配置,如果希望启用,首先需要使
Oracle Clusterware把整个集群的配置信息放在共享存储上,这些信息包括了集群节点的列表、集群数据库实例到节点的映射以及CRS应用程序资源信息。也即是存放在ocr 磁盘(或者ocfs文件)上。因此对于这个配置文件的重要性是不言而喻的。任意使得ocr配置发生变化的操作在操作之间或之后都建议立即备份ocr。本文主要基于Oracle 10g RAC环境描述OCR的备份与恢复。 OCR 相关参考: Oracle RAC OCR 与健忘症 Oracle RAC OCR 的管理与维护 一、OCR的备份与恢复概念 与Oracle数据库备份恢复相似,OCR的备份也有物理备份或逻辑备份的概念,因此有两种备份方式,两种恢复方式。 物理备份与恢复: 缺省情况下,Oracle 每4个小时对其做一次备份,并且保留最后的3个副本,以及前一天,前一周的最后一个备份副本。 用户不能自定义备份频率以及备份文件的副本数。 对于OCR的备份备份由是由Master Node CRSD进程完成,因此备份的默认位置是$CRS_HOME/crs/cdata/<cluster_name>目录下。 备份的文件会自动更名,以反应备份时间顺序,最近一次的备份叫作backup00.ocr。 由于是在Master Node的节点之上进行备份,因此备份文件仅存在于Master Node节点。 对于Master Node的节点crash之后则由剩余节点接管。 备份目录可以通过ocrconfig -backuploc <directory_name> 命令修改。 OCR磁盘最多只能有两个,一个Primary OCR 和一个Mirror OCR。两者互为镜像以避免单点故障。 对于物理备份恢复,不能简单的使用操作系统级别的复制命令(使用ocr文件时)来完成,该操作将导致ocr不可用。 逻辑备份与恢复: 使用ocrconfig -export 方式产生的备份,统称之为逻辑备份。 对于重大的ocr配置发生变化前后,如添加删除节点,修改集群资源,创建数据库等,都建议使用逻辑备份。 对于由于错误配置而导致的ocr被损坏的情形下,我们可以使用ocrconfig -import方式进行恢复。 对于这种逻辑方式也可以还原丢失或损坏的ocr磁盘(文件)。 备份建议: 将oracle的自动备份产生的文件复制到共享或其它可用存储设备上。 每天至少导出一次ocr配置信息。 二、备份OCR
上节介绍运行集群环境所需的进程,这节总体上说Oracle集群的安装,升级以及克隆等
需求背景:在AIX6.1上安装Oracle 10g RAC,一线工程师反馈节点2运行root脚本无法成功,跟进排查发现实际上底层存储磁盘的准备工作就存在问题。 客户要求底层存储选用裸设备方式,所以必须要配合HACMP创建并发卷组来实现。 其实我们标准化最佳实践是建议选用ASM的,一来不需要再关注条带化,二来可以完全不需要HACMP(虽然10g版本的ocr和votedisk必须在裸设备上,但是由于ocr和votedisk特殊性,不必使用并发卷组,即不用使用HACMP)日后运维诊断问题时也更加清晰。
OCR相当于Windows的注册表。对于Windows而言,所有的软件信息,用户,配置,安全等等统统都放到注册表里边。而集群呢,同样如此,所有和集群相关的资源,配置,节点,RAC数据库统统都放在这个仓库里。如果OCR被破坏则导致集群服务启动异常,需要修复OCR。因此OCR的管理与维护对于整个集群而言,是相当重要的。本文主要描述了Oracle 10g RAC下的OCR的管理与维护。
裸设备,是没有经过格式化的分区或磁盘,也叫裸分区(原始分区),不被Unix通过文件系统来读取的特殊字符设备。它由应用程序负责对 它进行读写操作。不经过文件系统的缓冲,是不被操作系统直接管理的设备。由于跨过操作系统管理,使得I/O效率更高。在基于SUSE Linux 10上安装Oracle 10g RAC的话,由于Oracle 10g 不支持将ocr与votingdisk 存放在ASM 磁盘中,因此,依然需要为其使用裸设备方式。SUSE Linux裸设备的配置与其他的Linux稍有差异,下面将具体描述。
OCR就好比Windows的一个注册表,存储了所有与集群,RAC数据库相关的配置信息。而且是公用的配置,也就是说多个节点共享相同的配置信息。因此该配置应当存储于共享磁盘。本文主要基于Oracle 10g RAC描述了集群的OCR以及OCR产生的健忘问题。
近期我们在DBASK小程序新关联了运维之美、高端存储知识、一森咖记、运维咖啡吧等数据领域的公众号,欢迎大家阅读分享。
最近在给客户基于Suse 11 sp3安装Oracle 10g RAC,在安装完clusterware执行/u01/app/crs/root.sh时收到错误提示,Failed to upgrade Oracle Cluster Registry configuration由于当前的环境使用了多路径,从Oracle的描述来看,这是一个Oracle Bug(4679769),如果你有相同的问题,请接着往下看。 一、故障现象 suse11a:/u01/app/crs # /u01/app/crs/root.sh WARNING: directory '/u01/app' is not owned by root Checking to see if Oracle CRS stack is already configured /etc/oracle does not exist. Creating it now. Setting the permissions on OCR backup directory Setting up NS directories Failed to upgrade Oracle Cluster Registry configuration #此处为错误提示 #下面使用clsfmt命令时提示Received unexpected error,注,/u01/app/crs 为ORA_CRS_HOME。 suse11a:/ # /u01/app/crs/bin/clsfmt ocr /dev/raw/raw1 clsfmt: Received unexpected error 4 from skgfifi skgfifi: Additional information: -2 Additional information: 1073741824 #下面是具体的错误日志 suse11a:/u01/app/crs/log/suse11a/client # pwd /u01/app/crs/log/suse11a/client suse11a:/u01/app/crs/log/suse11a/client # more ocrconfig_24066.log Oracle Database 10g CRS Release 10.2.0.1.0 Production Copyright 1996, 2005 Oracle. All rights reserved. 2014-08-11 11:52:14.993: [ OCRCONF][2176517888]ocrconfig starts... 2014-08-11 11:52:14.994: [ OCRCONF][2176517888]Upgrading OCR data 2014-08-11 11:52:15.100: [ OCRRAW][2176517888]propriogid:1: INVALID FORMAT 2014-08-11 11:52:15.101: [ OCRRAW][2176517888]ibctx:1:ERROR: INVALID FORMAT 2014-08-11 11:52:15.101: [ OCRRAW][2176517888]proprinit:problem reading the bootblock or superbloc 22 2014-08-11 11:52:15.102: [ default][2176517888]a_init:7!: Backend init unsuccessful : [22] 2014-08-11 11:52:15.102: [ OCRCONF][2176517888]Exporting OCR data to [OCRUPGRADEFILE] 2014-08-11 11:52:15.102: [ OCRAPI][2176517888]a_init:7!: Backend init unsuccessful : [33] 2014-08-11 11:52:15.102: [ OCRCONF][2176517888]There was no previous version of OCR. error:[PROC-33: Oracle Cluster Registry is not configured] 2014-08-11 11:52:15.108: [ OCRRAW][2176517888]propriogid:1: INVALID FORMAT 2014-08-11 11:52:15.108: [ OCRRAW][2176517888]ibctx:1:ERROR: INVALID FORMAT 2014-08-11 11:52:15.108:
原文:http://www.enmotech.com/web/detail/1/757/1.html
Linux平台 Oracle 10gR2(10.2.0.5)RAC安装 Part1:准备工作
最近给客户基于SuSe 11 SP3下多路径部署Oracle 10g RAC。SuSe 11下用10g,也算一朵奇葩,连篇文档都比较难找,谁叫Oracle太贵呢。下面主要是描述了在该环境下如何去配置多路径。由于10g下的ocr与votingdisk不能直接存放到asm磁盘,所以依旧要使用raw设备方式来保存。下文供大家参考。
正常情况下,svctm应该是小于await值的,而svctm的大小和磁盘性能有关,CPU、内存的负荷也会对svctm值造成影响,过多的请求也会间接导致svctm值的增加。
AutoMQ 是一个建立在 S3 Stream 流存储库基础上的 Apache Kafka 云原生重塑解决方案。S3 Stream 利用云盘和对象存储,将对象存储作为主存储,将云盘作为缓冲区,实现了低延迟、高吞吐、“无限”容量和低成本的流式存储。
云和恩墨旗下智能诊断平台Bethune今日发布了【2016年度中国Oracle数据库使用现状分析报告】,该报告采样2016年度国内18个大行业、485位用户(个人/企业)的1841套Oracle数据库信息,根据该平台提供的3356次数据库健康检查数据展开全方位多维度分析,让大家对Oracle数据库在国内的使用状况形成更为直观、全面的认知。 Oracle数据库从20世纪末就已开始在国内使用,在经历了20多年的迅猛发展后,目前已经占据了全球数据库的首位,在国内拥有数十万的技术粉丝与数万家企业用户,但到目前为止,
Oracle数据库从20世纪末就已开始在国内使用,在经历了20多年的迅猛发展后,目前已经占据了全球数据库的首位,在国内拥有数十万的技术粉丝与数万家企业用户,但到目前为止,还从未有过一份报告让我们真正了解真实国内Oracle数据库使用现状,而【2016年度中国Oracle数据库使用现状分析报告】将为我们带来真实的现状展示。 Bethune基于真实用户数据库体检数据所提供的的【2016年度中国Oracle数据库使用现状分析报告】,为我们带来了大视角的国内Oracle数据库使用实景展现,在调研了大量Oracle数
从oracle中ASM的发展来看,到今天的普及使用,应该可以算做一种文化,因为这体现的不仅是ASM技术在实际工作中的成功普及,而且从某种程度来说,都代表了一个新生事物的发展历程,无论是java的发展还是各种开源项目的普及,都有着相似的痕迹。 asm从Oracle 10g版本推出,是作为grid的一部分鼓励使用的。而在这段漫长的时间里面,其实asm就在逐渐完善。 就如同你去公司内部推广一套很新技术的时候,人家肯定得衡量你的东西是不是足够好,如果性能指标能够达到指数级的提升,或者操作能够简化到极致,而且稳定,
启动完集群后可以用如下命令检查集群状态,所有的服务都要是ONLINE才是正常的,如下 [root@node1 bin]$crs_stat -t Name Type Target State Host ------------------------------------------------------------ ora....w1.inst application ONLINE ONLINE node1 ora....w2.inst application ONLINE ONLINE node2 ora.cjw.db application ONLINE ONLINE node1 ora....SM1.asm application ONLINE ONLINE node1 ora....E1.lsnr application ONLINE ONLINE node1 ora.node1.gsd application ONLINE ONLINE node1 ora.node1.ons application ONLINE ONLINE node1 ora.node1.vip application ONLINE ONLINE node1 ora....SM2.asm application ONLINE ONLINE node2 ora....E2.lsnr application ONLINE ONLINE node2 ora.node2.gsd application ONLINE ONLINE node2 ora.node2.ons application ONLINE ONLINE node2 ora.node2.vip application ONLINE ONLINE node2 ps –ef |grep ora 下面是一些简介,了解一下就可以了,有时间可以深入研究。
在VMware下的Oracle RAC 环境中,对于共享存储不够或者需要增加新的共享磁盘来配置ocr或votingdisk的多路镜像,我们可以通过vmware下的命令行来增加共享存储,然后将这些新磁盘逐一追加到虚拟机即可。下面给出具体描述。
本文将以 CentOS 8.0 操作系统为例,不同操作系统的格式化操作可能不同,本文仅供参考。
问题的背景是这样,以前学习oracle 10g rac的时候在rhel 5上安装,真是快使出吃奶的劲了,前前后后忙活了一个多星期,配网络,配共享存储,修改vmware的配置文件,结果在root.sh的部分发现认证系统 是rhel 4,rhel 5中还需要手工去修改一些脚本内容才可以,要不总是在root.sh的时候出现很奇怪的报错。所以包括我还有很多的DBA朋友们,可能都在这个历程中感受 到了艰辛。越是难做,越发感觉安装真是一件大活,都特别想亲自看看安装的过程。所以自己也准备了好几套虚拟机环境,安装的过程
进程管理 : 包括 进程创建 , 销毁 , 线程组管理 , 内核线程管理 , 队列等待 ;
----------管理命令---------- ps命令:查看进程 要对系统中进程进行监测控制,查看状态,内存,CPU的使用情况,使用命令:/bin/ps (1) ps :是显示瞬间进程的状态,并不动态连续; (2) top:如果想对进程运行时间监控,应该用 top 命令; (3) kill 用于杀死进程或者给进程发送信号; (4) 查看文章最后的man手册,可以查看ps的每项输出的含义,to find: STANDARD FORMAT SPE
在Oracle RAC中,可以从多个层次,多个不同的机制来检测RAC的健康状况,即可以通过心跳机制以及一定的投票算法来隔离故障。如果检测到某节点失败,则存在故障的节点将会被逐出集群以避免故障节点破坏数据。本文主要描述了Oracle RAC下的几种心跳机制以及心跳参数的调整。
Linux的设备模型是操作系统管理硬件设备的一种高级抽象,它不仅涉及到设备驱动程序的加载和卸载,还包括设备之间的关系、设备的状态管理以及与用户空间通信的机制。理解Linux的设备模型对于应用开发人员来说至关重要,它有助于开发出更加稳定、高效的应用程序。🌟
_Linux服务器重启后crs_stat -t命令无法正常使用以及解决思路 _ 前提:在Linux系统中安装ASM,安装完ASM和Oracle数据库时都是正常使用的,但在重启服务器后Oracle相关命令不识别。
新安装了Oracle 11g rac之后,不知道是什么原因导致第二个节点上的crsd无法启动?其错误消息是CRS-4535: Cannot communicate with Cluster Ready Services。其具体的错误信息还需要查看crsd.log日志才知道。
杨廷琨(yangtingkun) 云和恩墨 CTO 高级咨询顾问,Oracle ACE总监,ITPUB Oracle数据库管理版版主 这是一则生产环境的真实维护过程,由于RAC的测试环境空间不足,因此规划给ASM扩展空间,然而在给ASM添加新的磁盘空间时又出现了故障,这类问题在很多用户的生产环境中可能也会遇到。 空间扩展的操作步骤如下: 在RAC环境的节点1上启动了DBCA工具来管理ASM设备; 由于新增的裸设备在ASM图形界面下看不到; 通过root用户将裸设备的访问权限授予了操作系统上的Oracl
写在前面: 最近一直在看张晓明的大话Oracle RAC,真实感受就是学到很多之前自己都没深入思考研究过的知识点,现在趁着节前头脑尚清醒,再结合实际工作中自己曾遇到的一些案例,就把这段时间自己学到的东西总结一下。
① 用户空间 : 在 " 用户空间 " 中 , 使用 malloc 函数 申请 " 堆内存 " , 使用 free 函数 释放 " 堆内存 " ;
Oracle 11g RAC中,发现oc4j以及gsd服务都处于offline状态,这是Oracle 11g RAC默认情形。即便如此,并不影响数据库的使用,因为 oc4j 是用于WLM 的一个资源, WLM在 11.2.0.2 才可用。GSD则是用于支持dbca,srvctl,oem等的交互工具。本文描述将这两个服务切换到online。
Linux操作系统:CentOS Linux release 7.6.1810 (Core)
在前文《磁盘开篇:扒开机械硬盘坚硬的外衣!》和《拆解固态硬盘结构》中,我们了解到了硬盘基本单位是扇区。在《磁盘分区也是隐含了技术技巧的》中我们也了解了磁盘分区是怎么回事,但刚分完区的硬盘也是不能直接被被操作系统使用的,必须还得要经过格式化。那么今天我们就简单聊一聊,Linux下的格式化到底都干了些啥。
把多个存储介质(如硬盘,RAID)通过一定的技术将他们集中起来,组成一个存储池并进行统一管理,从主机和工作站的角度看是一个超大容量(如1T以上)的硬盘。将多种,多个存储设备统一管理起来,为用户提供大容量,高数据传输性能的存储系统称为存储虚拟化。
在Linux的宏大世界中,各种各样的硬件设备如星辰般繁多。从常见的USB设备到复杂的网络接口卡,从嵌入式设备到强大的服务器,Linux需要在这些差异极大的硬件上运行。这就引出了一个问题:Linux是如何统一这些不同硬件的设备模型的呢?本文将探讨Linux是如何针对不同的硬件统一设备模型的,这一统一的设备模型对于应用程序开发人员来说又有何意义。让我们一探究竟🕵️♂️。
早于windows 2008 的windows系统,2010年以前的linux系统,第一个分区的扇区是磁盘第63扇区,并且扇区尺寸是是512byte,这个是历史的原因,硬盘必须将cylinder / head / sector (CHS) 信息报告给BIOS,这个信息在现代的操作系统是无意义的,但是磁盘依然报告给bios每个磁盘轨道有63个扇区,因此操作系统依然将第一个分区的开始位置放置到第一个磁盘轨道上,在第63个扇区开始。
我之前安装的是vmware workstation 7.1,虽然添加与删除程序里有卸载选项,不过不管用,无奈用windows 优化大师将其卸载了。然后手动删除一些服务项、注册表项、文件。具体可以参考下面的网址:
VMware workstation中很多人喜欢桥接到物理网卡,而现在笔记本上很多是无线网卡,基本IP地址获取方式为DHCP,动态方式地址会变。为了能够稳定的访问内部虚拟机,因此通过建立环回接口来管理和访问所有虚拟机。当然访问的方式有多样性,我比较喜欢采用这种方式来SSH访问。
读写节点和只读节点共享一份底层存储读写节点和只读节点之间通过TCP或RDMA协议使用DMS组件共享Shared Buffer Pool中的热数据页读写节点和只读节点通过DSS API和DSS Server的协同访问底层共享存储中的持久化的数据
首先,需要安装Openfiler系统(类似安装Linux),我这里设定的IP地址:10.10.10.10(与RAC服务器网络相通)。安装完毕后通过web访问管理 https://10.10.10.10:446
现在很多云原生应用程序都是用http作为主要的传输机制,但是为web应用程序构建的负载均衡却不能满足一些高性能的场景。如nginx,haproxy虽然能够处理负载的应用场景,但是让它们去支撑一些高性能和一些数据密集型工作,却不能很好的应用。
在Linux系统中,有一句经典的话:“一切皆文件”(Everything is a file)。这句话的意思是,Linux将所有的设备、文件、进程等都当做文件来处理,统一了对它们的操作方法,使得Linux具有了很高的灵活性和可扩展性。本文将详细介绍Linux中的“一切皆文件”的概念,以及它的优点和应用。
文件按分配单元AUs(allocation units)平衡分布在磁盘组的所有磁盘中,ASM使用索引技术来跟踪每个AUs的位置
该命令可以显示关于系统各种资源之间相关性能的简要信息,这里我们主要用它来看CPU的一个负载情况。
在我们进行数据持久化,对文件内容进行落盘处理时,我们时常会使用fsync操作,该操作会将文件关联的脏页(dirty page)数据(实际文件内容及元数据信息)一同写回磁盘。这里提到的脏页(dirty page)即为页缓存(page cache)。
操作系统(Operating System),传统上负责对计算机硬件直接控制以及管理的系统软件。操作系统的功能一般包括处理器管理、存储管理、设备管理和作业管理等。当多个程序运行时,操作系统负责规划每个程序的处理时间。 一个操作系统概念上可以分成两个部分:内核(Kernel)以及壳(shell)。
本文作者系肖遥(花名),现任甲骨文技术支持工程师 ,目前专注于Oracle RAC领域。个人主页:
Linux I/O(输入/输出)是操作系统中一个至关重要的组成部分,它涉及到数据在内存🧠、存储设备💾、网络接口🌐等之间的传输过程。在Linux中,I/O操作不仅仅是文件读写那么简单,它包括了一系列复杂的机制和策略,旨在提高数据处理的效率,保证系统的稳定性和性能。📊
注意:此方式烧录进的文件系统是ubifs文件系统,如果操作 需要网络文件系统挂载或者使用TF卡,不推荐使用。
领取专属 10元无门槛券
手把手带您无忧上云