PG 数据库运维中的操作系统关注点.docx

上传人:p** 文档编号:1059634 上传时间:2024-06-29 格式:DOCX 页数:3 大小:12.25KB
下载 相关 举报
PG 数据库运维中的操作系统关注点.docx_第1页
第1页 / 共3页
PG 数据库运维中的操作系统关注点.docx_第2页
第2页 / 共3页
PG 数据库运维中的操作系统关注点.docx_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《PG 数据库运维中的操作系统关注点.docx》由会员分享,可在线阅读,更多相关《PG 数据库运维中的操作系统关注点.docx(3页珍藏版)》请在第壹文秘上搜索。

1、现在PG数据库在用户侧的应用场景日益丰富,很多国产数据库也与PG开源项目有着很深的渊源,在使用过程中的一些基本运维规则也与PG开源数据库十分近似.今天我们从操作系统的角度来看一看PG数据库日常运维中需要关注的一些问题.目前大多数用户侧的PG数据库规模都比较小,应用系统也都不太复杂,因此大多数情况下,数据库日常运维的难度并不大,不像Orade这样豆杂的数据库系统,遇到些问题还不太容易处理.在PG数据库日常运维上,只要关注下总会话数,活跃会化,并发访问,TOPSQ1.,一般也就够用了。反而在操作系统层面,需要多加关注.在这种情况下,操作系统的各种资源是否充足是决定数据库运行是否稳定的十分重要的因素

2、.CPU、内存、10、存储容量这四种资源是否充足决定了PG数据库的运行是否稳定.网络是否存在丢包、延时过大的问题,则会影响SQ1.语句执行的效率.一般情况下对这些多做关注,基本上就没有太大的问题了.对于CPU资源,首先要观察在业务高峰期J队列的数量长时间超过CPU线程数,甚至超过2倍.如果业务高峰期操作系统r队列的长度经常长时间超过10分钟)超过CPU线程数,那么说明当前CPU资源在系统高峰期存在不足的问题,如果经常超过2倍,那么久应该准备扩容了.对于内存资源,我们需要关注的是可用内存和交换器使用率这两个指标,因为OS内存中很多内存是用于CACHE/BUFFER的,所以空闲内存的指标指示性不够

3、准确,使用可用内存可能更为准确一些,这个指标是说操作系统中还有多少真正可用于分田的内存.roottest98#catprocmemi11foKemTotal:Mentfree:32778748k2253292kMe11iAva1table:10247100kIBurrers:l19tKBCached:20762224kSwapCached:Active:44052kB22779564kinactive:5925532kActive(anon):17703588kInaEVe(anon):3092404kACtiVe(file):5075976knactive(f1le):Unevictable

4、:2833128k0kBMlocked:0kSwapTotal:3907580kBSwapPree:1715884kBMemAvaiIabIe指标的含义是当前内存中还可用于分配的所有内存的总和。如果这个值比较小了,说明当前的OS中可以用于分配的内存过小,系统存在隐患.另外一个需要关注的指标是SWAP使用率,有些PG的使用攻略中甚至建议大家关闭SWAP,从而避免因为SWAP带来的性能不稳定。这种建议实际上是因为无法控制SWAP,以及控制SWAP带来的负面影响而采用的一种极端的措施.在当前的UNUX内核下,SWAP产生的原因十分复杂,因此干脆通过关闭SWAP来避开SWAP了.这种做法实际上是不可取

5、的,因为你都没办法摘明白SWAP产生的原因,那么如果关闭了SWAP,一旦SWAP需要产生的时候,那么OS会采取更为极端的方式来对待,那就是OOMKI1.1.ERIa程杀掉某些进程.如果正好Postmaster正好是那个倒密蛋,那么就不是PG性能受到影响了,而是PG库就宕了.目前我们常用的1.inUX7、8核心的SWaP箕法已经都比较完善了,大多数情况下,SWAP不会对影响PG数据库性能比较严重的匿名块做SWAP,而会尽可能交换CACHE/BUFFER,因此只要基础的1.INUXVM参数设百的比较合理,就无需惧怕SWAP的产生。而当系疣的SWAP使用率一直居高不下(比如超过90%),才需要至点关

6、注.IO延时也是我们运维PG数据库时需要关注的,因为PG数据库的DOUB1.EBUFFER特性,实际上IO延时对PG数据库的影响并不一定像对Orade那么直接.有时候IO延时挺高了,但是PG数据库的性能似乎受到的影响还不第大.不过不省怎么样,IO延时低于20考秒是运维PG数据库的一个基本底线.过高的IO延时肯定会对PG数据库长期稳定运行存在隐患(当PG数据库负载较小的时候,这种影响还不一定会体现出来).在一个相对稳定的运行环境中,如果10总量变化不大的时候,IO延时应该也是相对稳定的,如果IO总量不变的情况下,IO延时越来越长,那么说明底展10设备或者后端存储存在问题,我们需要尽早关注,以免出

7、现大问题。存储子系统的问题,对于数据库来说往往是致命的。另外一个容易受到忽视,但是一旦出现问题就容易引发大问题的是操作系统层面的进程的状态.如果进程中出现了几类特殊的非正常进程,那么我们就需要加以关注了.如果这些进程属于p。StgreS用户,那么就需要额外关注了。一般进程状态有“运行或可允许)3(可中断的休眠状态),这两种状态的进程都是正常的.而处于D(不可中断的休眠状态)的进程往往是在等待IO完成等内核调用,这个状态如果短时存在,并且很快消失了,那很可能是IO性能存在问题,并不好睑,如果系统中经甫有大量进程处于D状态,那么就凝要关注了,是不是OS在IO层面存在问题了.而且庭若D状态的进程数B

8、愈来愈多,OS的风险也越来越大,服务器从长远看,存在比较大的风险.另外T状态的迸程也应该是一个临时状态,等进程归还资源后应该就立即被关闭了,如果有进程长期处于T状态,那么系统肯定存在某些风险,需要关注。同理是Z状态的进程(僵死)。关注OS中的这些非正常状态的进程的数量变化以及某个非正常状态的进程是否长期处于该状态,是我们PGDBA运维数据库系统时应该关注的.OS层面需要关注的内容还有很多,比如通过Isof看看打开文件句柄的总数是否存在不合理的增长,Ulimit参数的限制是否会出现风险,OS进程数量是否异常,dmesg和messages是否存在异常报错等,都是PGDBA需要经常去检查检查的.这些检杳十分琐碎,有些也过于专业.因此PGDBA也需要构建一些工具,定期自动的去做巡检,从而确保数据库所运行的OS环境是安全的。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > IT计算机 > 软件工程

copyright@ 2008-2023 1wenmi网站版权所有

经营许可证编号:宁ICP备2022001189号-1

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。第壹文秘仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第壹文秘网,我们立即给予删除!