É habitual atopar en diferentes clientes unha pregunta ou un temor en canto implantas unha monitorización proactiva de ASM. Por que está REQUIRED_MIRROR_FREE_MB en negativo? É habitual atoparme unha asociación entre este valor negativo e un fallo na redundancia dun DG. O paso seguinte pasa por tentar explicar por que non é perigoso contar cun valor negativo en REQUIRED_MIRROR_FREE_MB.
Que é este valor?
Indica, en diskgroups ASM con redundancia Normal ou High, a cantidade de disco que será necesaria para recuperar a redundancia do DG sen engadir novos discos tras producirse o peor fallo tolerado pola redundancia. Isto implica:
- O valor de REQUIRED_MIRROR_FREE_MB non afecta de ningunha maneira á capacidade para tolerar os fallos previstos pola redundancia. Así, con redundancia normal poderemos perder até o 50% dos discos dun DG sen perda de servizo, sempre e cando os discos superviventes conteñan unha copia completa de toda a información. Un escenario habitual desta configuración é empregar dúas cabinas de disco diferentes, e configurar unha LUN en cada cabina en redundancia normal. Cada cabina neste caso estará representada por un Failure Group (si é crítica a correcta configuración dos FGs!). Sempre teremos a capacidade de perder até tódolos discos dun failure group, por exemplo se cae unha das cabinas que estamos empregando. O que non poderemos neste caso é recuperar a redundancia até que recuperemos a cabina ou engadamos novos discos. REQUIRED_MIRROR_FREE terá valor negativo porque non dispoñemos de espacio para crear novas segundas copias da información que se mantén na cabina supervivente. Dende este punto, non temos tolerancia a fallos de disco e a perda dun novo disco no diskgroup provocaría corte no servizo.
- REQUIRED_MIRROR_FREE_MB só é importante en caso dunha perda permanente do almacenamento. Se perdemos unha cabina, e non a imos poder recuperar, este valor estará indicando canto espazo precisamos presentar nun novo almacenamento (nun FG diferente ó supervivente), para que poidamos recuperar a normalidade. É dicir, a cantidade mínima de espacio para non estar en situación de risco. Se pola contra, como é o escenario habitual, a perda de almacenamento é temporal e a cabina volve a estar dispoñible tras o corte, os discos, que estaban en estado OFFLINE, son recuperados. Este valor é importante cando os discos son perdidos de xeito definitivo e son marcados como DROPPED.
Debo ter en conta este dato?
Non en condicións normais. En función da configuración que tañamos, teremos que ter en conta este valor cando se produza unha perda de almacenamento que podemos considerar permanente. Neste caso, se o valor é positivo, en canto o disco pase a estado DROPPED ben manualmente, ben automaticamente polo valor establecido para ese DG en DISK_REPAIR_TIME, non será preciso engadir novo almacenamento, porque temos espacio abondo para recuperar a redundancia nos discos e FGs superviventes. Se o valor fose negativo, pasamos a estar nunha situación na que ASM non garante a tolerancia a un novo fallo dun disco se este contén datos non replicados en FGs diferentes.