Rack em Datacenter

Descrição do Projecto

Necessidades do Cliente:

Implementação de monitorização de performance em infraestrutura informática e aplicações criticas.

  • Garantir “uptime”de aplicações criticas e de serviços 24/7.
  • Testar equipamentos de segurança e de ambiente.
  • Control de “backups” e “disaster recover”.

Implementação:

Foi considerada de base a monitorização de todos os equipamentos ao nível de sistema operativo e a instalação dos respectivos serviços, deste modo a análise de“performance” e a alarmistica associada preventiva foi implementada.

Depois de identificar todos os serviços/aplicações que se deseja garantir o seu funcionamento e dos respectivos procedimentos de teste, validação e procedimentos de activação, os mesmos foram implementados individualmente.

São verificados os vários equipamentos de segurança (alarmes de intrusão e incêndio) e em caso de ultrapassarem os valores parametrizados seja enviados alarmes.

São identificados para fácil manutenção todos os equipamentos via foto em consola central.

Estão implementados sistemas de medida de “performance” nas aplicações em testes de modo encapsulado (simulando todas as acções do utilizador).

Todo o sistema de “backups” é monitorado, tendo em vista o tipo de equipamento e a sua criticidade. Do mesmo modo, todo o quepamento fisico associado (exemplo: “tape drives”) é monitorado. Quer o equipamento, quer os backups, têm processos reactivos de modo a corrigir qualquer falha numa primeira fase, continuanto o erro é despoletado alerta para Administrador/Operador.

Foi implementado testes de “disaster recover” em todas as condições dependentes (espaços fisicos, rede, etc) e no processo em sí, tendo qualquer falha directa ou dependente despoletar reacção ou no caso dessa não ser possivel: alarme a Operador.

Resultados Finais:

Devido ao sistema reactivo implementado, verifica-se um aumento de eficácia de um “downtime”de sistemas e equipamentos da ordem de minutos anuais em contraponto de vários dias que ocorriam antes de implementada a solução.

No caso de avarias de equipamentos, em grande parte as mesmas podem ser evitadas devido a “sinais prévios”e no caso das não previsíveis, é possível um ganho temporal, pois o alerta é enviado de imediato ao provedor do serviço de manutenção, tendo um ganho de horas na substituição do componente.

A equipa de administração/manutenção deixou de ter um papel meramente reactivo e optimizou-se (devido a uma recuperação de tempo) para uma acção de administração e manutenção pró-activa dos mesmos e a um maior aumento de eficácia; tendo libertado funções basicas para a equipa de operação.

Os administradores aplicacionais passaram a ter dados de “performance” sobre o seu impacto nos sistemas e infraestruturas podendo agir pró-activamente. Detectam ainda falhas aplicações de modo imediato que normalmente só são visíveis depois de vários dias e com telefonema do utilizador devido à degradação do sistema.

Em termos financeiros, para além do ganho devido aos pontos indicados anteriormente, foi verificado que é naturalmente prolongado o tempo de vida dos equipamentos/aplicações e novos equipamentos serem devidamente dimensionados sem se a necessidade de compras desnecessárias.

Deixe um comentário