Gerenciamento de continuidade e disponibilidade do serviço é um assunto recorrente para IT Pro em SharePoint desde sua verão 2003. Com o lançamento do MOSS 2007 tivemos algumas melhorias bem importantes neste assunto com a criação do Shared Services Providers (SSP) e a segmentação mais clara das roles envolvidas em uma Farm SharePoint. Agora, com o lançamento da nova versão do produto e sua nova arquitura orientada a serviços, a discução novamente é reaberta e a flexibilidade no projeto de Farms de grande disponibilidade possibilitam um trabalho mais apurado por parte dos responsáveis por garantir a disponibilidade das aplicações de negócios.
Garantir a disponibilidade de um ambiente envolve diversas camadas de recursos de TI e, em geral, envolve também diversas equipes de TI, principalmente em grandes organizações. Dificilmente a equipe responsável pela implementação de hardware e infra-estrutura básica é a mesma que implementa e gerencia software base, sistema operacional e segurança. Normalmente temos , além destas duas equipes, outras áreas responsáveis por Banco de Dados, Software aplicativo (sistema) e finalmente, information workers. Orquestrar todas estas equipes e engajar todos pela mesma causa - implementar um ambiente que atenda os níveis de serviço que a organização necessita - não é tarefa fácil e exige um projeto bastante consistente que possa ser entendido e apoiado pelas áreas envolvidas.
Criando um plano de disponibilidade
Criar um plano eu reflita em altos níveis de disponibilidade envolvem diversos aspecots que passam desde a disponibilidade de energia até a capacidade de restaurar um ambiente em caso de disastre. Obviamente, alcançar altos níveis de disponibilidade implica em aumentar exponencialmente o custo deste ambiente. Devem ser contabilizados aqui tanto os custos de implementação, como aquisição de hardware e licenças, como custo manutenção e gerenciamento pós-implantação de carater recorrente. Estabelecer a melhor relação custo x beneficio é uma tarefa que deve ser excutada em conjunto com todos os envolvidos, principalmente pelo usuário final, com o apoio do especialista neste tipo de ambiente. Algumas perguntas simples podem ser colocadas na mesa para auxilio na tomada de decisão:
Quanto tempo meu negócio suporta com o ambiente indisponível?
Existem aplicações vitais para o negocio da organização hospedados neste ambiente?
A indisponilidade destas informações podem deixar usuários ociosos?
Estas informações são importantes para a continuidade das atividades da organização?
Qual o custo de cada hora de indisponiblidade?
É possivel calcular o custo da indisponiblidade (queda em sistema de vendas, profissionais ociosos, transações fechadas sem subsidio de informações importantes)?
Qual o custo intangível da indisponibilidade?
A parada do ambiente pode afetar direta ou indiretamente a imagem da organização?
A indisponibilidade do ambiente pode afetar a credibilidade dos usuários no sistema, reduzindo assim sua utilização?
Temos janelas de indisponibilidade para manutenção e aplicação de patches?
Qual o regime de disponibilidade do ambiente?
Qual o custo relacionado à perda de informação?
As respostas destas perguntas não irão definir quais os dispositivos de reduncia devem ser implementados, mas podem nortear o planejamento bem como ajudar a organização a definir qual o valor do investimento em infraestrutura e seu retorno para o negocio. Tão importante quanto a implementação de um portal qua atenda aos requisitos de negocio da organização é a disponibilidade destas aplicações aderente aos níveis esperados de disponibilidade. Regras claras estabelecidas antes da implantação de um portal garantem o nivelamento das expectativas entre todos os envolvidos com as cartas na mesa.
Com os objetivos alinhados, a próxima etapa e analizar cada um dos fatores que impactam na disponbilidade do ambiente, relacionados:
-
Redundancia de Hardware e Rede
- Diversos são os fatores de redundancia em nível de Hardware e rede. Entre eles, merecem especial atenção a utilização de discos em RAID5, especialmente para aqueles que armazenam dados de aplicativos. Reduncia de fontes de energia, Agregation Link para interfaces de rede, redundancia de servidores, roteadores e swithes, site backup, etc. Não entraremos em detalhe nestes itens pois não é o foco do estudo.
-
Redundancia de Software
- Cada uma das roles envolvidas em um ambiente SharePoint (componentes do Farm e roles externas ao Farm) deve ter sua redundancia planejada e, em caso de pontos de falha, estes devem estar explicitos e documentados.
-
Capacity Planning
- Um portal implementado em SharePoint deve estar pronto para suportar a carga prevista de usuários concorrentes sob pena de termos uma super-utilização dos servidores e consequentemente indisponibilidade de serviço.
-
Plano de Backup e recuperação de informações
- A recuperação dos dados em caso de falha ou exclusão indevida é de grande importancia para o estabelecimento de um ambiente confiável. As diversas granularidades, tempo de restore de cada forma de backup e realizar backup das informações corretas vão nortear um plano de backup e, principalmente, um plano de restore eficiente.
-
Plano de manutenção e path
- A administração do ambiente com recorrentes checkagens de seus indicadores de "saúde" bem com um plano de patching consistente atuam como ações proativas na manutenção de um ambiende crítico. O gerenciamento das atualizações de sistema (application update) também é fundamental para a garantia de disponibilidade.
-
Plano de Disaster Recovery
- Ter um plano de Disaster recovery corretamente documentado e, acima de tudo, testado, são a garantia de um reestabelecimento no menor tempo possivel em caso de disastre.
Cada um dos fatores listados serão discutidos em detalhes nos proximos posts. Espero que este material tenha servido como um ponto de partida e que possa ter ilustrado a complexidade envolvida em um ambiente de alta-disponibilidade, indo alem da simples configuração de Web Servers em NLB :)
Abraço,
Backer





