PCNTI
Plano de Gestão de Continuidade de Negócios
É uma ferramenta de Gestão constituída por um documento no qual ficam definidas as estratégias a serem adotadas a fim de que se mantenha o funcionamento das operações de uma instituição, caso ela venha a enfrentar intempéries causadas por fatores internos ou externos à organização.
No documento em tela será elaborado um PCN para a Gestão de Tecnologia da Informação sob a tutela da Secretaria de Informática do Tribunal de Justiça do Estado do Pará.
Desta forma, pode-se dizer seguramente que o PCN é um plano emergencial que norteia a gestão de continuidade de negócio em situações não cotidianas que podem levar à solução de continuidade. Para o cenário considerado, tais situações, que variam da falta de energia elétrica a incêndios, perpassando por desastres naturais, ataques cibernéticos, panes de hardware e software entre outros "imprevistos", que têm como ponto em comum ferir os princípios CID (Confidencialidade, Integridade, Disponibilidade), pilares incontestes da segurança da informação.
O Plano de continuidade de negócio é composto pelos:
PCN = PAC + PCO + PRD |
O PCN, serve para nortear o trabalho dos gestores que buscam minimizar o impacto das intempéries operacionais (desastres) com segurança e eficiência de forma a reduzir ao máximo o impacto de tais situações na organização, evitando que as operações essenciais sejam interrompidas ou que operem de forma errônea. Assim sendo, o PCN deve orientar o gestor a fim de que, em caso de desastres, as operações críticas e essenciais não sejam interrompidas ou prejudicadas.
É fato que em tempos regulares previstos, ou no caso de uma mudança significativa no ambiente, o PCN precisa ser revisto e atualizado, de forma a espelhar a realidade existente na instituição.
O PCN é fundamental para que a gestão de continuidade do negócio feita a partir dele assegure a resiliência organizacional, de forma que as operações não sejam interrompidas e que a normalidade seja estabelecida o mais breve possível.
Ademais, a Resolução Nº 370 de 28/01/2021, na sua Seção III - Dos Riscos, Segurança da Informação e Proteção de Dados, estabelece em seus artigos:
Art. 36. Cada órgão deverá elaborar Plano de Gestão de Continuidade de Negócios ou de Serviços no qual estabeleça estratégias e planos de ação que garantam o funcionamento dos serviços essenciais quando na ocorrência de falhas.
Art. 37. Cada órgão deverá elaborar Plano de Gestão de Riscos de TIC, com foco na continuidade de negócios, manutenção dos serviços e alinhado ao plano institucional de gestão de riscos, objetivando mitigar as ameaças mapeadas para atuar de forma preditiva e preventiva às possíveis incertezas.
Desta forma, o planejamento em questão visa atender à demanda supramencionada.
Por meio do plano de continuidade de negócios (PCN), consegue-se, durante sua elaboração, identificar ameaças e riscos, prever cenários e situações que podem exercer impacto negativo sobre as operações da instituição.
Desta forma, na ocorrência de uma das intempéries identificadas no PCN, ou de outra que tenha consequências similares, é possível lidar com elas de maneira mais controlada, já que as ações estarão definidas e organizadas, de forma a serem executadas exigindo-se o mínimo de decisão, o que é uma boa prática em casos de crises como as enfrentadas durante a ocorrência de um desastre.
Um PCN precisa ser elaborado antes da ocorrência do desastre. Nele se preveem a ocorrência do desastre, suas consequências, e a forma de mitigá-lo, incluindo todos os recursos necessários para que a execução do PCN torne as operações afetadas à normalidade o mais rapidamente possível.
Por outro lado, estando atualizado o PCN e, no caso da ocorrência de um desastre, cumpre aos gestores tê-lo à mão para consultá-lo e assim aplicar suas recomendações, de forma a operacionalizar solução adequada que retorne à normalidade as operações de tecnologia da informação e comunicação do TJPA.
O presente Plano de Continuidade de Negócio, mapeará ameaças e os riscos que elas representam para o negócio do Tribunal de Justiça do Estado do Pará, através dos serviços de providos por tecnologia da informação e comunicação os quais são geridos pela Secretaria de Informática através de suas coordenações e chefias.
Após tal mapeamento serão descritos os PAC, PCO e PRD necessários para reestabelecer à normalidade a operação do negócio do TJPA
Os serviços de tecnologia da informação e comunicação constituem-se hoje em ativos críticos para o negócio do Tribunal de Justiça do Estado do Pará, de forma que planejar formas de resguardar tais serviços e os dados que eles encerram, além de recuperá-los à normalidade no caso da ocorrência de desastres, é fator primordial para a sobrevivência desta casa, e dos serviços que ela presta à sociedade.
O presente plano de continuidade de negócios foi elaborado para atender aos serviços atinentes à Secretaria de Informática - SECINFO do Tribunal de Justiça do Estado do Pará, estando intrinsicamente atrelado aos serviços e ativos sob a tutela desta unidade organizacional.
De uma forma geral, os itens a serem resguardados pelo PCN em questão são:
A fim de que se compreenda em detalhes todas as especificações contidas neste PCN, há que se considerar a normatização dos termos nele utilizados, de forma a não deixar que haja ambiguidades na sua compreensão. Por este motivo, seguem definições adotadas neste documento na "Matriz de Conceitos e Definições":
TERMO | CONCEITO OU DEFINIÇÃO |
---|---|
atividade | Processo ou conjunto de processos executados pelo TJPA, que produzam ou suportem um ou mais produtos ou serviços. |
atividade crítica | Atividade que deve ser executada de forma a garantir a consecução dos produtos e serviços fundamentais do TJPA, de tal forma que permita atingir os seus objetivos mais importantes e sensíveis ao tempo. |
ativos de informação | Meios de armazenamento, transmissão e processamento, os sistemas de informação, bem como os locais onde se encontram esses meios e as pessoas que a eles têm acesso. |
continuidade dos serviços essenciais | Conjunto de práticas, procedimentos, processos, planos e ferramentas de trabalho que maximizam a possibilidade de que o órgão, dispondo de um sistema de gestão de continuidade documentado, mantenha o fornecimento dos serviços essenciais de TIC após a ocorrência de determinados cenários de desastre. |
desastre | Evento repentino e não planejado que causa perda para todo ou parte do TJPA e gera sérios impactos em sua capacidade de entregar os serviços essenciais ou críticos por um período de tempo superior ao tempo objetivo de recuperação |
gestão de continuidade | Processo abrangente de gestão que identifica ameaças potenciais para uma organização e os possíveis impactos nas operações de negócio, caso elas se concretizem. Este processo fornece uma estrutura para que se desenvolva uma resiliência organizacional que seja capaz de responder efetivamente e salvaguardar os interesses das partes interessadas, a reputação e a imagem do Tribunal e suas atividades de valor agregado. |
Grupo Funcional | Seção ou Assistência com papel e responsabilidades na execução de procedimentos descritos no PCN |
hot site | Tipo de estratégia na qual os aplicativos são balanceados e trabalham com servidores ativos nos dois data centers, ou seja, em caso de indisponibilidade do data center principal os usuários dos sistemas não percebem a interrupção. |
Incidente | Qualquer evento suficientemente significante, que possa causar a interrupção do negócio |
interrupção | Evento, previsível ou não, que cause um desvio negativo na entrega de produtos ou execução de serviços, de acordo com os objetivos do TJPA |
Plano de Continuidade Operacional (PCO) | documentação dos procedimentos e informações necessárias para que o Tribunal mantenha seus ativos de informação críticos e a continuidade de suas atividades críticas em um nível previamente definido, em casos de desastres |
Programa de Administração de Crise (PAC) | Plano de ação claramente definido e documentado, para ser usado quando ocorrer um incidente que basicamente cubra as principais pessoas, recursos, serviços e outras ações que sejam necessárias para implementar o processo de gerenciamento de incidentes de TIC |
Plano de Recuperação de Serviços de TIC | documentação dos procedimentos e informações necessárias para que o órgão operacionalize o retorno das atividades críticas de TIC à normalidade |
responsável pelo ativo | indivíduo legalmente instituído por sua posição e/ou cargo, responsável primário pela viabilidade e sobrevivência dos ativos de informação |
RTO | Recovery Time Objective: Tempo estabelecido para que um sistema seja recuperado de uma solução de continuidade |
RPO | Compreende o ponto de recuperação dos dados, ou seja, uma vez recuperada a solução, qual a quantidade de dados máxima que poderá ser perdida sem que o negócio seja afetado. |
serviços essenciais | conjunto de ativos de informação que, por meio de integração e orquestração, entrega valor aos usuários e ao órgão, mediante recursos de TIC empregados. Os serviços essenciais estão divididos em negócio (área fim), infraestrutura e segurança da informação, (área de TIC e engenharia) |
sistemas essenciais | sistemas de informação do TRT da 8a Região definidos como estratégicos e com alto impacto no negócio em caso de indisponibilidade. |
criticidade | Representa o quão drástica é uma situação para o negócio do TJPA |
impacto | Desconformidade causada por um incidente ou desastre |
ameaça | Qualquer atividade maliciosa, intencional ou acidentalmente, seja através de meios eletrônicos ou não, que possa explorar uma vulnerabilidade e, assim, obter acesso, danificar ou destruir um determinado ativo ou serviço. |
solução de continuidade | Interrupção de um serviço por falha em algum de seus componentes |
A matriz abaixo define numa escala de 3 pontos a intensidade percebida por atores envolvidos no processo e no item cuja intensidade se pretende dimensionar. A rigor esta escala trata da percepção dos envolvidos e, portanto, é até certo ponto, subjetiva.
Dependendo do contexto analisado, a grandeza pode representar uma percepção positiva, neutra ou negativa, em uma situação em que represente análise qualitativa ou ainda pode representar uma probabilidade quando se tratar uma análise quantitativa.
GRANDEZA | CONCEITO OU DEFINIÇÃO |
---|---|
Alto | Representa uma grandeza muito significativa no contexto analisado, de forma a se sobressair sobre demais pontos considerados no cenário analisado. |
Médio | Representa uma grandeza ainda significativa, embora não seja tão intensa. É contudo, ainda bastante relevante no contexto analisado. |
Baixo | Representa uma grandeza de pouco significado que, no entanto, ainda acarreta consequências perceptíveis no cenário analisado, embora seja de menor impacto. |
As matrizes abaixo registram os serviços considerados essenciais no TJPA. Tais serviços são divididos por suas categorias: serviços de negócio, de infraestrutura, de segurança. As matrizes incluem perspectivas de criticidade e impacto e expectativas de RPO e RTO.
SERVIÇO | CRITICIDADE | RTO | RPO | IMPACTO FINANCEIRO | IMPACTO LEGAL | IMPACTO IMAGEM | IMPACTO OPERACIONAL |
---|---|---|---|---|---|---|---|
Judiciais | Alta | 2 Hrs | último backup válido | baixo | alto | alto | alto |
Administrativos | Alta | 4 Hrs | último backup válido | médio | médio | médio | alto |
Arrecadadores | Alta | 2 Hrs | último backup válido | alto | alto | alto | alto |
SERVIÇO | CRITICIDADE | RTO | RPO | IMPACTO FINANCEIRO | IMPACTO LEGAL | IMPACTO IMAGEM | IMPACTO OPERACIONAL |
---|---|---|---|---|---|---|---|
Vitualização | Alta | 2 Hrs | último backup válido | baixo | baixo | alto | alto |
Ambiente Devops | Alta | 2 Hrs | Ambiente de contingência | baixo | baixo | alto | alto |
Servidor de Aplicação | Alta | 2 Hrs | último backup válido | baixo | baixo | alto | alto |
Serviços de Rede | Alta | 2 Hrs | último backup válido | baixo | baixo | alto | alto |
Serviços de Storage | Alta | 2 Hrs | último backup válido | baixo | baixo | alto | alto |
Serviços de Compute | Alta | 2 Hrs | Ambiente de contingência | baixo | baixo | alto | alto |
Alto Serviços de Monitoramento | Alta | 2 Hrs | último backup válido | baixo | baixo | alto | alto |
Datacenter | Alta | 2 Hrs | Ambiente de contingência | baixo | baixo | alto | alto |
Comunicação de Dados | Alta | 2 Hrs | Ambiente de contingência | baixo | baixo | alto | alto |
SERVIÇO | CRITICIDADE | RTO | RPO | IMPACTO FINANCEIRO | IMPACTO LEGAL | IMPACTO IMAGEM | IMPACTO OPERACIONAL |
---|---|---|---|---|---|---|---|
Firewall | Alta | 2 Hrs | Ambiente de contingência | baixo | médio | alto | alto |
WAF | Alta | 2 Hrs | Ambiente de contingência | baixo | médio | alto | alto |
Segurança de endpoint | Alta | 2 Hrs | Ambiente de contingência | baixo | médio | alto | alto |
Análise de vulnerabilidades | Alta | 2 Hrs | Ambiente de contingência | baixo | médio | alto | alto |
Evidencia eventos que podem ocorrer resultando na solução de continuidade, bem como as causas que podem levar a estes eventos.
AMEAÇA | PROBABILIDADE | IMPACTO PARA O NEGÓCIO | CAUSA PROVÁVEL |
---|---|---|---|
Interrupção no fornecimento de Energia elétrica | Baixa | alto |
> fator externo: Concessionária de energia; > fatores internos: falta de combustível no gerador, manutenção inadequada nos circuitos elétricos, carga excessiva nos circuitos |
Pane na infraestrutura de datacenter | Baixo | alto | >Hardware ou software em pane; |
Indisponibilidade de redes LAN ou Metro e Links | Média | alto |
> fator externo: rompimento de fibra > Fator interno: Ativo de rede defeituoso |
Falha Humana | Média | alto | > Incidente ao manusear equipamentos ou software crítico. |
Ataque cibernético interno | Baixo | alto | > Ataque cibernético efetivado por servidor ou terceirizado com permissões de acesso aos ativos do TJPA. |
Ataque cibernético externo (incluindo ransonware) | Alto | alto | > Ataque cibernético efetivado por elemento externo ao TJPA, sem prévias permissões de acesso. |
Incêndio | Baixo | alto | > Incêndios que comprometam serviços de TIC |
Desastres Naturais | Baixo | alto | > Alagamentos, raios, terremotos, etc. |
Define a responsabilidade das equipes e seus líderes quanto à execução de itens deste plano. Assim, “um desastre representa a ocorrência de um item previsto na matriz de ameaças, o qual afeta um dos itens da matriz de serviços essenciais, que deve estar sob a responsabilidade de uma equipe, a qual executará os procedimentos elencados no PCN para a ocorrência em questão”.
EQUIPE | RESPONSABILIDADE |
---|---|
COMITÊ DE DESASTRE/RECUPERAÇÃO/COMUNICAÇÃO (CDR) |
Avaliar o plano periodicamente e decidir pelo seu acionamento quando da ocorrência de desastres, respondendo em nível institucional pela execução do plano e demais ocorrências relacionadas. Inclui autoridades em nível institucional e tomadores de decisão da SECINF Responsável por todas as comunicações durante um desastre. Especificamente, eles se comunicarão com os funcionários, clientes, autoridades, fornecedores e até mesmo com a mídia, se necessário. ● O líder desta equipe administrará e manterá o Plano de Administração de Crise. ● O Comitê CDR será composto pelos mesmos integrantes do CGTI. |
Coordenadoria de Suporte Técnico | O líder desta equipe administrará e manterá o Plano de Recuperação de Desastre |
SSSB (Infraestrutura, aplicações, backup) |
Responsável pelas instalações físicas que abrigam sistemas de TIC e pela garantia que as instalações de alternativa são mantidas adequadamente. Avalia os danos e supervisiona os reparos. Fornecer infraestrutura de servidor físico e virtuais necessária para que a TI execute suas operações e processos essenciais durante um desastre. Garantir que as aplicações essenciais funcionem como exigido para atender aos objetivos de negócios em caso de e durante um desastre. Eles serão os principais responsáveis por assegurar e validar o desempenho das aplicações essenciais e podem ajudar outras equipes de TIC CDR conforme necessário. Analisar as perdas e mapear a quantidade de dados perdidos, tempo de recuperação desses dados e formular estratégia de recuperação de dados de acordo com as políticas pré-estabelecidas. > O líder desta equipe irá liderar os PCO relacionados a estes itens. |
Divisão de Banco de Dados |
Responsável pelas configurações e manutenções dos ambientes de bancos de dados, incluindo execução e recuperação dos backups. > O líder desta equipe irá liderar os PCO relacionados exclusivamente a bancos de dados. |
Serviço de Infraestrutura de Redes |
Avaliar os danos específicos de qualquer infraestrutura de rede e para fornecer dados e conectividade de rede, incluindo WAN, LAN ou de infraestrutura externa junto aos prestadores de serviço. > O líder desta equipe irá liderar os PCO relacionados exclusivamente à comunicação de dados. |
Segurança da Informação |
Responsável por ativos que provêm o controle de acesso a sistemas e a comunicação de dados. > O líder desta equipe irá liderar os PCO relacionados exclusivamente à segurança da informação |
Define a responsabilidade das equipes e seus líderes quanto à execução de itens deste plano. Assim, “um desastre representa a ocorrência de um item previsto na matriz de ameaças, o qual afeta um dos itens da matriz de serviços essenciais, que deve estar sob a responsabilidade de uma equipe, a qual executará os procedimentos elencados no PCN para a ocorrência em questão”.
EQUIPE | CARGO | PESSOA | |
---|---|---|---|
Coordenadoria de Suporte Técnico | Coordenador CST | Arilson Silva | arilson.silva@tjpa.jus.br |
SSSB (Infraestrutura, aplicações, backup) | Chefe do SSSB | Paulo Lourinho | paulo.lourinho@tjpa.jus.br |
DBD (Divisão de Banco de Dados) | CChefe da DBD | Murilo Silva | murilo.silva@tjpa.jus.br |
SIR (Serviço de Infraestrutura de Redes) | Chefe do SIR | Denison Soares | denison.soares@tjpa.jus.br |
Segurança da Informação | Lider Técnico | Thiago de Castro | thiago.rosario@tjpa.jus.br |
Este plano descreve os cenários de inoperância e seus respectivos procedimentos alternativos planejados, definindo as atividades prioritárias para garantir a continuidade dos serviços essenciais.
ESCOPO: É escopo deste plano garantir ações de continuidade durante e depois da ocorrência de uma crise ou cenário de desastre tratando-se apenas das ações de contingência definidas na estratégia.
OBJETIVOS:
GESTÃO: A CST é a unidade responsável por implementar, manter e melhorar o PCO e toda documentação inerente.
EXECUÇÃO DO PCO: Avaliação de Impacto de Desastre: Identificada a ocorrência de um incidente ou crise e o Líder da Equipe competente deve verificar a dimensão do impacto, extensão e possíveis desdobramentos do ocorrido.
Dado o aval pelo CDR ao acionamento do plano a EQUIPE RESPONSÀVEL convocará reunião de emergência com os líderes responsáveis pelos PRD e PAC com o intuito de:
AÇÕES DE CONTINGÊNCIA: Devem ser adotadas para cada processo ou serviço essencial.
INSTRUÇÃO | DURAÇÃO | OBSERVAÇÃO | RESULTADO |
---|---|---|---|
Verificar status da aplicação de backup e estimar impacto de perda dados (janela) | |||
Identificar jobs de backup cujos dados em questão foram afetados | |||
Estimar volume de dados a serem recuperados, tempo de recuperação dos dados e possíveis perdas operacionais | |||
Atestar retorno do funcionamento do ambiente principal com Líder do PRD | |||
Teste de aplicação de backup após desastre | |||
Validar políticas de backup implementadas |
ENCERRAMENTO DO PCO Uma vez validado o funcionamento do retorno dos sistemas essenciais e estabilidade do datacenter deverá ser emitido um parecer relatando as atividades realizadas neste PCO.
Este programa especifica as ações ante os cenários de desastres. As ações incluem gerir, administrar, eliminar ou neutralizar os impactos, inerente ao relacionamento entre os agentes envolvidos e/ou afetados, até a superação da crise, através da orquestração das ações e de uma comunicação eficaz.
ESCOPO: Comunicação e gerenciamento de crises, viabilizando uma compreensão linear a todos os envolvidos das ações antes, durante e após a ocorrência de um desastre.
OBJETIVOS:
EXECUÇÃO DO PAC
A comunicação com cada parte ocorrerá da seguinte forma:
AUTORIDADE | CONTATO | DATA/HORA DO REGISTRO | NÚMERO DA OCORRÊNCIA |
---|---|---|---|
Polícia | |||
Bombeiros | |||
SAMU |
ENCERRAMENTO DO PAC: Uma vez validado o funcionamento do retorno dos sistemas essenciais e estabilidade do datacenter a EQUIPE DE COMUNICAÇÃO entrará em contato com as partes descritas neste plano provendo as informações de retorno das operações com as informações de status dos serviços essenciais.
Compor relatório com relação das atividades necessárias após a ocorrência dos desastres como remanejamento dos canais de informação, abertura e acompanhamento de chamados correlatos ao ocorrido.
Este plano descreve os cenários de inoperância e seus respectivos procedimentos planejados, definindo as atividades prioritárias para restabelecer o nível de operação dos serviços no ambiente afetado dentro de um prazo tolerável.
ESCOPO: É escopo deste plano garantir o retorno das operações do ambiente principal depois da ocorrência de uma crise ou cenário de desastre tratando-se apenas dos ativos, conexões e configurações deste ambiente.
OBJETIVOS DO PRD:
EXECUÇÃO DO PRD:
ENCERRAMENTO DO PRD: Ao término do procedimento de recuperação, as informações serão consolidadas em parecer específico informando horário de restabelecimento de cada serviço, equipamentos adquiridos, procedimentos de recuperação realizados e fornecedores acionados.
O PCN e seus subplanos serão testados pelas equipes competentes e os testes serão validados em reunião entre os líderes de cada subplano, uma vez a cada semestre ou com a insurgência de novos fatores de risco, mudança na análise de impacto, ou com a inclusão de um novo serviço no plano de continuidade.
Os testes serão registrados na "Matriz de testes", cujo modelo figura a seguir:
DATA | TIPO | MOTIVO | STATUS |
---|---|---|---|
Data: Refere-se ao dia da execução ou validação do teste;
Tipo: o teste pode ser, de mesa, caminho percorrido, simulação, entre outros
Motivo: O Motivo pelo qual o teste foi necessário:
Status: programado, executado, planejado, agendado
Tomaram conhecimento do presente plano, os seguintes gestores:
NOME | CARGO | DATA | RESULTADO | ASSINATURA |
---|---|---|---|---|