[ETP] Impactos nos sistemas com a migração de dados para o Postgres
ESTUDO TÉCNICO
ESTUDO TÉCNICO PRELIMINAR - ETP
INTRODUÇÃO
Este estudo técnico é sobre "Como migrar sistemas que usam o banco de dados SQL Server para o Postgres". Será abordado algumas maneiras de converter bancos que estão atualmente em SQL Server para Postgres e os impactos financeiros relacionados. O Postgres é gratuito, portanto o custo da licença é a principal vantagem para migração.
DESCRIÇÃO DA DEMANDA
Este estudo tem por objetivo a análise de impacto de migração para o banco de dados Postgres nos sistemas: PPE, SISCAB, AGENDAMENTO PPE, PENTAGONO, SISNE e GDOP. Será abordado qual o esforço para migrar os sistemas do banco de dados SQL Server para Postgres, quanto tempo levaria para a migração ser realizada e se há algum impedimento para que a migração não seja viável.
ANÁLISE DO CENÁRIO ATUAL
Os sistemas: PPE, SISCAB, AGENDAMENTO PPE, PENTAGONO, SISNE e GDOP atualmente utilizam banco de dados SQL SERVER e como linguagem de programação o C#. Para um melhor entendimento do cenário atual é necessário se abordar os custos das licenças atuais para manter o SQL Server atualizado. No site (https://www.microsoft.com/pt-br/sql-server/sql-server-2019-pricing) é possível observar os impactos financeiros para se possuir uma versão atualizada do produto da microsoft:
Edições
Preço Open No Level (US$)
Modelo de licenciamento
Disponibilidade do canal
Enterprise
$13, 748[1]
Pacote de 2 núcleos
Licenciamento por volume, hospedagem
Standard - por núcleo
$3,586[1]
Pacote de 2 núcleos
Licenciamento por volume, hospedagem
Standard - servidor
$899[1]
Server[2]
Licenciamento por volume, hospedagem
Standard - CAL
$209
CAL
Licenciamento por volume, hospedagem
Desenvolvedor
Gratuito
Por usuário
Web
Consulte seu parceiro de hospedagem para saber o preço
Não aplicável
Somente hospedagem
Express
Gratuito
Não aplicável
Considerando que o presente Estudo Técnico Preliminar (ETP) foi desenvolvido pelo time de desenvolvimento CAVEIRAS, o qual não possui acesso a ferramentas como Banco de Preços para realização de estimativa de economia, compreendemos que não seja possível chegar aos valores exatos dos custos das licenças atuais para se abordar o cenário atual. No entanto, após vislumbrar os custos de venda no site da microsoft das licenças atualizadas, fica observável o quanto manter as licenças do SQL Server pode trazer gastos que podem ser potencialmente economizados, visto que no erário público o ideal é sempre se prezar por atingir a eficácia, eficiência, efetividade e economicidade no âmbito do poder executivo estadual.
ESCOPO TÉCNICO PARA SOLUÇÃO DA DEMANDA
Inicialmente é importante ressaltar que é necessário verificar as compatibilidades tecnológicas decorrentes da mudança de banco de dados nas aplicações, visto a diversidade de tecnologias trabalhadas na SETIC, este estudo terá por objetivo somente as aplicações desenvolvidas em C# utilizando o framework Asp.net Core para desenvolvimento web.
O time de desenvolvimento CAVEIRAS atualmente trabalha com o Entity Framework Core que pode ser definido como um mapeador de banco de dados. No site oficial da microsoft (https://docs.microsoft.com/pt-br/ef/core/) é possível ter acesso para uma definição mais acertiva do que seria o Entity Framework:
O EF (Entity Framework) Core é uma versão leve, extensível, de software livre e multiplataforma da popular tecnologia de acesso a dados do Entity Framework.
EF Core pode servir como um mapeador relacional de objeto (O/RM), que:
- Permite que os desenvolvedores do .NET trabalhem com um banco de dados usando objetos .NET.
- Elimina a necessidade de maior parte do código de acesso a dados que normalmente precisa ser gravado.
O EF Core é compatível com vários mecanismos de banco de dados, consulte detalhes em Provedores de Banco de Dados.
Conceituado os termos acima descritos, o problema inicial a ser verificado é a compatibilidade dos provedores de banco de dados com o Entity Framework e validar se o Postgres está listado e habilitado para uso. No site oficial da microsoft (https://docs.microsoft.com/pt-br/ef/core/providers/?tabs=dotnet-core-cli) fica disponível a lista de todos os provedores compatíveis:
Provedores atuais
Importante
Os provedores do EF Core são criados por uma variedade de origens. Nem todos os provedores são mantidos como parte do Projeto do Entity Framework Core. Ao considerar um provedor, avalie a qualidade, o licenciamento, o suporte etc. para garantir que ele cumpra os seus requisitos. Examine também a documentação de cada provedor para obter informações detalhadas de compatibilidade de versão.
Importante
Os provedores do EF Core normalmente funcionam em versões secundárias, mas não em versões principais. Por exemplo, um provedor lançado para o EF Core 2.1 deve funcionar com o EF Core 2.2, mas não funcionará com o EF Core 3.0.
Visto que dentre os provedores está disponível o Postgres (Npgsql), então seguindo o que se orienta no site oficial (https://www.npgsql.org/efcore/index.html), fica possível realizar a conversão da aplicação em .NET para uma base de dados Postgres.
Após a conclusão do procedimento de converter o banco de dados de uma aplicação desenvolvida em C#, vem agora o procedimento de migração manual de dados, que pode ser um processo dispendioso para a equipe como um todo, pois o número de sistemas a serem migrados é grande e bem como o tamanho de suas bases de dados.
Uma ferramenta de migração de banco de dados deve solicitar que o usuário selecione os objetos a serem migrados, como tabelas, índices, restrições de chave primária e estrangeira. Existem ferramentas que podem automatizar o trabalho manual, serão apresentados dois exemplos:
1. pgloader é uma ferramenta de código aberto bem conhecida que importa dados do SQL Server para o Postgres usando o comando COPY, carrega dados, índices e chaves estrangeiras e converte dados para Postgres conforme pretendido.
-
pgloader carrega dados de várias fontes como MS SQL, SQLite, MySQL, CSV em PostgreSQL.
-
Ele é licenciado sob a licença PostgreSQL e de uso gratuito.
-
pgloader é um software multiplataforma.
-
A imagem do Docker está disponível.
2. Sqlserver2pgsql é escrito em Perl. Esta é outra ferramenta de migração de código aberto para automatizar a conversão do banco de dados Microsoft SQL Server para o banco de dados Postgres.
-
Ele converte um esquema SQL Server em um esquema Postgres
-
Se desejar, pode criar um console Pentaho Data Integrator (Kettle) para migrar todos os dados do SQL Server para Postgres.
TEMPO DE MIGRAÇÃO
Para estimativa de tempo de migração é necessário considerar e diferenciar os processos, são eles os principais: converter o banco de dados de uma aplicação em C# para Postgres e migrar os dados da base antiga para a base de nova. Visto essa particularidade fica disponível abaixo uma estimativa de tempo apenas para uma aplicação.
Processo para uma aplicação | Tempo |
Converter banco de dados da aplicação | 01~02 dias |
Migrar os dados do banco de dados antigo para ao novo | 05~10 dias |
Realizar adaptações na aplicação em razão de falhas de processos não previstos | 01~02 dias |
IMPEDIMENTOS E ESFORÇO PARA MIGRAÇÃO
A maioria dos impedimentos de migração de dados pode ser atribuída à confusão em torno do plano de migração (se houver um em vigor) e à falha em se preparar adequadamente para a mudança. A mudança de banco de dados e migração de dados entre o SQL Server e Postgres pode ser extremamente complexa a depender da estrutura a ser migrada. Quando os técnicos responsáveis por fazer essas mudanças não conseguem inventariar sistemas e dados, subestima o tempo e esforços necessários e não identifica quais recursos serão necessários no ambiente de destino, o procedimento pode se tornar um problema.
O desenvolvimento de um plano abrangente de migração de dados deve ser sempre a primeira etapa em qualquer transferência de tecnologia. Isso não só estabelece o escopo e os objetivos, mas também desenvolve o cronograma de sua execução e identifica as pessoas que serão responsáveis pelo procedimento. O plano destaca áreas com problemas potenciais com antecedência para que os riscos possam ser mitigados de forma eficaz antes que inviabilizem o projeto e atrase a implementação.
Quando tantos dados estão sendo transferidos de um local para outro, sempre há a possibilidade de alguns desses dados serem perdidos. Alguma quantidade de perda de dados pode não ser consequente, especialmente se for “desnecessário” ou outros dados “não essenciais” que não serão perdidos. Da mesma forma, alguns dados perdidos podem ser facilmente restaurados de arquivos de backup. Mas alguns tipos de perda de dados são muito mais problemáticas.
Mesmo ignorando o desastre potencial de perda de informações confidenciais ou privadas que precisam ser protegidas, a perda de dados pode criar um efeito cascata que encerra partes do processo de migração. Se a perda de dados escapar da atenção da equipe técnica, ninguém perceberá que dados essenciais estão faltando até que um aplicativo trave devido à falta de dados.
Então a solução viável é: Nenhum dado essencial deve ser retirado de seu ambiente atual sem fazer backup em algum lugar. Isso permite a equipe técnica reverta elementos da migração no caso de ocorrer um problema. Em alguns casos, isso pode ser feito facilmente com imagens de backup armazenadas em um sistema existente ou externo. Para dados críticos que precisam permanecer disponíveis durante a migração, os ambientes swing e paralelo podem ser configurados para garantir a continuidade dos serviços.
Transferir dados e aplicativos de um ambiente para outro é teoricamente um processo simples, mas, na prática, pode ser mais complexo. Isso pode criar alguns problemas de compatibilidade no futuro devido à má otimização. Alterar os bancos de dados dos sistemas desenvolvidos na SETIC pode tornar alguns arquivos inacessíveis porque eles não estão mais em um formato legível. Os controles de acesso podem não fazer uma transição suave do ambiente de origem para o sistema de destino, deixando os técnicos incapazes de acessar os principais aplicativos quando precisam. Em um cenário de pior caso absoluto, todo o sistema pode travar assim que for removido de seu ambiente legado.
Qualquer plano completo de migração de dados deve incluir uma avaliação detalhada dos requisitos operacionais do sistema atual e como eles devem ser adaptados ao novo ambiente. Migrar tudo primeiro e esperar para lidar com quaisquer problemas de compatibilidade que surjam depois não é apenas uma falha no planejamento, está planejando falhar. Todos os requisitos do sistema devem ser documentados com antecedência e monitorados de perto ao longo do processo. Somente após a execução de testes completos no novo sistema para validar seu desempenho, o sistema antigo deve ser encerrado.
Os problemas de compatibilidade de software são complicados o suficiente, mas às vezes o ambiente de destino simplesmente não é capaz de lidar com a quantidade de dados e aplicativos que estão sendo migrados. Embora superestimar a capacidade possa levar ao desperdício desnecessário (e caro). Sempre há o cenário de pesadelo de um servidor ser danificado durante a transferência para um novo local.
Finalizando o contexto, qualquer software de banco de dados legado que está sendo migrado deve ser verificado exaustivamente após a instalação. Em muitos casos, este software pode ter problemas de otimização de desempenho em alguns pontos do sistema ou simplesmente acabar evidenciando um problema de compatibilidade.
POSICIONAMENTO CONCLUSIVO
O presente ESTUDO TÉCNICO PRELIMINAR, elaborado pelos integrantes TÉCNICOS do time CAVEIRAS, considerando a análise dos desafios técnicos envolvidos e citados, conclui pela VIABILIDADE DA MIGRAÇÃO DE DADOS PARA O POSTGRES, uma vez que considerados os seus potenciais benefícios em termos de eficiência e economicidade. Em complemento, os impedimentos identificados são administráveis, pelo que RECOMENDAMOS o prosseguimento da migração. Ressalva-se que a RECOMENDAÇÃO é de cunho unitário, ou seja, o processo deve ser feito em apenas um sistema por vez, pois os riscos já foram levantados e é necessário de considerar se ocorrer uma falha no procedimento, poderá resultar em tempo de inatividade para aplicativos críticos para as atividades essenciais garantidas pela SETIC, o que pode causar impactos reais. Qualificar e/ou treinar a equipe técnica e elaborar um plano de migração é a maneira ideal de superar esses obstáculos e aumentar as chances de sucesso.