banner

blog

Oct 21, 2023

Análise: SAP começa a tecer sua própria estrutura de dados

ATUALIZADO 11:00 EDT / 08 DE MARÇO DE 2023

ANÁLISE de Tony Baer

Quase todas as empresas, grandes ou pequenas, que utilizam tecnologia normalmente têm um fornecedor estratégico que é, na verdade, o primeiro entre iguais. Torna-se a plataforma que orienta as escolhas para aplicativos, ferramentas ou bancos de dados de terceiros. Nas pequenas empresas, esse fornecedor de plataforma estratégica provavelmente será a Microsoft Corp. ou a Apple Inc., com a opção de Android, da Google LLC, ou iOS, da Apple, no lado móvel. Nas médias e grandes empresas, as plataformas têm maior probabilidade de serem multipolares, reflectindo o facto de que poucas ou nenhuma delas são susceptíveis de padronizar um único fornecedor principal.

Como proeminente fornecedor de aplicações empresariais, a SAP SE é frequentemente colocada no papel de fornecedor estratégico. Existem muitos fatos engraçados que apoiam isso, sendo um dos mais comuns que 77% da receita de transações do mundo atinge um sistema SAP. O uso do SAP molda muito as escolhas que eles fazem em relação a bancos de dados, análises e aplicativos de suporte.

Mas nessas mesmas organizações também é provável que haja grupos trabalhando fora do ambiente SAP. Talvez partes da organização usem o e-Business Suite ou Microsoft Dynamics da Oracle Corp., ou grupos de analistas de negócios trabalhando com análises, ou cientistas de dados construindo modelos a partir de data lakes. Na maioria das vezes, as visualizações dos dados podem ser moldadas pelo fato de você estar trabalhando dentro ou fora do ambiente murado do aplicativo corporativo.

Mantenha esse pensamento.

No que diz respeito à gestão de dados, as questões mais prementes que vemos prendem-se com o facto de as empresas conseguirem controlar melhor a sua vasta e crescente expansão de dados. Os dados não estão simplesmente se tornando mais diversificados, mas cada vez mais distribuídos. A tempestade perfeita da computação em nuvem, da conectividade e do alcance do 5G ampliou o alcance dos dados. E com a conectividade omnipresente surgem preocupações sobre a privacidade e a soberania dos dados que estão, literalmente, a definir os limites para que dados podem ser consumidos, por quem, de que forma e onde. Para os clientes SAP, o mundo dos dados explodiu fora das suas aplicações SAP.

Um subproduto disso tem sido o interesse na malha de dados, onde a propriedade e o gerenciamento do ciclo de vida são claramente delineados para as unidades de negócios, especialistas no assunto ou domínios que têm mais conhecimento e interesse nos dados. No outro extremo do espectro está a construção de uma infraestrutura lógica para garantir que os dados corretos sejam descobertos e entregues, e a partir disso temos visto um interesse crescente na estrutura de dados. Na nossa opinião, os dois devem complementar-se e não anular-se.

O desafio é definir o que é uma malha de dados. Como vimos em alguns relatórios de empresas de análise, uma malha de dados é o que costumávamos chamar de portfólio de integração de dados que abrange catálogo, ferramentas de transformação e orquestração de dados, qualidade de dados, linhagem de dados e assim por diante. Essa definição funcional é um pouco frouxa para nós.

Para nós, uma malha de dados deve começar com um backplane de metadados comum. No mínimo, ele rastreia fontes de dados e coleta metadados. Fabrics de dados mais avançados usam aprendizado de máquina para enriquecer metadados com base em inferências detectadas a partir de padrões de atividade de sistemas de origem e de destino, como quais conjuntos de dados ou entidades são frequentemente acessados ​​juntos. A estrutura deve ocultar as complexidades de descobrir, acessar, transformar, governar e proteger dados.

A malha de dados não executa necessariamente essas tarefas, mas fornece a superestrutura lógica para orquestrar o conjunto de ferramentas que expõe os dados, regula o acesso, limpa os dados, transforma-os, mascara-os em tempo de execução e determina como os dados são acessados: os dados são trazidos ao mecanismo de consulta (por meio de replicação) ou vice-versa (por meio de virtualização)? Uma malha de dados é necessária, não quando você simplesmente obtém dados de um único sistema de transação, mas de uma variedade de fontes.

COMPARTILHAR