banner

blog

Dec 10, 2023

Como explicar malhas de dados, tecidos e nuvens

Por Isaac Sacolick

Editor colaborador, InfoWorld |

Seu CEO sabe o que é um banco de dados e provavelmente pensa que um data warehouse é um grande cofre de dados usado para relatórios e análises. Eles sabem pouco sobre armazenamentos de dados NoSQL, por que precisam de um cluster Spark ou como os data lakes são usados ​​para ingerir dados estruturados e não estruturados.

CEOs e líderes empresariais concentram-se no valor comercial dos dados, análises e aprendizado de máquina e se preocupam menos com as tecnologias subjacentes.

Mas aí reside um paradoxo, porque querem compreender o valor de investir tempo e dinheiro em novas tecnologias. Tente explicar as mais recentes tecnologias de gerenciamento de dados, incluindo malhas de dados, estruturas de dados e nuvens de dados distribuídas, e observe a cabeça do seu CEO girar.

Não são apenas CEOs. A tecnologia de dados explodiu desde os primórdios da web, quando o principal debate era se deveria construir seu data warehouse com base em Oracle, Microsoft ou código aberto. Muitos líderes que não são de TI hoje se contentam em acreditar que os dados estão “na nuvem” e que a integração, a qualidade e o desempenho dos dados são “questões de TI”.

Qualquer pessoa que trabalhe com dados deve estar preparada para explicar as tecnologias e práticas mais críticas em linguagem acessível. Em meu livro, Digital Trailblazer, compartilho uma história sobre como explicar o que é um cookie de navegador para os membros do conselho de nossa startup quando a web era nova. Você nunca sabe quando receberá o microfone para responder a uma pergunta técnica. Responder com technobabble pode facilmente dissuadir ou retardar investimentos importantes.

Gordon Allott, presidente e CEO da K3, sugere começar com uma resposta simples: “Data lake, data warehouse, mesh e fabric referem-se apenas à estratégia geral de dados da empresa”.

Manter as respostas simples é importante, mas nem sempre é suficiente. Quando um executivo me pergunta sobre um termo técnico, quero responder à pergunta de uma forma que estimule a curiosidade e as perguntas de acompanhamento.

Vamos começar explicando o que é uma malha de dados. Steven Lin, gerente de marketing de produto da Semarchy, compartilhou esta resposta concisa: “Uma malha de dados é uma abordagem descentralizada para o gerenciamento de dados, onde várias equipes dentro de uma empresa são responsáveis ​​por seus próprios dados, promovendo colaboração e flexibilidade”, disse ele.

Não há palavras complexas nesta definição e ela apresenta os problemas que as malhas de dados pretendem resolver, o tipo de solução e por que ela é importante.

No entanto, espere ser solicitado a fornecer mais detalhes técnicos, especialmente se o executivo tiver conhecimento prévio de outras tecnologias de gerenciamento de dados. Por exemplo, “Os data warehouses e data lakes não deveriam resolver o problema de gerenciamento de dados?”

Esta pergunta pode ser uma armadilha se você responder com as diferenças técnicas entre data warehouses, lagos e malhas. Em vez disso, concentre sua resposta no objetivo comercial.

Satish Jayanthi, cofundador e CTO da Coalesce, oferece esta sugestão: “A qualidade dos dados geralmente afeta a precisão da análise de negócios e da tomada de decisões. Ao implementar paradigmas de malha de dados, a qualidade e a precisão dos dados podem ser melhoradas, resultando em maior confiança entre as empresas para utilizar os dados de forma mais ampla para a tomada de decisões informadas.”

Gosto desta resposta e espero que o executivo queira se aprofundar em como os paradigmas de malha de dados ajudam a melhorar a qualidade dos dados. Jayanthi responde: “Um dos princípios fundamentais, a propriedade do domínio, garante que a equipe que produz os dados seja responsável pela qualidade e precisão. Este princípio dos dados como um produto garante que os dados partilhados com outros grupos sejam precisos, reutilizáveis, autodocumentados e cumpram padrões elevados.”

Se você é novo em malhas de dados e deseja se aprofundar nos detalhes técnicos, sugiro revisar o artigo fundamental de Zhamak Dehghani sobre como ir além de um data lake monolítico para uma malha de dados distribuída.

COMPARTILHAR