O que é um banco de dados?
Um banco de dados (ou database do original em inglês) é uma aplicação computacional capaz de armazenar e recuperar informações. Atualmente existem diversos modelos de armazenamento. Alguns utilizam estruturas de dados mais rígidas para garantir coesão, como o armazenamento de tabelas, já outros permitem mais flexibilidade, porém correm o risco de cair em uma desordem de dados como, por exemplo, o armazenamento de arquivos ou gráficos.
Sumário
Como funciona um banco de dados?
Um banco de dados pode ser dividido em dois componentes: o sistema de gerenciador de bancos de dados, chamado pela sigla DBMS (database management system em inglês), e o motor do banco de dados, chamado de engine.
O primeiro componente, o DBMS, é responsável por interagir com o usuário. Ele recebe os comandos enviados e os encaminha para o segundo componente, o engine para que as operações sejam realizadas no banco. Já o engine, conversa apenas com o DBMS, sendo o único que de fato interage com os dados armazenados.
Neste texto vamos falar apenas do DBMS, pois é com ele que a grande maioria dos usuários tem uma interação mais direta. Esses sistemas possuem diversas características, desde modelos open-source, como o MySQL e PostgreSQL, até produtos Enterprise que são comercializados por grandes companhias, como o banco SQLServer, da Microsoft, e o DB2, da IBM, dentre outros.
Uma vez que o DBMS tenha sido escolhido, os usuários podem salvar, consultar, alterar ou deletar informações usando uma linguagem dedicada.
A consulta, também chamada de query, criada pelo usuário, é enviada ao DBMS, que prepara os comandos a serem realizados no banco de dados e faz a comunicação com a engine do banco. Uma vez que a engine tenha recebido o sinal do DBMS, ela inicia o processo encaminhado e, ao final do processamento, retorna ao DBMS o resultado esperado. Este resultado então é apresentado para o usuário.
Para que serve um banco de dados?
Um banco de dados oferece a possibilidade de salvar e recuperar dados de forma organizada e otimizada já que, diferentemente de planilhas eletrônicas, como Microsoft Office Excel® ou Google Sheets®, ele tem uma escalabilidade maior, permitindo a inclusão de novas camadas de informações como, por exemplo, separar dados brutos de informações já processadas e de outras já prontas e disponíveis para acesso. Além disso, permite gerenciar o nível de acesso dos usuários dentro de um mesmo contexto de informações, removendo a necessidade da criação de diferentes versões das planilhas para cada nível.
Mas, acima de tudo, a maior vantagem do banco de dados é a sua capacidade de recuperar as informações contidas nele sem um conhecimento extenso da sua composição. Desta forma, basta saber o local onde uma determinada informação está armazenada (normalmente chamada de schema para bancos relacionais e collections para não-relacionais) e o nome do campo que representa o dado neste contexto.
Essas consultas podem ser executadas de forma rápida e simples, se os bancos tiverem sido bem organizados e otimizados.
Quais são os diferentes tipos de bancos de dados?
Com o avanço da tecnologia, as demandas por bancos de dados especializados ficaram cada vez maiores, e hoje categorizamos os bancos em dois grandes grupos, o SQL e o NoSQL.
Os bancos SQL, também chamados de relacionais, possuem um formato mais tradicional, tendo uma representação de seus dados na forma de tabelas, além de possuírem um mecanismo para relacionar dados semelhantes em tabelas diferentes chamados de join. O padrão estrutural deste modelo facilita a organização e padronização de dados e, portanto, facilita a escalabilidade.
No entanto, com a necessidade de aplicações que lidam com um grande volume de informações que nem sempre estão estruturadas ou organizadas, surgiram os chamados bancos NoSQL, ou não relacionais. Estes podem ser encontrados em diversos formatos e possuem modelos de representação de dados diferentes, dependendo de sua finalidade. Alguns apresentam seus registros em um documento de texto arranjados em conjuntos de chave e valor, como o MongoDB. Já outros, utilizam modelos mais específicos, como o Neo4J, que emprega o uso de grafos.
Geralmente, bancos de dados relacionais são mais indicados para armazenar dados que sigam um determinado padrão como, por exemplo, manter registros de clientes, uma vez que todos possuem os mesmos tipos de dados, como nome, sobrenome, data de nascimento etc. Ou ainda, uma organização de loja, já que todas elas são divididas nos mesmos grupos, como departamento, categoria e produtos, por exemplo.
Os bancos não relacionais, por sua vez, são mais indicados em cenários em que a estrutura de dados não precisa seguir um formato tão rígido, por exemplo, salvar a estilização da página de uma rede social dos usuários. Como, neste caso, as combinações de estilos e personalização são virtualmente infinitas, torna-se inviável criar um formato que possa registrar todas as possibilidades. Assim, é mais simples apenas salvar o formato definido pelo usuário para cada página sem a obrigatoriedade de forçar que este formato se encaixe nos padrões do banco.
Diferenças no método de consulta
Além das diferenças nas formas de representação dos dados, os bancos SQL e NoSQL também possuem uma diferença característica na forma como a consulta (query) é realizada.
Nos bancos de dados relacionais é usada a linguagem SQL, singla para Structured Query Language ou Linguagem de Consulta Estruturada em português. Esta linguagem é padronizada pelo Instituto Nacional Americano de Padrões (ANSI) e pela Organização Internacional de Padronização (ISO). Neste caso, a maior parte dos comandos disponíveis podem ser usados independentemente do DBMS escolhido. Alguns bancos podem disponibilizar funcionalidades próprias, criando um diferencial de mercado, como no caso da compatibilidade de outros produtos Microsoft no banco SQLServer ou o suporte a particionamento por XML nos bancos Oracle.
A linguagem SQL é uma linguagem de programação declarativa. Isso significa que o processo de busca no banco é feito através da adição de condições na busca. Já a query em bancos não relacionais não possui um padrão como os bancos relacionais; em outras palavras, cada banco NoSQL possui sua própria ferramenta de query. Entretanto, de maneira geral, bancos de dados não relacionais utilizam um sistema de busca similar a uma linguagem de programação imperativa, assemelhando-se a um código orientado a objetos.
A tabela abaixo mostra essa diferença, apresentando uma consulta de número de matrículas e primeiro e último nome dos colaboradores de um departamento de TI, em ambos os modelos.
Qual a importância de usar um banco de dados no seu negócio?
Como vimos, o uso de um banco de dados por si só já gera muitos benefícios, como uma forma prática e escalável de armazenar informações. Mas, talvez, a maior vantagem proporcionada por um banco de dados é a sua capacidade de sempre disponibilizar as informações mais atualizadas para diversos usuários simultaneamente, possibilitando que os dados possam ser usados para gerar insights e auxiliar decisões baseadas em informações. Além do mais, um banco de dados permite um novo grau no estudo das informações das empresas, ao possibilitar a implementação de ferramentas de BI e de análise de dados.
Em suma, a utilização de um banco de dados substitui o antigo hábito de salvar todas as informações em diversas planilhas que, no geral, ficam sob a responsabilidade de diferentes pessoas, criando grandes dificuldades nos momentos de se localizar as informações necessárias. Já um banco de dados consegue centralizar todas as informações, além de permitir o acesso aos mesmos dados atualizados por diferentes usuários, ao mesmo tempo. Além disso, como já mencionado, um banco possibilita seu uso por ferramentas de BI para análises e tomadas de decisão.
Portanto, se você já passou por algum problema para encontrar a planilha que esteja na versão mais atualizada, ou teve que lembrar quem ficou responsável por mandar a versão mais recente de um determinado documento, esta pode ser uma boa hora para começar a utilizar um banco de dados em seu negócio.