Glossário de BI e dados

Aqui você encontra os principais termos de Business Intelligence e Dados, com definições claras dos conceitos mais usados nessa área.

A • B • C • D • EF • G • H • I J • K • L • M • N • O • P • Q • R • S • T • U • V • W • X • Y • Z

A

Ad-Hoc: Termo utilizado para descrever consultas, relatórios, análises ou processos improvisados e não planejados realizados de maneira pontual para atender a uma necessidade ou demanda específica no momento em que surge.

Algoritmo: Conjunto de instruções ou regras lógicas usadas para realizar cálculos, processar dados ou resolver problemas específicos.

Análise de Dados: O processo de examinar, limpar, transformar e interpretar conjuntos de dados para descobrir informações úteis e tomar decisões.

Análise Preditiva: O uso de dados, estatísticas e técnicas de machine learning para prever resultados ou tendências futuras.

Armazenamento de Dados: O local físico ou virtual onde informações são mantidas, como bancos de dados, servidores ou sistemas de armazenamento em nuvem.

API (Application Programming Interface): Conjunto de regras, protocolos e ferramentas que permite que diferentes softwares se comuniquem entre si. Ela define os métodos e formatos de comunicação que os sistemas podem utilizar para solicitar e trocar informações.

B

Backup de Dados: Cópia de segurança das informações importantes para evitar perdas em caso de falhas nos sistemas ou acidentes.

Banco de dados: Conjunto organizado de dados estruturados que são armazenados eletronicamente em um sistema de computador. Esses dados são gerenciados e acessados por meio de software específico, permitindo a adição, consulta, atualização e remoção de informações de forma eficiente.

Banco de dados relacional: Um tipo de banco de dados que organiza os dados em tabelas com relações pré definidas entre elas. Utiliza a linguagem SQL para consultas e manipulação de dados, mantendo a integridade e consistência por meio de chaves estrangeiras e regras de relacionamento.

Banco de dados não relacional: Também conhecido como NoSQL , é um tipo de banco de dados que não segue o modelo relacional tradicional. Ele pode armazenar dados de forma mais flexível, utilizando estruturas como documentos, colunas, grafos ou pares chave-valor, sendo mais escalável e adequado para diferentes tipos de dados e requisitos de desempenho.

Banco de dados transacional: Sistema utilizado para armazenar dados que requerem operações de transação, como inserções, atualizações e exclusões. É otimizado para manter a integridade dos dados, garantindo que todas as transações sejam concluídas com sucesso ou revertidas em caso de falha.

BI Conversacional: Abordagem de BI que permite aos usuários fazer perguntas e solicitar informações a partir dos dados de uma maneira intuitiva e natural, sem a necessidade de conhecimento prévio de ferramentas específicas de BI ou linguagem de consulta complexa.

Big Data: Termo que descreve conjuntos de dados volumosos, complexos e variados que exigem ferramentas específicas para serem processados e analisados.

Board: Recurso para visualização de dados, criação de relatórios e painéis interativos, permitindo que os usuários explorem informações, identifiquem tendências e ajam com base nos insights gerados.

Bucket: Refere-se a um contêiner de armazenamento usado para organizar e agrupar conjuntos de dados ou arquivos em serviços de armazenamento em nuvem.

Business Intelligence: Business Intelligence (BI), ou Inteligência de Negócio, é um conjunto de estratégias, técnicas e ferramentas que envolvem a coleta, análise e interpretação de dados para orientar a tomada de decisões nas organizações. Utilizando ferramentas e tecnologias específicas, o BI transforma dados brutos em informações, permitindo que as empresas compreendam melhor seus processos internos, identifiquem padrões e antecipem tendências.

Business Analytics: O processo de exploração de dados para compreender o desempenho empresarial, identificar oportunidades e tomar decisões embasadas.

C

Cloud Computing: É a entrega de serviços de computação (armazenamento, processamento, etc.) pela internet, permitindo acesso a recursos flexíveis e escaláveis.

Cluster: Um grupo de computadores ou servidores interconectados que trabalham juntos para processar e armazenar grandes volumes de dados.

Coleta de Dados: Processo de obtenção e reunião de informações de várias fontes para análise e armazenamento.

Conector: Software ou componente que permite a integração e a comunicação entre diferentes sistemas, aplicativos ou bancos de dados. Ele facilita a transferência de dados entre esses sistemas, garantindo a interoperabilidade e a capacidade de compartilhar informações de maneira eficiente e segura.

Contêiner: Uma unidade de software leve e autônoma que empacota e isola aplicativos juntamente com todas as suas dependências, incluindo bibliotecas e arquivos necessários para sua execução.

Correlação: Uma medida estatística que indica a relação entre duas variáveis, mostrando se elas mudam juntas, de maneira positiva, negativa ou neutra.

CRM (Customer Relationship Management): Um sistema para gerenciar interações e relacionamentos com clientes, armazenando informações relevantes para melhorar o atendimento e vendas.

CSV (Comma-Separated Values): Formato de arquivo utilizado para armazenar dados tabulares, onde os valores são separados por vírgulas.

Curva de Aprendizado: Representação gráfica que mostra a relação entre o esforço ou tempo gasto aprendendo e o desempenho alcançado ao longo do tempo em uma nova tarefa ou ferramenta.

D

Dados Estruturados: Informações organizadas em um formato predefinido, seguindo um esquema ou modelo específico. Eles são organizados em tabelas, com campos definidos, facilitando a busca, consulta e análise.

Dashboard: Uma interface gráfica que exibe informações de maneira visual e condensada, como gráficos, métricas e indicadores-chave de desempenho (KPIs), para facilitar a tomada de decisões.

Data Mining: O processo de descobrir padrões ou informações úteis em grandes conjuntos de dados, utilizando técnicas estatísticas, matemáticas ou de aprendizado de máquina.

Database: Um conjunto organizado de dados armazenados eletronicamente em um sistema de computador que pode ser facilmente acessado, gerenciado e atualizado.

Data Lake: Um repositório de armazenamento de dados que permite armazenar uma grande quantidade de dados brutos em seu formato original até que sejam necessários para análise.

Data Tracing: Processo de seguir e documentar a origem e o movimento dos dados através de sistemas e processos.

Data Warehouse: Um repositório centralizado que armazena grandes volumes de dados de várias fontes para facilitar a análise e relatórios.

Dimensionalidade: Número de dimensões ou variáveis ​​presentes em um conjunto de dados. Em análise de dados, a dimensionalidade pode afetar a complexidade e a interpretação dos resultados.

Drill down: Processo de visualizar dados em níveis de detalhe crescente, passando de uma visão geral para informações mais específicas.

Drill through: Funcionalidade que permite acessar detalhes adicionais ou informações relacionadas a partir de um ponto específico em um relatório ou análise, direcionando para outro conjunto de dados ou visualização mais detalhada.

E

Elasticsearch: Uma ferramenta de busca e análise de texto que permite indexar grandes volumes de dados para realizar pesquisas rápidas e análises complexas.

ERP: Sistema de gestão empresarial que integra processos e funções de uma organização, como finanças, estoque, vendas, entre outros, em um único sistema de software centralizado.

Estrutura de Dados: A organização dos dados em um formato específico para facilitar o armazenamento, processamento e recuperação de informações.

ETL (Extract, Transform, Load): O processo de extração, transformação e carregamento de dados de fontes diferentes para um único local de armazenamento, como um data warehouse.

ELT (Extract, Load, Transform): É um processo mais ágil para o carregamento e o processamento de dados, pois inverte a ordem das etapas de transformação de dados da abordagem tradicional de ETL.

Exploração de Dados: O processo de investigação e análise inicial de um conjunto de dados para identificar padrões, tendências ou insights iniciais antes de uma análise mais aprofundada.

Excel: Uma popular ferramenta de planilha eletrônica amplamente utilizada para análise e manipulação de dados.

F

Fonte de Dados: Local onde os dados são originados, como bancos de dados, planilhas, sistemas de CRM, entre outros.

Ferramenta de BI: Software projetado para coletar, analisar e visualizar dados para apoiar o processo de tomada de decisão nas organizações.

Firebase: Uma plataforma de desenvolvimento de aplicativos que inclui um banco de dados em tempo real e outras ferramentas para armazenamento e gerenciamento de dados.

Fatores Chave de Sucesso (FCS): Elementos ou condições essenciais que são determinantes para o sucesso de uma estratégia, projeto ou iniciativa.

Ferramenta de ETL: Software usado para realizar o processo de extração, transformação e carga de dados de diferentes fontes para um data warehouse ou outro sistema de armazenamento.

Fluxo de Dados: É uma parte importante da modelagem de processos e sistemas, pois permite entender como as informações são processadas e como as diferentes partes do processo ou sistema se interconectam.

Framework: Uma estrutura ou conjunto de conceitos, práticas e padrões que serve como base para o desenvolvimento de algo mais complexo, como softwares ou aplicativos.

Fórmula: Uma expressão matemática ou lógica usada para realizar cálculos ou processar dados em uma planilha ou sistema de análise.

G

Gateway: Dispositivo ou software que atua como ponto de entrada ou saída entre dois sistemas ou redes diferentes, permitindo a comunicação e a transferência de dados entre eles.

GCP (Google Cloud Platform): Uma suíte de serviços em nuvem oferecida pelo Google que fornece armazenamento, computação, análise de dados e ferramentas de machine learning.

Gestão de Dados: O processo de organização, controle e administração de informações para garantir sua qualidade, segurança e disponibilidade.

Geoanálise: Análise de dados geográficos para identificar padrões ou tendências relacionadas a localização geográfica, utilizando mapas e coordenadas.

GitHub: Uma plataforma de hospedagem e colaboração de código-fonte usando o controle de versão Git, que também pode armazenar e compartilhar conjuntos de dados.

Google Analytics: Uma ferramenta gratuita oferecida pelo Google para análise de dados de sites, fornecendo informações sobre tráfego, comportamento do usuário, entre outros.

Gráfico de Barras: Um gráfico com barras retangulares e comprimento proporcional aos valores que ele apresenta. As barras podem ser desenhadas na vertical ou na horizontal.

Gráfico de Dispersão: Um tipo de visualização que exibe a relação entre duas variáveis, plotando pontos em um gráfico para mostrar padrões ou correlações.

Gráfico de Gantt: Um tipo de gráfico usado em gerenciamento de projetos para exibir o cronograma de atividades, mostrando a relação entre elas e o tempo previsto para execução.

Growth Hacking: Abordagem que combina criatividade, métricas e estratégias de marketing para acelerar o crescimento de um negócio, muitas vezes usando dados e experimentação.

Grid Computing: Um modelo de computação distribuída que utiliza recursos de vários computadores em rede para resolver problemas complexos ou processar grandes volumes de dados.

GQD (Gestão de Qualidade de Dados): Conjunto de práticas e processos para garantir a precisão, integridade e consistência dos dados em uma organização.

H

Hadoop: Um framework de software que permite o processamento distribuído de grandes conjuntos de dados em clusters de computadores.

Hardware: Os componentes físicos de um sistema de computador, como processadores, memória, disco rígido, etc., utilizados para armazenar e processar dados.

HTML (Hypertext Markup Language): Linguagem de marcação utilizada para criar páginas web e estruturar o conteúdo dessas páginas.

Hierarquia de Dados: Organização de dados em uma estrutura de níveis ou camadas, geralmente representando relações entre diferentes elementos de dados.

Histograma: Um gráfico de barras que representa a distribuição de frequência de dados em intervalos, mostrando a ocorrência de valores em cada intervalo.

Hosting: Provedor de hospedagem que oferece espaço em servidores para armazenar sites, aplicativos ou bancos de dados na internet.

Hive: Uma ferramenta de análise de dados que permite consultas SQL-like para processar grandes conjuntos de dados armazenados em Hadoop.

HTTP (Hypertext Transfer Protocol): Protocolo usado para transferir dados na web. Ele define a maneira como as mensagens são formatadas e transmitidas.

Hub de Dados: Um ponto central que agrega dados de diversas fontes para facilitar o acesso e a análise desses dados.

I

Inteligência Artificial (IA): Campo da ciência da computação que se concentra no desenvolvimento de sistemas capazes de realizar tarefas que normalmente exigiriam inteligência humana, como aprendizado, raciocínio e reconhecimento de padrões.

Inteligência Comercial: Envolve uma série de ações estratégicas que ajudam a melhorar os resultados de uma organização, com base na coleta e análise de informações.

Índice de Dados: Estrutura utilizada em bancos de dados para melhorar a velocidade de recuperação de dados, semelhante ao índice de um livro.

Insight: Insight é a compreensão de uma causa e efeito específicos dentro de um contexto específico.

IoT (Internet of Things): Internet das Coisas, refere-se à rede de dispositivos físicos (como sensores, veículos, eletrodomésticos) conectados à internet e capazes de coletar e trocar dados.

Integração de Dados: Processo de combinar dados de diferentes fontes para fornecer uma visão unificada e coerente, muitas vezes realizado por meio de ferramentas ETL (Extração, Transformação e Carga).

Inovação: Introdução de novas ideias, métodos ou tecnologias que resultam em melhorias significativas ou soluções mais eficientes.

Infrastructure as a Service (IaaS): Modelo de computação em nuvem que fornece acesso a recursos de infraestrutura, como servidores virtuais, armazenamento e redes pela internet.

J

Java: Uma linguagem de programação popular e versátil utilizada no desenvolvimento de aplicativos e sistemas de software.

JavaScript: Uma linguagem de programação usada principalmente para criar interatividade em páginas da web.

JavaScript Frameworks: Conjuntos de ferramentas e bibliotecas em JavaScript que oferecem estruturas para o desenvolvimento mais eficiente de aplicativos web.

Java Virtual Machine (JVM): Um ambiente de execução que permite que aplicativos Java sejam executados em diferentes plataformas sem modificação.

JSON (JavaScript Object Notation): Um formato de arquivo leve e de fácil leitura para troca de dados, comumente usado na web para transmitir informações entre um servidor e um navegador.

Jupyter Notebook: Uma aplicação web interativa que permite criar e compartilhar documentos contendo código, visualizações, textos e equações matemáticas.

JDBC (Java Database Connectivity): Uma API (Interface de Programação de Aplicações) em Java que permite a conexão com bancos de dados e a execução de consultas SQL.

Just-in-Time (JIT) Compilation: Um método de compilação em tempo de execução que traduz código de máquina para uma linguagem de alto nível enquanto o programa está em execução.

Job Scheduler: Uma ferramenta que automatiza a execução de tarefas em horários específicos ou em resposta a eventos predefinidos.

K

KPI (Key Performance Indicator): Indicadores-chave de desempenho que ajudam a medir o progresso em direção a objetivos específicos de uma organização.

Knowledge Discovery in Databases (KDD): Processo de descoberta e extração de informações úteis e novos conhecimentos a partir de grandes conjuntos de dados.

K-means: Um algoritmo de agrupamento usado em análise de dados para classificar dados em grupos baseados em características semelhantes.

K-Nearest Neighbors (K-NN): Um algoritmo de aprendizado de máquina usado para classificação e regressão baseado na proximidade dos dados.

Keyword: Palavra-chave utilizada em buscas online ou em estratégias de otimização de mecanismos de busca (SEO) para identificar os termos relevantes em um contexto específico.

Knowledge Graph: Uma representação estruturada de informações que busca conectar e organizar dados de maneira a mostrar relações e interconexões entre conceitos.Knowledge Graph: Uma representação estruturada de informações que busca conectar e organizar dados de maneira a mostrar relações e interconexões entre conceitos.

L

Linguagem de Consulta: Uma linguagem usada para fazer consultas em bancos de dados ou sistemas, como SQL (Structured Query Language) para interagir com bancos de dados relacionais.

Limpeza de Dados: O processo de identificar e corrigir erros, inconsistências ou valores ausentes em conjuntos de dados, visando garantir a qualidade e precisão dos dados.

Lógica Fuzzy: Um método que lida com informações imprecisas ou incertas, permitindo o uso de valores intermediários ou aproximados em vez de apenas verdadeiro ou falso.

M

Machine Learning: Um ramo da inteligência artificial (IA) que permite aos sistemas aprenderem e melhorarem a partir de experiências anteriores sem serem explicitamente programados.

MapReduce: Um modelo de programação usado para processar grandes conjuntos de dados distribuídos em ambientes de computação em clusters.

Matriz de Dados: Uma representação tabular de informações organizadas em linhas e colunas, comuns em análises estatísticas e de BI.

Metadata: Informações que descrevem outros dados, como tags, descrições e propriedades, facilitando a compreensão e o gerenciamento dos dados.

Métricas de Desempenho: Indicadores quantitativos usados para medir o desempenho de processos, sistemas ou estratégias de negócios.

Mineração de Dados: Processo de análise de grandes conjuntos de dados para identificar padrões, tendências ou informações úteis usando técnicas estatísticas e de machine learning.

Middleware: Software que atua como intermediário entre diferentes sistemas, facilitando a comunicação e a integração entre eles.

Modelagem de Dados: Processo de criar uma representação abstrata de como os dados de uma organização são estruturados e armazenados. Isso envolve a definição de entidades, relacionamentos, regras e esquemas para representar informações de forma eficiente.

Modelagem Preditiva: Uso de dados históricos e algoritmos para prever resultados futuros ou tendências.

Modelo de Dados: Uma representação visual ou lógica que descreve como os dados estão organizados e relacionados em um banco de dados.

Multidimensionalidade: Característica de um modelo de dados que permite a análise de informações a partir de diferentes perspectivas ou dimensões.

N

Naive Bayes: Um algoritmo de aprendizado de máquina baseado no teorema de Bayes usado para classificação e filtragem de dados.

NLP (Processamento de Linguagem Natural): Campo da inteligência artificial que se concentra na interação entre computadores e linguagem humana.

Nó (Node): Em redes ou estruturas de dados, um nó é um ponto individual que faz parte de uma rede maior ou estrutura.

Normalização de Dados: Processo de organização de um banco de dados para reduzir a redundância e melhorar a integridade dos dados.

NoSQL (Not Only Structured Query Language): Um tipo de banco de dados não relacional, que não segue o modelo de tabelas e relacionamentos de bancos de dados tradicionais.

Nuvem (Cloud): Refere-se a serviços, aplicativos ou armazenamento hospedados na internet, acessíveis remotamente em vez de localmente em um dispositivo.

O

OLAP (Online Analytical Processing): Uma abordagem de análise que permite aos usuários analisar dados multidimensionais de forma dinâmica.

OLTP (Online Transaction Processing): É um tipo de processamento de dados que consiste na execução de várias transações que ocorrem simultaneamente

On-Demand: Modelo de entrega de serviços ou recursos em que são fornecidos conforme a necessidade, sem a necessidade de instalação ou configuração prévia.

On-premise: Refere-se a software ou sistemas que são instalados e operados dentro das instalações físicas de uma organização, ao invés de serem hospedados em nuvem ou servidores externos.

Open Source: Software ou tecnologia cujo código-fonte é disponibilizado e pode ser modificado e distribuído livremente.

Operações CRUD (Create, Read, Update, Delete): As quatro operações básicas de um sistema de gerenciamento de banco de dados: criar, ler, atualizar e excluir dados.

Outlier: Um valor atípico ou fora do padrão em um conjunto de dados, que pode distorcer análises estatísticas e modelos.

Outsourcing: Prática de contratar serviços externos de terceiros para realizar determinadas funções ou atividades que normalmente seriam realizadas internamente pela empresa.

Overfitting: Um problema em modelos de machine learning, quando o modelo se ajusta demasiadamente aos dados de treinamento e perde capacidade de generalização para novos dados.

P

Painel de Vendas: Uma interface visual que exibe informações e métricas relacionadas às atividades de vendas, permitindo uma visão geral do desempenho de vendas.

Pareto: Princípio que sugere que aproximadamente 80% dos efeitos vêm de 20% das causas, muitas vezes aplicado na análise de dados.

Personalização: Adaptação de conteúdo, ofertas ou experiências com base nas preferências ou comportamentos individuais dos usuários.

Pipeline de Dados: Um conjunto de processos sequenciais para coletar, processar e transformar dados, geralmente em preparação para análises ou armazenamento.

Pivotagem (Pivoting): Processo de reorganização de dados, geralmente de linhas para colunas, ou vice-versa, para facilitar análises diferentes.

Processamento de Dados: Manipulação e transformação de informações para gerar insights ou atender a determinados objetivos.

Processamento de linguagem natural (NLP): É uma vertente da inteligência artificial que ajuda computadores a entender, interpretar e manipular a linguagem humana.

Plataforma de Business Intelligence: Um conjunto de ferramentas e tecnologias usado para coletar, analisar e apresentar dados para apoiar decisões empresariais.

Python: Uma linguagem de programação popular, utilizada em análise de dados, machine learning e muitas outras áreas.

Power BI: Uma ferramenta da Microsoft para visualização de dados e criação de relatórios interativos para análises empresariais.

Q

Qualidade de Dados: Medida que avalia a precisão, integridade, consistência e confiabilidade dos dados em um conjunto de dados.

Query: Uma solicitação de informações a um banco de dados, utilizando uma linguagem específica, como SQL, para recuperar dados que correspondam aos critérios definidos.

Query Builder: Uma ferramenta ou interface gráfica que permite aos usuários criar consultas a bancos de dados sem a necessidade de conhecimento avançado em linguagens de consulta.

Query Language: Uma linguagem utilizada para interagir com bancos de dados para recuperar, inserir, atualizar ou excluir dados.

Query Optimization: Processo de ajustar consultas a bancos de dados para melhorar o desempenho, reduzindo o tempo de resposta e uso de recursos.

QlikView: Uma plataforma de visualização de dados e análise de BI que oferece recursos para criar dashboards e relatórios interativos.

Qlik Sense: Outra ferramenta da Qlik, similar ao QlikView, focada em autoatendimento e visualização de dados para usuários não técnicos.

Quartile (Quartil): Em estatística, um quartil divide um conjunto de dados em quatro partes iguais, representando 25% dos dados em cada parte.

R

RDBMS (Sistema de Gerenciamento de Banco de Dados Relacional): Um sistema que organiza dados em tabelas relacionadas, permitindo consultas complexas usando SQL.

Redução de Dimensionalidade: Um processo de reduzir o número de variáveis em um conjunto de dados mantendo o máximo de informações relevantes possível.

Relatório: Um documento que apresenta informações resumidas e análises sobre um conjunto específico de dados para suportar a tomada de decisões, geralmente apresentado de maneira visual.

Regressão: Uma técnica estatística utilizada para identificar e analisar a relação entre variáveis, prever valores futuros e entender padrões nos dados.

Repositório de Dados: Um local centralizado onde os dados são armazenados e organizados para fácil acesso e uso.

Representante Comercial: É o profissional que atua diretamente com as vendas de produtos ou serviços de uma empresa. Ele pode ter vínculo empregatício ou ser autônomo.

Risco: A probabilidade de perda, dano ou impacto negativo associado a uma ação, decisão ou evento.

ROI (Retorno Sobre Investimento): Uma métrica que mede a eficácia e rentabilidade de um investimento em relação aos custos.

S

SaaS (Software como Serviço): Modelo de distribuição de software onde aplicativos são hospedados na nuvem e acessados pela internet, sem necessidade de instalação local.

Scrum: Metodologia ágil de gerenciamento de projetos que enfatiza a colaboração, adaptabilidade e entrega incremental de produtos.

Self-Service BI: Abordagem que permite aos usuários finais acessar e analisar dados sem depender de suporte de TI ou especialistas em dados.

Segurança de Dados: Conjunto de práticas e tecnologias usadas para proteger informações contra acessos não autorizados, garantindo confidencialidade, integridade e disponibilidade dos dados.

Sistema de Informação: Conjunto de componentes inter-relacionados que coletam, processam, armazenam e distribuem informações dentro de uma organização.

SLA (Service Level Agreement): Um contrato entre um fornecedor de serviços e um cliente que estabelece as expectativas de desempenho e disponibilidade do serviço.

Software: Conjunto de programas, instruções ou dados que permitem que um sistema de computador realize tarefas específicas. Pode incluir aplicativos, sistemas operacionais, utilitários e outros programas usados para operar dispositivos e processar dados.

SQL (Structured Query Language): Linguagem de programação utilizada para realizar consultas e manipulações em bancos de dados relacionais.

SSOT (Single Source of Truth): Conceito que representa a ideia de ter uma única fonte confiável e centralizada para dados em uma organização, evitando discrepâncias e garantindo consistência nas informações.

Streaming de Dados: O processo de transferir e processar dados continuamente em tempo real, sem armazenamento em massa.

T

Tabela: Uma estrutura organizada de dados dispostos em linhas e colunas, onde cada linha representa uma entrada individual e cada coluna representa um atributo ou característica dessas entradas.

Tabela Fato: Em modelagem de dados de data warehouse, é uma tabela central que contém métricas numéricas e fatos sobre um determinado processo, geralmente ligada a tabelas de dimensão por chaves estrangeiras.

Tableau: Uma ferramenta de visualização de dados que permite criar dashboards interativos e relatórios visuais.

Taxa de Conversão: Uma métrica usada para medir a eficácia de uma ação específica, representando a porcentagem de usuários ou clientes que realizaram uma ação desejada em relação ao total de interações.

Taxonomia de Dados: Uma estrutura hierárquica ou sistema de classificação usado para organizar e categorizar diferentes tipos de dados em um ambiente de BI ou banco de dados, facilitando a busca e o entendimento dos dados.

Tempo de Resposta: O período entre uma consulta ou solicitação de dados e a entrega da resposta final. No contexto de BI, é a medida do tempo que um sistema leva para processar uma consulta e retornar os resultados.

Tendências: Padrões identificáveis e direcionamentos subjacentes nos dados ao longo do tempo, que podem indicar mudanças, crescimento ou declínio em métricas específicas.

Teste A/B: Uma técnica experimental usada para comparar duas versões diferentes de um elemento (como um site, anúncio ou produto), a fim de determinar qual delas apresenta melhor desempenho com base em métricas predefinidas.

Transformação de Dados: O processo de modificação, limpeza, agregação ou combinação de conjuntos de dados brutos para prepará-los para análise ou uso posterior. Isso inclui manipulação, filtragem e formatação dos dados.

Tracking (Rastreamento): O processo de coleta contínua de dados sobre atividades, interações ou comportamentos dos usuários em sistemas digitais, geralmente por meio de cookies, pixels ou códigos de rastreamento.

U

Unificação de Dados: O processo de combinar informações de várias fontes e formatos diferentes em uma única fonte de verdade, a fim de criar um conjunto de dados integrado e consistente.

Upload de Dados: O ato de transferir dados de um dispositivo local para um sistema ou plataforma remoto.

Upsert: Operação que atualiza um registro se ele já existe no banco de dados ou insere um novo registro se ele não existe, garantindo a integridade dos dados ao lidar com atualizações e inserções simultâneas.

Usabilidade: A medida em que um sistema ou conjunto de dados é fácil de usar e compreender para os usuários finais, focando na eficiência, aprendizado e satisfação do usuário ao interagir com a interface.

Usuário Final: Indivíduo ou grupo que interage diretamente com os sistemas de BI ou com os dados resultantes das análises para tomar decisões ou realizar ações.

V

Variância: Uma medida estatística que indica a dispersão dos valores em torno da média em um conjunto de dados, mostrando o quão distantes os valores estão da média.

Variável: Em estatística e análise de dados, é um atributo ou medida que pode ser mensurado, observado ou controlado em um estudo. Variáveis podem ser qualitativas (categóricas) ou quantitativas (numéricas).

Validação Cruzada (Cross-validation): Técnica usada para avaliar a capacidade de generalização de um modelo de machine learning, dividindo os dados em subconjuntos para treinamento e teste repetidos, a fim de mitigar o overfitting.

Validação de Modelos: Processo de avaliar a precisão e a adequação de um modelo estatístico ou algoritmo, usando métricas e técnicas para garantir sua eficácia na previsão ou na análise de dados.

Visão (View): Uma representação virtual de um subconjunto dos dados de um banco de dados que é derivado de uma ou mais tabelas. É utilizada para simplificar consultas e restringir o acesso aos dados.

Visualização de Dados: Representação gráfica de dados para identificar padrões, tendências ou insights de forma mais compreensível.

Visualização Interativa: Gráficos ou representações visuais que permitem aos usuários finais interagir com os dados, alterando parâmetros, filtrando informações ou explorando diferentes perspectivas.

VPN: Conexão segura que permite que usuários acessem uma rede privada pela internet de forma segura e privada, criptografando os dados transmitidos e protegendo a privacidade das informações durante o tráfego online.

W

Warehouse (Armazém de Dados): Um repositório centralizado onde os dados são armazenados, integrados e organizados para suportar análises e tomada de decisões.

Workflow (Fluxo de Trabalho): A sequência de atividades, processos ou etapas pelas quais os dados passam, desde a coleta até a análise e apresentação, seguindo um padrão pré-definido.

Web Analytics: O processo de coleta, análise e relatório de dados sobre o comportamento dos usuários em sites ou aplicativos, utilizado para otimizar a experiência do usuário e melhorar o desempenho online.

Widget: Um componente de interface gráfica de usuário (GUI) usado para exibir dados ou funcionalidades específicas em dashboards ou aplicações de BI, como gráficos, controles interativos, entre outros.

Wrangling de Dados: O processo de limpeza, transformação e preparação de conjuntos de dados brutos para análise, envolvendo manipulação de formatos, padronização e correção de erros.

Watson Analytics: Uma plataforma de análise de dados da IBM que usa inteligência artificial para simplificar o processo de análise, descoberta de insights e apresentação de resultados.

Web Scraping: A técnica de coletar dados de páginas da web automaticamente, geralmente para análise.

X

XML (Extensible Markup Language): Uma linguagem de marcação usada para armazenar e transportar dados de forma legível tanto para humanos quanto para máquinas.

XHTML (Extensible Hypertext Markup Language): Uma versão mais rigorosa e XML-compatível do HTML, usada principalmente para construir páginas da web.

XQuery: Uma linguagem de consulta projetada para consultar e transformar coleções de documentos XML.

XLSX (Excel Spreadsheet XML): Um formato de arquivo usado pelo Microsoft Excel para armazenar dados em planilhas, baseado em XML.

Y

Yottabyte: Uma unidade de medida de armazenamento de dados equivalente a 10^24 bytes. É uma medida extremamente grande e utilizada para descrever a capacidade de armazenamento de volumes enormes de informações. O yottabyte é uma das maiores unidades de armazenamento de dados existentes, representando uma quantidade colossal de bytes.

Z

Zero-Configuration Networking: Uma tecnologia que permite dispositivos de rede se comunicarem automaticamente entre si sem a necessidade de configuração manual, facilitando a conexão de dispositivos em redes locais.

Zero-Day: Uma vulnerabilidade de segurança que é explorada por hackers antes que a empresa tenha conhecimento ou uma solução para corrigi-la.

Zettabyte (ZB): Uma unidade de medida de armazenamento de dados equivalente a 10^21 bytes. Representa uma quantidade extremamente grande de dados, sendo usada para descrever a capacidade de armazenamento em escala exabyte.

Z-Score Normalization: Um método de normalização de dados utilizado para padronizar variáveis, transformando-as para terem uma média de zero e um desvio padrão de um, facilitando a comparação entre diferentes variáveis.

Z-Wave: Um protocolo de comunicação sem fio usado principalmente em dispositivos de automação residencial e Internet das Coisas (IoT) para permitir a conectividade entre diferentes dispositivos eletrônicos.

Zigbee: Outro protocolo de comunicação sem fio, similar ao Z-Wave, frequentemente utilizado em dispositivos de IoT e redes de sensores de baixa potência para permitir a comunicação entre dispositivos.

Zero-Fill: Um método de preenchimento de espaços vazios em um disco rígido ou na memória com zeros, geralmente usado para garantir a segurança ao descartar ou apagar dados.

Zone Map: Em sistemas de banco de dados, é uma estrutura que armazena informações sobre a distribuição de dados em diferentes partições ou zonas para otimizar consultas.