Diferenças entre Distinct e Group By

Qual é a diferença entre DISTINCT e GROUP BY?

Esta pergunta muitas vezes vem a minha cabeça. Apesar de me considerar um aprendiz em relação à banco de dados, vira e mexe eu acabo tendo que me virar, pois bem, após algumas pesquisas consegui resumidamente descobrir a diferença entre essas duas funções do SQL.

A função DISTINCT e GROUP BY normalmente geram o mesmo plano de consulta, de modo que o desempenho deve ser o mesmo em ambas as construções de consulta. Fiz alguns testes locais em pequenas quantidades ( cerca de 1000 registros e o desempenho foi o mesmo )

A função GROUP BY deve ser utilizada para aplicar os operadores de agregação para cada grupo. Se tudo o que você precisa é para remover duplicatas então use DISTINCT.

O que eu pude perceber que inicialmente os algoritmos de DISTINCT e GROUP BY são idênticos. A diferença entre os algoritmos é que o GROUP BY permite funções de agregação como um passo adicional enquanto que o DISTINCT não permite. Quando se utiliza o GROUP BY sem essas funções, estaremos “repetindo” exatamente as fases iniciais que o DISTINCT utiliza e implementando as sub-funções de agregação do GROUP BY.

Veja alguns exemplos que lhe ajudarão a entender de maneira mais “dinâmica” :

Exemplo de Distinct:

SELECT DISTINCT Pessoa, Email
FROM Pessoas

Exemplo de Group By:

SELECT Pessoa, Email
FROM Pessoas
GROUP BY Pessoa, Email

Exemplo de agregação com Group By :

SELECT Pessoa, Email, COUNT(*) Total
FROM Pessoas
GROUP BY Pessoa, Email

Bom, ficamos por aqui hoje com esta dica rápida!

Diferenças entre Distinct e Group By – SQL Server

Cardinalidade: O Conceito que Transforma o Desempenho de Bancos de Dados SQL e NoSQL

Entendendo os diferentes tipos de locks em bancos de dados e como evitá-los

Happy Hour com Dados #14 – Modelagem de Dados

1000 livros gratuitos sobre programação!

Mais de 200 livros de programação gratuitos em português

1000 livros gratuitos sobre programação!

Google lança versão “invisível” do reCAPTCHA!

Mini curso de HTML5 oferecido pela Microsoft

O que significa ( !important ) na declaração do CSS ?

Programa para supercompactar arquivos. KGB Archiver.

Autoscaling pode ampliar o incidente: por que escalar uma camada não aumenta a capacidade do sistema inteiro

Observabilidade de IA com OpenTelemetry: o que realmente deveria aparecer no trace?

Rate limiting não é só proteção contra abuso. É contrato de capacidade

Feature flag não é interruptor. É dívida operacional com prazo de validade

O modelo é infraestrutura: por que LLM deveria ser adapter, não o centro da sua arquitetura

Diferenças entre Distinct e Group By – SQL Server

Qual é a diferença entre DISTINCT e GROUP BY?

Posts Relacionados