Vamos continuar ( Slowly Changing Dimensions (parte 1) ) o post sobre SCD...
Neste post vamos abordar os tipos que nos faltam, ou seja:
A SCD do tipo 4 é útil para quando um conjunto de atributos de uma dimensão é atualizado com muita frequência. Neste sentido cria-se uma nova dimensão para separar estes atributos dos restantes e reduzir a duplicação de informação.
As técnicas do tipo 4 em diante são chamadas de híbridas porque seguem as regras das primeiras 3 com algumas nuances. Esta é uma alteração ao nível do modelo de dados e deve ser planeado no momento do desenho do modelo de dados.
Como exemplo de implementação desta técnica temos:
Outro exemplo típico são os scores de clientes, mais concretamente, atributos que se podem agrupar em classes de informação e que, neste sentido, se possam associar a um grupo da dimensão inicial e reduzir a redundância de informação.
Por exemplo, converter a idade em faixa etária no momento em que ocorre o facto, como acima exemplificado.
A SCD do tipo 5 tem como objetivo guardar histórico e gerar análises comparativas entre o histórico e valor atual. A implementação desta técnica requer a implementação do tipo 4 (histórico) e 1 (preservar o valor atual) na dimensão inicial.
A SCD do tipo 6 é semelhante à 5 pois também permite gerir valores atuais em comparação com o histórico. Esta técnica permite comparar o valor atual com todos registos de histórico.
Neste sentido, recorre-se à implementação do tipo 2 e 3. Sempre que um atributo é atualizado, adiciona-se uma linha à tabela de dimensão e atualiza-se o atributo atual em todas as linhas de histórico
A SCD do tipo 7 é uma evolução do tipo 6 para quando uma dimensão tem vários atributos a serem atualizados. Neste sentido cria-se uma mini-dimensão para ter os valores atuais.
Referências:
1. The Data Warehouse Toolkit : The Definitive Guide to Dimensional Modeling - Ralph Kimball, Margy Ross
2. QlikView 11 for Developers - Barry Harmsen
Comments are closed.
Pingback: Slowly Changing Dimensions (parte 1) – BM Consulting