DW - Arquiteturas OLAP

Muita confusão está surgindo com alguns termos sobre arquiteturas de OLAP e eles estao proliferando com muita rapidez. ROLAP, HOLAP, MOLAP e DOLAP são exemplos disso e nós tentaremos esclarecer essas siglas, em princípio enigmáticas.




Por Ivã Cielo

As grandes quantidades de nomenclaturas que estão aparecendo são algumas variações de estrutura da OLAP. A tecnologia em questão surgiu com a evolução dos sistemas de informação. Esses sistemas no seu começo armazenavam grandes quantidades de dados mas a recuperação dos mesmos tornava-se um tormento para os usuários finais e analistas de sistemas. Quem não se recorda do quanto era difícil gerar um relatório quando trabalhávamos com Clipper: a dificuldade talvez não fosse em relação à massa de dados, mas sim à grande complexidade de um sistema não-relacional onde tínhamos que sair a procura dos dados em vários arquivos. Assim, para que conseguíssemos construir o relatório dos clientes mais rentáveis no semestre para o gerente de vendas, tínhamos dois grandes trabalhos: Primeiro encontrar os dados, e depois codificar para construir(e depois, quase sempre reconstruir) o relatório no formato desejado. Nem precisamos mencionar o grande porte...
Os SGBD’s (Sistemas Gerenciadores de Banco de Dados) foram evoluindo significativamente junto com as linguagens de programação, o que facilitou um pouco a vida dos analistas de sistemas. As montanhas de dados já poderiam ser acessadas de uma maneira um pouco mais simples, mas ainda longe do ideal, visto que os usuários ainda dependiam de um técnico de informática para ter acesso a qualquer relatório que não havia sido previsto no levantamento do sistema.
Acompanhando a evolução dos sistemas, na década de 90 introduziu-se uma nova classe de ferramentas no mercado, que foi batizada de OLAP (On Line Analitical Processing), que permitiam acesso rápido aos dados conjugado com funcionalidades de análise multidimensional dos mesmos pelos usuários finais. A rapidez exigida tinha de ser satisfatória, algo em torno de 5 segundos para a resposta. A análise deveria ser dinâmica, onde o usuário poderia fazer a consulta que quisesse, sem depender de um técnico, e multidimensional compartilhada. Essa última é a principal característica do OLAP, a qual descreveremos a seguir.
A análise multidimensional é uma das grandes utilidades da tecnologia OLAP, consistindo em ver determinados cubos de informações de diferentes ângulos, e de vários níveis de agregação. Os “cubos” são massas de dados que retornam das consultas feitas ao banco de dados, e podem ser manipulados e visualizados por inúmeros ângulos (usando a tecnologia de slice-and-dice) e diferentes níveis de agregação (usando a tecnologia chamada “drill”).
As ferramentas que disparam uma instrução SQL, de um cliente qualquer, para o servidor e recebem o microcubo de informações de volta para ser analisado na workstation, chamam-se DOLAP (Desktop On Line Analytical Processing). O ganho com essa arquitetura é o pouco tráfego que se dá na rede, visto que todo o processamento OLAP acontece na máquina cliente, e a maior agilidade de análise, além do servidor de banco de dados não ficar sobrecarregado, sem incorrer em problemas de escalabilidade. A desvantagem é que o tamanho do micro-cubo não pode ser muito grande, caso contrário a análise passa a ser demorada e/ou a máquina do cliente pode não suportar em função de sua configuração.
As ferramentas ROLAP (Relational On Line Analytical Processing), possuem uma engenharia de acesso aos dados e análise OLAP com uma arquitetura um pouco diferente. Nesse caso a consulta é enviada ao servidor de banco de dados relacional e processada no mesmo, mantendo o cubo no servidor. O que podemos notar nesse caso é que o processamento OLAP se dará somente no servidor. A principal vantagem dessa arquitetura é que ela permite analisar enormes volumes de dados, em contra partida uma grande quantidade de usuários acessando simultaneamente poderá causar sérios problemas de performance no servidor causando, inclusive, o travamento do mesmo.
A arquitetura MOLAP (Multidimensional On Line Analytical Processing) processa-se da seguinte forma:Com um servidor multidimensional o acesso aos dados ocorre diretamente no banco, ou seja, o usuário trabalha, monta e manipula os dados do cubo diretamente no servidor. Isso traz grandes benefícios aos usuários no que diz respeito à performance, mas tem problemas com escalibilidade além de ter um custo alto para aquisição.
Recentemente surgiu outra arquitetura denominada HOLAP (Hybrid On Line Analytical Processing), ou simplesmente processamento híbrido. Essa nova forma de acessar os dados nada mais é do que uma mistura de tecnologias onde há uma combinação entre ROLAP e MOLAP. A vantagem é que com a mistura de tecnologias pode-se extrair o que há de melhor de cada uma, ou seja, a alta performance do MOLAP com a escalibilidade melhor do ROLAP.

Comentários

Postagens mais visitadas deste blog

Redação Ti Nota 10 - Klauss

Prova Discursiva nota 10 - Banca Cespe

Portugues - Orações