Ads 468x60px

terça-feira, 30 de agosto de 2011

Conecte o MS SQL Server com o Hadoop


A Microsoft anunciou duas prévias tecnológicas comunitárias (Community Technology Preview, ou CTP) de conectores para a plataforma map/reduce em código aberto Hadoop. A tecnologia Hadoop é desenvolvida sob a tutela da Apache Software Foundation para gerenciar e analisar grandes quantidades de dados ("Big Data"). Os conectores permitem a transferência de dados em ambas as direções entre o Hadoop e o Microsoft SQL Server R2 e SQL Server Parallel Data Warehouse (PDW).


Esses conectores permitem que grandes quantidades de dados estruturados e não-estruturados sejam manipulados pelo Hadoop usando os sistemas de banco de dados da Microsoft. Por exemplo, cliente podem analisar dados não-estruturados no Hadoop e integrar os resultados encontrados por eleno produto de armazenamento de dados da Microsoft. Os conectores usam SQOOP (Hadoop to SQL) para lidar com a transferência de dados entre o Hadoop File System (HDFS) e as bases de dados relacionais. O conector PDW também usa uma ferramenta PDW Bulk Load/Extract de alto desempenho para importar e exportar dados.


De acordo com o anúncio, o conector do SQL Server é compatível com o Denali, que é o codinome para a próxima versão do servidor SQL da Microsoft, que está atualmente em sua terceira prévia comunitária. Clientes podem pedir uma cópia da versão de teste do conector para PDW através do serviço de suporte ao cliente da Microsoft (Microsoft's Customer Support Service), já para o conector para o SQL Server já existe uma página de download.


O Hadoop é um framework Java para armazenamento e processamento paralelo de dados destinado à grandes quantidades de informação, armazenadas através de diversos blocos. A ideia básica do framework vem da tecnologia MapReduce do Google.


Fonte: h-online, em inglês.

0 comentários: