No mundo dos gadgets inteligentes, desde desde pequenos dispositivos até máquinas de classe empresarial estão gerando muitos dados e isso leva à evolução do termoGRANDES DADOS. Agora que o Big Data está aqui, torna-se uma grande tarefa para grandes empresas. Mas um grande problema significa uma grande solução e para resolver isso, o código aberto está aqui, existem muitas ferramentas de código aberto disponíveis, que podem facilmente ajudar pequenas e grandes empresas na análise de Big Data.Ferramentas de código abertoagora se tornou um nome líder em termos desoluções de big data, business intelligence, análise preditiva, comércio eletrônico,e muito mais. Existem muitosaplicativos de análise de dados de código abertoe todos têm seu USP.
A maioria das ferramentas disponíveis para análise de big data são de código aberto e o Apache é o líder nesse espaço. Hoje, aqui apresentamosprincipais soluções de software de análise de dados de código aberto.Todas essas ferramentas de análise de big data são desenvolvidas para atender aos requisitos de nível empresarial.Aqui estão algumas das principais ferramentas analíticas de Big Data de código aberto.
1. Hadoop
O ApacheHadoopé um grande nome no mundo do Big Data e dispensa apresentações. Hadoop é uma estrutura usada para processamento distribuído de grandes conjuntos de dados em clusters de computadores. Ele usa modelos de programação simples. O Hadoop pode ser ampliado de um único servidor para milhares de máquinas, juntamente com computação e armazenamento locais. A estrutura foi projetada para detectar e lidar com falhas na camada de aplicação, em vez de depender de hardware para fornecer alta disponibilidade.
2. Faísca:aplicativo de análise de dados de código aberto
Spark também é um projeto Apache que promete executar programas até 100x mais rápido que o Hadoop MapReduce na memória, ou 10x mais rápido no disco. O mecanismo de execução Apache Spark DAG é um dos mecanismos de execução avançados que suporta fluxo de dados acíclicos e computação na memória. O Spark alimenta uma pilha de bibliotecas, incluindo SQL e DataFrames, MLlib para aprendizado de máquina, GraphX e Spark Streaming.Para mais informações.
3. Talento
Talend é um projeto de código aberto, mas administrado por uma empresa com fins lucrativos, e não por uma fundação como a Apache. Talend oferece produtos comerciais e gratuitos para equilibrar as demandas. O produto gratuito e de código aberto da Talend é chamado Talend Open Studio, que compreende: – Open Studio para Big Data, Open Studio para integração de dados, Open Studio para qualidade de dados, Open Studio para ESB e Open Studio para MDM.Baixe Talend Data Analytics.
4.Jaspersoft:aplicativo de análise de dados de código aberto
Jaspersoft é uma ferramenta de business intelligence de código aberto, assim como o Talend oferece produtos comerciais pagos e gratuitos. O vem em várias edições gratuitas e pagas. As edições de software de business intelligence que oferece são Community (edição gratuita e Opensource) e as demais edições pagas são Reporting, AWS, Professional e Enterprise.Baixar Jaspersoft
5. RapidMiner
No site da RapidMiner, eles afirmam ser a plataforma de ciência de dados de código aberto número 1 e líder no novo Quadrante Mágico do Gartner de 2017 para plataformas de ciência de dados. Ele oferece uma plataforma analítica colaborativa para ciência de dados de alto valor. A plataforma RadipMiner compreende 3 módulos diferentes-
- Estúdio RapidMiner
- Servidor RapidMiner
- RapidMiner Radoop
Todos os três são de código aberto e vêm com licenças gratuitas e pagas. Inicialmente, todos os três módulos são gratuitos (dependendo dos usuários).Baixar RapidMiner.
6. Tempestade
Apache Storm é outro aplicativo gratuito eaplicativo de análise de dados de código abertoque é conhecido por seu processamento em tempo real. Pode ser usado com qualquer linguagem de programação. Ele pode ser usado para muitas finalidades, como análise de dados em tempo real, aprendizado de máquina online, RPC distribuído, computação contínua, ETL e muito mais. É escalonável, tolerante a falhas, possui recursos de processamento rápido e é fácil de operar e implantar. Apache Storm, sistema de computação distribuído em tempo real, gratuito e de código aberto, usado por muitos grandes nomes, como Flipboard, Yahoo, Twitter, Spotify e muito mais.Baixar tempestade Apache.
7. H2O
O site H2O afirma ser a plataforma de inteligência artificial (IA) ou aprendizado de máquina de código aberto nº 1 do mundo. Ele usa uma tecnologia in-memory que oferece desempenho rápido. O software de aprendizado de máquina e análise preditiva H2O é totalmente escrito do zero em Java e se integra perfeitamente aos produtos de código aberto mais populares, como Apache Hadoop e Spark. O H2O pode ser facilmente implantado em qualquer lugar na nuvem, no local, em estações de trabalho, servidores ou clusters.Baixar H2o
8. Lumificar:aplicativo de análise de dados de código aberto
Lumify é uma plataforma de análise e visualização de big data de código aberto. O Lumify pode analisar facilmente relacionamentos entre entidades e estabelecer links em 2D ou 3D. Aso no site do Lumify oferece alguns vídeos para entender como funciona o Lumify. Os vídeos sãoVisualização gráfica do Lumify,Integração do mapa Lumify,Pesquisa Lumify, ePainel de detalhes do Lumify.Baixe o Lumify.
9. Broca Apache
Apache Drill é um mecanismo de consulta SQL sem esquema para Hadoop, NoSQL e Cloud Storage. Apache Drill oferece suporte a diversos bancos de dados NoSQL e sistemas de arquivos, como Google Cloud Storage, Swift, NAS HBase, MongoDB, MapR-DB, HDFS, MapR-FS, Amazon S3, Azure Blob Storage e arquivos locais.Baixe o Apache Drill.
10. Sistema HPCC
HPCC Systems é uma plataforma de computação de processamento paralelo de código aberto para processamento e análise de big data. Ele oferece uma interface web baseada em padrão para consultar dados. Ele pode ser executado em hardware comum, um sistema de arquivos distribuído integrado, pode ser dimensionado para milhares de nós e é resistente a falhas.Baixar sistemas HPCC
Além disso, leia:













