O Dataproc é um serviço Spark e Hadoop gerido que lhe permite tirar partido das ferramentas de dados de código aberto para processamento em lote, consultas, streaming e aprendizagem automática. A automatização do Dataproc ajuda a criar clusters rapidamente, a geri-los facilmente e a poupar dinheiro desativando os clusters quando não precisar deles. Com menos tempo e dinheiro gastos na administração, pode focar-se nos seus trabalhos e dados.
Vantagens do Dataproc
Em comparação com os produtos tradicionais no local e os serviços na nuvem concorrentes, o Dataproc tem várias vantagens únicas para clusters de três a centenas de nós:
- Baixo custo: o Dataproc tem um preço de apenas 0,01 € por CPU virtual no seu cluster por hora, além dos outros recursos da Cloud Platform que usa. Além deste preço baixo, os clusters do Dataproc podem incluir instâncias preemptíveis com preços de computação mais baixos, o que reduz ainda mais os seus custos. Em vez de arredondar a sua utilização para a hora mais próxima, o Dataproc cobra-lhe apenas o que realmente usa com a faturação por segundo e um período de faturação mínimo de um minuto.
- Super rápido: sem usar o Dataproc, pode demorar entre 5 e 30 minutos a criar clusters do Spark e do Hadoop no local ou através de fornecedores de IaaS. Em comparação, os clusters do Dataproc são rápidos de iniciar, dimensionar e encerrar, com cada uma destas operações a demorar 90 segundos ou menos, em média. Isto significa que pode passar menos tempo à espera de clusters e mais tempo a trabalhar diretamente com os seus dados.
- Integrado: o Dataproc tem integração incorporada com outros serviços da Google Cloud Platform, como o BigQuery, Cloud Storage, Cloud Bigtable,