Este documento descreve como monitorizar e tentar otimizar os recursos de uma tarefa em lote através da visualização de métricas no Cloud Monitoring. Para saber mais sobre os recursos em que uma tarefa é executada, consulte o artigo Recursos de tarefas.
Para qualquer tarefa, a monitorização fornece métricas básicas, como a utilização da CPU e o tráfego de rede. No entanto, algumas métricas, como a utilização de memória e processos, só podem ser recolhidas se uma tarefa instalar o agente de operações. As métricas dos recursos de uma tarefa ajudam a avaliar o desempenho e a utilização de cada recurso. Estas informações podem ajudar a identificar melhorias para quaisquer iterações futuras do trabalho. Por exemplo, pode remover recursos não utilizados para ajudar a otimizar os custos ou pode melhorar ou aumentar os recursos sobrecarregados para ajudar a melhorar o desempenho.
Antes de começar
- Se nunca usou o Batch, reveja o artigo Comece a usar o Batch e ative o Batch concluindo os pré-requisitos para projetos e utilizadores.
- Opcional: para recolher métricas adicionais para uma tarefa, crie e execute uma tarefa que instale automaticamente o agente de operações.
- Se ainda não o fez, ative a Monitoring API:
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
Para receber as autorizações de que precisa para ver as métricas de observabilidade, peça ao seu administrador para lhe conceder a função IAM Visualizador de métricas de monitorização (
roles/monitoring.metricViewer
) no projeto. Para mais informações sobre a atribuição de funções, consulte o artigo Faça a gestão do acesso a projetos, pastas e organizações.Também pode conseguir as autorizações necessárias através de funções personalizadas ou outras funções predefinidas.
Veja métricas para recursos de emprego
Observe e monitorize VMs na documentação do Compute Engine, que fornece informações conceptuais relevantes sobre as métricas de VMs. No entanto, são recomendados métodos diferentes para ver as métricas de VMs para tarefas do Batch. Especificamente, a documentação do Compute Engine explica como ver as métricas através dos painéis de controlo de monitorização predefinidos para o Compute Engine ou das páginas do Compute Engine na Google Cloud consola. No entanto, é importante referir que esses métodos não apresentam informações sobre VMs que foram eliminadas. Como resultado, não use esses métodos, a menos que queira apenas ver as métricas dos trabalhos em lote enquanto estão em execução.
Veja as métricas de tarefas em lote em execução e concluídas através dos gráficos do explorador de métricas, conforme explicado nesta secção. Em particular, os gráficos são temporários, a menos que os guarde em painéis de controlo personalizados.
Para criar um gráfico para ver uma ou mais métricas, faça o seguinte:
- Opcional: se planeia guardar o gráfico, identifique ou crie um painel de controlo personalizado para o gráfico.
Crie um gráfico do explorador de métricas para uma ou mais métricas.
Sem filtros, cada métrica de VM num gráfico inclui dados de todas as VMs no seu projeto. Opcionalmente, se quiser filtrar o gráfico para incluir apenas métricas de todas as tarefas em lote ou de tarefas em lote específicas, adicione o seguinte filtro:
group=RESOURCE_GROUP_NAME
Substitua
RESOURCE_GROUP_NAME
pelo nome de um grupo de recursos para tarefas em lote. Para mais informações, consulte o artigo Crie grupos de recursos para filtrar métricas neste documento.
Crie grupos de recursos para filtrar métricas
Pode usar grupos de recursos como filtros personalizáveis para gráficos do explorador de métricas. Para criar um grupo de recursos para todas ou tarefas específicas do Batch no seu projeto, faça o seguinte:
Selecione uma etiqueta para usar como os critérios de adesão com base nos trabalhos que quer incluir no grupo:
- Todos os trabalhos em lote: use a etiqueta
batch-node
predefinida, que é aplicada automaticamente a todos os recursos de todos os trabalhos em lote e tem um valor nulo. Tarefas em lote específicas: use uma etiqueta que seja aplicada aos recursos apenas para tarefas em lote específicas.
Por exemplo, se quiser criar um grupo com base em nomes de profissões completos ou parciais, use o nome da etiqueta
batch-job-id
predefinido com um valor específico. A etiquetabatch-job-id
é aplicada automaticamente a todos os recursos para todas as tarefas em lote e definida com o nome da tarefa.Em alternativa, se usar uma etiqueta personalizada, tem de aplicar a etiqueta personalizada a todos os recursos das tarefas em lote que quer incluir no grupo quando cria as tarefas.
- Todos os trabalhos em lote: use a etiqueta
Certifique-se de que o seu projeto tem, pelo menos, uma tarefa com a etiqueta selecionada e que esta tarefa está no estado
RUNNING
. Caso contrário, esta etiqueta não aparece como opção quando tenta criar o grupo de recursos.Crie um grupo de recursos. Quando especificar os critérios de registo de membros, faça o seguinte:
- Defina o Tipo como Etiqueta.
Defina o campo Etiqueta com o nome da etiqueta selecionada. Em seguida, defina os seguintes campos com base nos valores das etiquetas que quer que o grupo inclua.
Por exemplo, se quiser que este grupo inclua todas as tarefas em lote, defina Etiqueta como
batch-node
e defina Operador como Existe. Em alternativa, se quiser que este grupo inclua trabalhos em lote com nomes que comecem portest
, defina Tag comobatch-job-id
, defina Operator como Starts with e defina Value comotest
.
O que se segue?
- Saiba mais acerca das métricas de recursos de tarefas:
- Saiba mais acerca de outros métodos para monitorizar e otimizar tarefas em lote: