Este documento oferece uma vista geral do Personalized Service Health, que lhe permite identificar interrupções de serviço relevantes para os seus projetos, para que possa geri-las e responder-lhes de forma eficiente. Google Cloud Estas interrupções são denominadas eventos de estado de funcionamento do serviço e estão disponíveis na Google Cloud consola e em vários pontos de integração.
Como funciona o Personalized Service Health
O diagrama seguinte mostra como o Personalized Service Health disponibiliza eventos de estado de funcionamento do serviço.
Pode aceder a eventos de estado de funcionamento do serviço com o seguinte:
- Painel de controlo do estado do serviço: monitorize Google Cloud incidentes emergentes e ativos relevantes para os seus projetos.
- API Service Health: obtenha informações de eventos de estado de funcionamento do serviço por projeto ou organização.
- Alertas: receba notificações de eventos relevantes para os seus projetos. Os alertas baseiam-se em registos no Cloud Logging.
- Registos: exporte registos relacionados com Google Cloud eventos.
Veja incidentes Google Cloud ativos e anteriores no painel de controlo de estado do serviço
O painel de controlo do estado do serviço na Google Cloud consola mostra incidentes relevantes para o seu projeto, o respetivo estado e os Google Cloud produtos e localizações afetados.
Consulte o início rápido para saber como aceder ao painel de controlo do Service Health.
Veja Google Cloud incidentes e receba alertas num dispositivo móvel
O painel de controlo do estado do serviço também está disponível num dispositivo móvel.
Para receber alertas no seu dispositivo móvel, pode configurar uma política de alertas para enviar alertas para o seu dispositivo móvel.
Peça eventos do Service Health através da API Service Health
A API Service Health permite-lhe obter eventos de estado de saúde do serviço que podem estar a afetar ou afetaram o seu projeto, ou obter detalhes de eventos, como atualizações, horas de início e fim, produtos e localizações afetados, e estado. Google Cloud
Consulte a referência da API Service Health para mais informações.
Configure alertas ou exporte registos através do Cloud Logging
O Personalized Service Health regista eventos de estado de funcionamento do serviço no Cloud Logging e permite-lhe configurar alertas com base nestes registos. Pode configurar alertas para condições como quando são comunicados novos incidentes, quando os incidentes existentes são atualizados ou quando são criados ou atualizados incidentes para Google Cloud produtos ou localizações específicos.
Consulte o início rápido para configurar um alerta no painel de controlo do Service Health.
Veja Google Cloud incidentes das suas aplicações
Se gerir Google Cloud recursos através do App Hub, o Cloud Hub permite-lhe ver Google Cloud incidentes para as suas aplicações. Esta funcionalidade suporta incidentes que cumprem ambas as seguintes condições:
- Relacionado com produtos que suportam o App Hub e o Gemini Cloud Assist.
- Ter relevância relacionada.
Se não tiver uma aplicação configurada, faça o seguinte para apresentar incidentes no Cloud Hub:
- Configure uma pasta para a gestão de aplicações.
- Configure o App Hub e crie uma aplicação.
- Se necessário, certifique-se de que tem as seguintes autorizações:
servicehealth.events.list
apphub.applications.get
na aplicação específicaapphub.applications.list
- Se necessário, ative a API App Hub.
Conceitos
O Personalized Service Health usa os seguintes conceitos para denotar eventos que afetam o seu projeto e como estes eventos estão ligados ao seu projeto.
Evento de qualidade do serviço
Um evento de estado de funcionamento do serviço (v1,v1beta) é qualquer evento disruptivo que afete um Google Cloud produto que seja relevante para os seus projetos ou recursos. Alguns exemplos incluem falhas de rede, erros de configuração e problemas de desempenho.
Cada evento contém detalhes sobre o impacto geral do evento, atualizações da Google e informações específicas do seu Google Cloud projeto.
Incidente
Incidentes emergentes e ativos Google Cloud interrupções de serviço ou degradações relevantes para os seus projetos. É uma categoria de um evento de estado de funcionamento do serviço.
Um incidente inclui o seguinte:
- Impacto do incidente: detalhes do âmbito do evento, como produtos e localizações afetados.Google Cloud
- Atualizações de Google Cloud: atualizações periódicas do apoio técnico do Google Cloud .
- Relevância personalizada: relevância do incidente para o seu Google Cloud projeto.
- Sintomas, soluções alternativas e prazos de execução estimados: informações para ajudar a avaliar o impacto, aplicar uma solução alternativa ou saber mais sobre a causa principal.
Um incidente pode ter um relatório de incidente, que inclui os fatores que contribuíram para o incidente e os passos Google Cloud que planeia tomar para evitar a recorrência de incidentes semelhantes. Os relatórios de incidentes estão disponíveis para incidentes que cumprem as seguintes condições:
- O incidente tem um impacto global ou está a afetar uma percentagem significativa de projetos de clientes numa ou mais regiões.
- Um ou mais produtos estão indisponíveis ou com um desempenho muito degradado.
Estados dos eventos e estados detalhados
Um evento tem dois campos que indicam o respetivo estado. Os valores destes campos mudam à medida que o evento evolui.
Estado do evento: indica o estado geral do evento. Pode ser uma das seguintes opções:
- Ativa: o evento está a afetar ativamente Google Cloud e vai continuar a receber atualizações.
- Fechado: o evento já não afeta nenhum Google Cloud produto ou foi unido a outro evento.
Estado detalhado: fornece mais informações sobre o estado do evento. Aplica-se apenas a incidentes e pode ter um dos seguintes valores, dependendo do estado do evento:
Emergente: os engenheiros da Google estão a investigar ativamente o incidente para determinar o impacto. Um incidente emergente torna-se um incidente confirmado ou resolvido assim que a avaliação do impacto estiver concluída. Um incidente ativo pode ser um incidente emergente.
O apoio técnico para incidentes emergentes está disponível apenas para produtos de Google Cloud trabalhar em rede.
Confirmado: o incidente foi confirmado pelos engenheiros da Google e está a afetar, pelo menos, um Google Cloud produto. Vamos fornecer atualizações contínuas do estado até que o problema seja resolvido.
Um incidente ativo pode ser um incidente confirmado.
Unido: o incidente foi unido a um incidente principal. Todas as atualizações adicionais são publicadas apenas no publicador principal.
Resolvido: o incidente já não afeta nenhum Google Cloud produto após a ação tomada. Não vão ser disponibilizadas mais atualizações.
Normalmente, um incidente encerrado é um incidente resolvido.
Falso positivo: após investigação, os engenheiros da Google concluíram que o incidente não está a afetar um Google Cloud produto. Este estado pode mudar se o incidente for revisto novamente.
Encerrado automaticamente: o incidente foi encerrado automaticamente pelos seguintes motivos:
- Não foi possível confirmar o impacto do incidente.
- O incidente foi intermitente ou resolveu-se sozinho.
O incidente não tem uma resolução porque não foi realizada nenhuma ação nem investigação. Se for intermitente, o incidente pode ser reaberto.
Relevância
O Personalized Service Health avalia o impacto de todos os incidentes no seu projeto. Se o impacto do incidente no seu projeto for possível ou confirmado, fica disponível no painel de controlo e na API Service Health.
A relevância descreve o impacto de um incidente no seu projeto. A relevância pode mudar à medida que o incidente progride.
A relevância pode ter os seguintes valores:
- Afetado: o incidente foi validado como estando a afetar o seu projeto. Disponível apenas para alguns Google Cloud produtos.
- Relacionado: o incidente tem uma ligação direta com o seu projeto e afeta um Google Cloud produto numa localização que o seu projeto usa.
- Parcialmente relacionado: o incidente está associado a um Google Cloudproduto que o seu projeto usa, mas o incidente pode não estar a afetar o seu projeto. Por exemplo, o incidente pode estar a afetar um Google Cloud produto que o seu projeto usa, mas numa localização que o seu projeto não usa.
- Não afetado: o incidente não está a afetar o seu projeto.
- Desconhecido: o impacto no seu projeto é desconhecido neste momento.