YorkHost - PVE03 Offline – Détails de l'incident

GAME-NODE-13 connaît une panne majeure

PVE03 Offline

Résolu
Panne majeure
Signalé le il y a 1 jourA duré environ 1 heure

Concernés

Infrastructure de virtualisation

Panne majeure depuis 1:46 PM à 1:48 PM, Opérationnel depuis 1:48 PM à 1:55 PM, Performances dégradées depuis 1:55 PM à 2:10 PM, Panne majeure depuis 2:10 PM à 2:40 PM

PVE 03

Panne majeure depuis 1:46 PM à 1:48 PM, Opérationnel depuis 1:48 PM à 1:55 PM, Performances dégradées depuis 1:55 PM à 2:10 PM, Panne majeure depuis 2:10 PM à 2:40 PM

Mises à jour
  • Résolu
    Résolu

    The root cause was identified as a link flap protection trigger (linkFlapErrDisabled) on interface Ethernet104/1/47 of edge1-par3-b9.
    The port has been manually re-enabled after confirming stability, and network access to PVE-03 has been restored.

    The node is now fully operational, and services are back online.
    Monitoring will continue to ensure stability following the recovery.

  • Mettre à jour
    Mettre à jour

    Le système a été réparé en mode de secours et nous tentons maintenant de le redémarrer et d'accéder à l'environnement interne Proxmox .
    Les étapes initiales de récupération ont été menées à bien et la réinitialisation du réseau est en cours.

    La surveillance se poursuivra tout au long du processus de redémarrage.
    D'autres mises à jour suivront une fois que la stabilité du nœud sera confirmée.

  • Mettre à jour
    Mettre à jour

    Notre équipe travaille actuellement en mode de secours en utilisant une image Debian pour réparer l' environnement Proxmox affecté.
    Le problème provenait d'une défaillance d'allocation de mémoire , qui a également perturbé la configuration du réseau .

    Des efforts de restauration sont en cours pour remettre le nœud en ligne en toute sécurité.
    Nous vous tiendrons informés dès que le système sera stabilisé et que l'accès au réseau sera rétabli.

  • Mettre à jour
    Mettre à jour
    We are continuing to work on a fix for this incident.
  • Mettre à jour
    Mettre à jour

    Le nœud PVE-03 a subi un plantage en raison d'une erreur d'allocation de mémoire .
    Par conséquent, le système rencontre actuellement des problèmes de récupération du réseau .

    Notre équipe technique enquête activement et travaille à rétablir la connectivité normale le plus rapidement possible.
    D'autres mises à jour seront fournies dès que des progrès seront réalisés.

    Nous vous remercions de votre patience et de votre compréhension.

  • Identifié
    Identifié
    We are continuing to work on a fix for this incident.
  • Résolu
    Résolu
    This incident has been resolved.
  • Surveillé
    Surveillé
    We implemented a fix and are currently monitoring the result.
  • Identifié
    Identifié
    Nous continuons à travailler à la résolution de cet incident.
  • Détecté
    Détecté
    We are currently investigating this incident.