LaraDep dokumentace
Čtete Managed režim
Řešení problémů v managed režimu
Praktický playbook pro řešení chyb v řízeném režimu: co dělat při neúspěšném spuštění, jak držet audit trail a jak obnovit stabilitu provozu.
Řešení problémů v managed režimu
Managed režim je navržený na stabilitu, ale i zde se mohou vyskytnout chyby — špatný vstup, dočasný výpadek cílového serveru nebo nečekaný stav aplikace. Tahle stránka je vaše opora, když se run nezdařil nebo se změna chová jinak, než jste čekali.
Účel a předpoklady
- Účel: rychle stabilizovat provoz, určit příčinu a zachovat stopu pro další audit.
- Předpoklady: dokončený onboarding, přístup do historie runů, znalost odpovědnosti týmu a jasně nastavené role.
- Co potřebujete: ID runu, cílový workspace a aktuální logy.
Postup krok za krokem
- Okamžitě pozastavte další změny — v průběhu incidentu nevyvolávejte další runy do stejného targetu.
- Ověřte scope a vlastnictví runu — kdo ho spustil, na jaký workspace a jaký template stack.
- Zkontrolujte preflight a logy — chyby z preflightu většinou ukazují příčinu rychleji než runtime log.
- Vyhodnoťte impact — je služba dostupná, jsou ovlivněny jen doplňkové kroky, nebo jde o produkční regresi?
- Zvolte nápravu — oprava vstupních hodnot, opakování runu, nebo kontrolovaný rollback.
- Dokumentujte rozhodnutí — přidejte poznámku do run history, kdo rozhodl a proč.
- Upravte preventivně — doplňte missing kontrolu do onboarding checklistu a runbooku.
Kontrolní checklist
- Máte potvrzené správné run ID a cílový workspace?
- Vidíte log před i po chybě?
- Byl incident spouštěn mimo schválené okno nebo bez jasného vlastníka změny?
- Je rollback cesta dostupná a testovatelná?
- Je incident doplněný o poznámku do evidence změn?
Běžné chyby
- Spuštění následující změny bez dokončení vyšetření předešlé chyby.
- Ignorování preflight warningů „záměrně“ opakováním runu.
- Chybějící evidence v runbooku a workspace historii.
- Nejasný rozhodovací bod: kdo je za změnu odpovědný při incidentu.
Další kroky
- Pokud řešíte proces opakovaně, vylepšete jej podle provozního standardu.
- Pro standardizovanou kontrolu přidejte managed governance checklist.
- Po stabilizaci ověřte runbook a governance.
- Pro další prevenci proveďte první nasazení a produkční checklist.
- Pokud chcete porovnat přístup, projděte self-hosted režim nebo přechod režimů.
Další krok: Po řešení incidentu se vraťte na provoz a governance a ověřte runbook.