Temporal workflow가 느려진 날: history를 자르는 기준은 continue-as-new였다 2026년 5월 3일·8 분 장기 실행 정산 workflow에서 event history가 커지며 replay p99가 튄 사고를 바탕으로 continue-as-new, child workflow, signal 예산을 어디서 나눌지 정리한다.
플러그인을 WASI로 격리했는데도 장애가 난 이유: host contract를 먼저 고쳐야 했다 2026년 5월 2일·5 분 사내 배포 플러그인을 WASI sandbox로 옮긴 뒤에도 CPU 고갈과 권한 누수가 남았던 이유를 host contract, capability, timeout 예산 관점에서 정리한다.
CI remote cache가 빨라질수록 위험해진다: poisoning을 막는 경계 2026년 5월 2일·8 분 모노레포 CI에서 remote cache hit rate를 올렸더니 테스트는 빨라졌지만 잘못된 산출물이 배포 후보까지 올라왔다. cache key, trust boundary, 승격 규칙을 다시 설계한 기록이다.
RAG 검색 품질이 갑자기 흔들린 날: embedding cache를 언제 무효화할 것인가 2026년 5월 1일·6 분 RAG 비용을 줄이려고 embedding cache를 강하게 잡았다가 문서 변경과 reranker 교체가 겹치며 검색 품질이 흔들렸다. 캐시 hit ratio가 아니라 recall 예산으로 무효화 기준을 다시 세운 과정을 정리한다.
계약 테스트가 있어도 깨졌다: API schema rollout에서 consumer drift를 줄인 방법 2026년 5월 1일·7 분 OpenAPI와 Pact 테스트를 모두 통과한 결제 API 변경이 일부 consumer에서만 실패했다. 스키마 검증을 배포 게이트가 아니라 consumer drift를 줄이는 운영 계약으로 바꾼 과정을 정리한다.
바퀴벌레는 왜 어둡고 습한 곳으로 숨어들까 2026년 4월 29일·4 분 바퀴벌레가 어둡고 습한 공간을 찾는 이유를 생존 전략, 수분·온도 조건, 집 안 관리 방법으로 나눠 설명한다.
앵무새도 외로움을 탄다: 사회성이 강한 새를 혼자 둘 때 생기는 일 2026년 4월 29일·4 분 앵무새가 외로움을 타는지 묻는 질문에 대해, 야생에서의 사회성·반려조의 격리 스트레스·집에서 줄 수 있는 환경 설계를 중심으로 정리한다.
KEDA를 붙였는데 queue lag가 더 커진 이유 2026년 4월 29일·5 분 KEDA와 HPA로 큐 워커를 자동 확장했지만 lag가 더 커진 실패를 바탕으로, 큐 길이보다 drain 시간·동시성·스케일다운 안정화 계약을 먼저 잡아야 하는 이유를 정리한다.
Feature flag는 if문이 아니다: stale SDK cache가 배포 중지를 늦춘 이유 2026년 4월 29일·8 분 결제 경로 canary를 feature flag로 열었다가 SDK cache, fallback 값, kill-switch 소유권이 맞물려 rollback이 늦어진 사례를 바탕으로 flag 운영 경계를 정리한다.