배경
2026-04-24 외부 프로젝트(meshcore_db) 세션 사후 분석에서 Nova 룰 우회 문제가 보고됨.
한 세션에서 --emergency 4회, Plan 미수립, Evaluator 1회만 실행.
결과적으로 사전 예방되지 못한 실수 4건:
docs/schema/auto/*.md가 Staging 기준임을 독자가 모르고 PROD 복제 설계에 사용 → 재작업
pg_dump 결과 sed 's/public\./gis./g' 전역 치환이 PostGIS 타입 참조까지 변경 → 3 테이블 DDL 실패
- VPC peering 유무·NAT 확인 없이 FDW 설계 → Phase 전면 블록
restart_mkdocs.sh 실행만으로 DataLab 반영된다고 가정(실제로는 React SPA 별도 배포) → 사용자 사이트 404
외부 진단 (원본)
Agent 회피의 구조적 원인으로 6가지 제시:
| 원인 |
현상 |
Agent가 회피하는 이유 |
| 탐색적 대화 모드 부재 |
Plan은 "결정 확정" 전제, 실제 세션은 결정 변화 빈번 |
Plan 유지 비용 → 절차 건너뛰는 게 rational |
| Hard Gate 획일성 |
문서 전용 변경에도 Evaluator PASS 강제 |
정상 우회 경로 없음 → --emergency 남용 |
| 파일 수 기준 경직성 |
3파일+ = 무조건 Plan (md/py 동일 취급) |
리스크 낮은 변경에도 Plan 부담 |
--emergency 이분법 |
정상/긴급 둘뿐 |
"편의 우회"로 변질, 남용 감지 불가 |
| 사전 실측 강제 없음 |
"RDS 생성" 등 키워드 감지 시 자동 체크리스트 없음 |
docs만 믿고 설계 진행 |
| 배포 경로 신뢰 부재 |
구버전 스크립트와 새 배포 경로 공존 |
파일명으로 임의 판단 |
제안된 개선 (원본 P0~P2)
- P0.1
/nova:explore 탐색 모드 신설
- P0.2 커밋 파일 셋 분류 기반 차등 Hard Gate (docs-only / full / infra)
- P0.3
--emergency 4분화 + 사용 이력 추적
- P1.4 복잡도 점수 자동 계산 (비가역 +3, DB +1, 외부 연결 +2, UI +1)
- P1.5 키워드 기반 사전 실측 체크리스트 (새 RDS/FDW/peering/DNS/스키마 복제)
- P1.6 배포 경로 단일 진입점 강제 + 구식 스크립트 경고
- P2.7 Incidents DB (
docs/nova-incidents/{YYYY-MM-DD}-{slug}.md)
- P2.8 대화 중 미니 Plan 자동 제안
내부 토론에서 나온 관점 (가정/추론 단계)
1. /nova:explore 신설은 과한 것일 수 있음
- 기본 Claude Code 대화 자체가 이미 탐색
- 별도 커맨드 신설 시 "탐색인지 아닌지" 선언 부담 추가
- 진짜 문제는 탐색 → 구현 전환 타이밍이 아닌가 (P2.8 "미니 Plan 자동 제안"과 같은 메커니즘)
2. "탐색 품질" 자체가 근본 문제일 가능성
사용자 의견: "이번 문제(DB 타입 불일치 등)는 탐색을 제대로 못한 것 아닌가"
- 실수 4건 공통 패턴: "확인 가능한 것을 확인하지 않고 진행"
- 전부 1~3개 tool call이면 검증 가능했던 사안
- 토큰/모델 한계보단 탐색 방법론 부재로 보임
3. 가정 레지스터 아이디어 (미검증)
탐색 중 Agent가 사용하는 가정을 명시적으로 추적, 비가역 작업 전 미검증 가정 차단하는 방식 — 내부 토론 중 떠올랐으나 검증 전.
레퍼런스 조사 (현역 오픈소스/표준, 2025~2026)
같은 문제를 다루는 기존 패턴:
업계 합의
- 이번 실수는 모델 한계 아님. 실측 명령 몇 줄이면 해결됐을 사안.
- Cline, Anthropic, Addy Osmani 모두 "AI는 pair programmer, autonomous judgment 아님" 명시.
- 탐색을 격리·강제하는 구조가 해법이라는 합의.
현재 상태
모든 제안이 아직 가정/추론 단계. 구현 전 추가 검증 필요:
다음 단계 후보 (결정 안 됨)
- 최소 실험: P0.2 차등 게이트만 먼저 1~2주 운영, 효과 측정 후 확장
- 전체 P0 묶음: explore + 차등 게이트 + emergency 4분화 한 릴리스
- 레퍼런스 흡수 우선: Cline Plan/Act, systematic-debugging 패턴을 Nova 스킬로 먼저 채택
/nova:evolve 사이클: 본 이슈를 근거로 Plan → Design → 구현 사이클에 태움
참고
- 외부 진단 출처: meshcore_db 프로젝트 (2026-04-24 세션)
- 토론 맥락: Opus 4.7 세션 (2026-04-24)
배경
2026-04-24 외부 프로젝트(meshcore_db) 세션 사후 분석에서 Nova 룰 우회 문제가 보고됨.
한 세션에서
--emergency4회, Plan 미수립, Evaluator 1회만 실행.결과적으로 사전 예방되지 못한 실수 4건:
docs/schema/auto/*.md가 Staging 기준임을 독자가 모르고 PROD 복제 설계에 사용 → 재작업pg_dump결과sed 's/public\./gis./g'전역 치환이 PostGIS 타입 참조까지 변경 → 3 테이블 DDL 실패restart_mkdocs.sh실행만으로 DataLab 반영된다고 가정(실제로는 React SPA 별도 배포) → 사용자 사이트 404외부 진단 (원본)
Agent 회피의 구조적 원인으로 6가지 제시:
--emergency남용--emergency이분법제안된 개선 (원본 P0~P2)
/nova:explore탐색 모드 신설--emergency4분화 + 사용 이력 추적docs/nova-incidents/{YYYY-MM-DD}-{slug}.md)내부 토론에서 나온 관점 (가정/추론 단계)
1.
/nova:explore신설은 과한 것일 수 있음2. "탐색 품질" 자체가 근본 문제일 가능성
사용자 의견: "이번 문제(DB 타입 불일치 등)는 탐색을 제대로 못한 것 아닌가"
3. 가정 레지스터 아이디어 (미검증)
탐색 중 Agent가 사용하는 가정을 명시적으로 추적, 비가역 작업 전 미검증 가정 차단하는 방식 — 내부 토론 중 떠올랐으나 검증 전.
레퍼런스 조사 (현역 오픈소스/표준, 2025~2026)
같은 문제를 다루는 기존 패턴:
업계 합의
현재 상태
모든 제안이 아직 가정/추론 단계. 구현 전 추가 검증 필요:
--emergency5→1회 등)이 Nova 텔레메트리로 검증 가능한가/nova:plan활성 시 read-only 강제로 실제 구현 가능한가다음 단계 후보 (결정 안 됨)
/nova:evolve사이클: 본 이슈를 근거로 Plan → Design → 구현 사이클에 태움참고