Sprint Planning - Claude Code Watchdog

Project Overview

Project Name: Claude Code Watchdog Duration: 4 weeks (4 sprints) Team Size: 1-2 developers Methodology: Agile with 1-week sprints

Sprint Structure

Sprint Duration: 1 week (5 working days)
Sprint Planning: Monday morning (1 hour)
Daily Standups: 15 minutes (async via logs acceptable)
Sprint Review: Friday afternoon (1 hour)
Sprint Retrospective: Friday afternoon (30 minutes)

Sprint 1: Core Watchdog Foundation

Dates: Week 1 Goal: Build the foundational watchdog process with basic monitoring capabilities Success Criteria: Watchdog can monitor a single Claude Code session and auto-continue on TODOs

Work Items

WI-1.1: Project Structure Setup

Priority: P0 (Critical) Estimated Effort: 2 hours Assigned To: Developer Dependencies: None

Description: Create the complete directory structure and placeholder files for the project

Acceptance Criteria:

All directories created as per architecture
All PowerShell files created with function signatures
Module imports working
Basic script execution verified

Tasks:

Create src/ directory with all subdirectories
Create config/, docs/, tests/, examples/ directories
Create all .ps1 files with function signatures
Add module imports and dot-sourcing
Verify structure with test import

WI-1.2: Windows MCP Integration Wrapper

Priority: P0 (Critical) Estimated Effort: 3 hours Assigned To: Developer Dependencies: WI-1.1

Description: Create wrapper functions for Windows MCP tools (State, Click, Type, Key)

Acceptance Criteria:

Tasks:

Implement Invoke-WindowsMCPStateTool
Implement Invoke-WindowsMCPClick
Implement Invoke-WindowsMCPType
Implement Invoke-WindowsMCPKey
Add retry logic with exponential backoff
Write unit tests for each function
Test with live Claude Code session

WI-1.3: State Detection Engine

Priority: P0 (Critical) Estimated Effort: 4 hours Assigned To: Developer Dependencies: WI-1.2

Description: Implement state detection logic to classify Claude Code session states

Acceptance Criteria:

Detects all 6 states correctly (InProgress, WaitingForInput, HasTodos, PhaseComplete, Error, Idle)
Parses TODOs with count and status
Detects errors and warnings
Calculates idle time accurately
Identifies reply field coordinates
95%+ accuracy on test cases

Tasks:

Implement Get-ClaudeCodeState main function
Implement Get-SessionStatus classification logic
Implement Get-TodosFromUI parser
Implement Get-ErrorsFromUI parser
Implement Test-ProcessingIndicator
Create test fixtures with sample UI states
Run validation tests

WI-1.4: Rule-Based Decision Engine

Priority: P0 (Critical) Estimated Effort: 3 hours Assigned To: Developer Dependencies: WI-1.3

Description: Implement simple rule-based decision logic (no API yet)

Acceptance Criteria:

Returns correct action for each state
Reasoning is clear and actionable
Confidence scores appropriate
Handles edge cases gracefully
Decision logging implemented

Tasks:

Implement Invoke-SimpleDecision function
Create rule set for each state
Add confidence calculation logic
Implement decision history tracking
Add unit tests for all decision paths
Test with simulated states

WI-1.5: Command Execution Module

Priority: P0 (Critical) Estimated Effort: 4 hours Assigned To: Developer Dependencies: WI-1.2

Description: Implement command sending to Claude Code with retry and verification

Acceptance Criteria:

Commands sent successfully to Claude Code
Retry logic works (3 attempts)
Verification detects send failures
Handles UI quirks (timing, focus)
Logs all command attempts

Tasks:

Implement Send-ClaudeCodeCommand function
Add reply field detection logic
Implement click → type → enter sequence
Add verification logic
Implement retry with exponential backoff
Add comprehensive error handling
Test with live Claude Code session

WI-1.6: Project Registration System

Priority: P0 (Critical) Estimated Effort: 3 hours Assigned To: Developer Dependencies: WI-1.1

Description: Build system to register and manage multiple projects

Acceptance Criteria:

Can register new projects
Validates project configurations
Creates necessary state files
Stores registry in ~/.claude-automation/
Can list registered projects
Can pause/resume projects

Tasks:

Implement Register-Project function
Implement Test-ProjectConfiguration validation
Implement Initialize-ProjectState setup
Create Get-RegisteredProjects function
Create Update-ProjectState function
Add JSON schema validation
Test with sample project configs

WI-1.7: Main Watchdog Loop

Priority: P0 (Critical) Estimated Effort: 4 hours Assigned To: Developer Dependencies: WI-1.3, WI-1.4, WI-1.5, WI-1.6

Description: Implement the core polling loop that orchestrates all components

Acceptance Criteria:

Loop runs continuously without crashing
Processes all active projects
Respects polling interval (2 min default)
Handles errors without stopping
Stops gracefully on Ctrl+C
Updates heartbeat regularly

Tasks:

Implement Start-Watchdog main function
Implement Process-Project function
Add project iteration logic
Implement graceful shutdown handler
Add heartbeat tracking
Implement error isolation per project
Add console output with colors
Test 2+ hour continuous run

WI-1.8: Logging Infrastructure

Priority: P1 (High) Estimated Effort: 2 hours Assigned To: Developer Dependencies: WI-1.1

Description: Create comprehensive logging and notification system

Acceptance Criteria:

Tasks:

Implement Write-WatchdogLog function
Implement Add-DecisionToLog function
Implement Send-Notification function
Add BurntToast integration
Create log file rotation logic
Add timestamp formatting
Test notification delivery

WI-1.9: Installation Script

Priority: P1 (High) Estimated Effort: 2 hours Assigned To: Developer Dependencies: WI-1.1

Description: Create installation wizard for easy setup

Acceptance Criteria:

Tasks:

Create Install-Watchdog.ps1 script
Add prerequisite checks
Add module installation logic
Create directory structure
Add scheduled task creation (optional)
Add validation steps
Test on clean Windows VM

WI-1.10: Integration Testing

Priority: P1 (High) Estimated Effort: 3 hours Assigned To: Developer Dependencies: WI-1.7

Description: End-to-end testing with real Claude Code session

Acceptance Criteria:

Tasks:

Create test project with config
Register test project
Start Claude Code session
Start watchdog
Monitor for 2+ hours
Verify all states detected
Verify all commands sent
Review logs for accuracy
Document any issues
Fix critical bugs

Sprint 1 Metrics

Total Story Points: 30 Total Estimated Hours: 30 Key Deliverables:

Working watchdog process
Basic state detection
Rule-based decisions
Auto-continue functionality
Project registration
Logging system

Sprint 2: Intelligent Decision Making

Dates: Week 2 Goal: Add Claude API integration, skill-based error resolution, and cost management Success Criteria: Watchdog uses AI to make smart decisions and can invoke skills for errors

Work Items

WI-2.1: Claude API Integration

Priority: P0 (Critical) Estimated Effort: 4 hours Assigned To: Developer Dependencies: Sprint 1 Complete

Description: Integrate Anthropic Claude API for intelligent decision-making

Acceptance Criteria:

Can call Claude API successfully
API key stored securely (Windows Credential Manager)
Error handling for API failures
Retries on transient failures
Token usage tracked
Response parsed correctly

Tasks:

Implement Invoke-AnthropicAPI function
Implement Set-WatchdogAPIKey for secure storage
Implement Get-SecureAPIKey retrieval
Add request/response logging
Add retry logic with backoff
Test with various prompts
Validate JSON response parsing

WI-2.2: Advanced Decision Engine

Priority: P0 (Critical) Estimated Effort: 5 hours Assigned To: Developer Dependencies: WI-2.1

Description: Build decision engine that uses Claude API with comprehensive context

Acceptance Criteria:

Builds detailed decision prompts
Includes project config in context
Includes decision history
Parses API responses to JSON
Falls back to rules if API fails
Confidence scores reflect API confidence

Tasks:

Implement Invoke-ClaudeAPIDecision function
Implement Build-DecisionPrompt function
Add context aggregation logic
Add response validation
Implement fallback to rule-based
Add decision comparison logging
Test with various scenarios

WI-2.3: Skill-Based Error Resolution

Priority: P0 (Critical) Estimated Effort: 4 hours Assigned To: Developer Dependencies: WI-2.2

Description: Enable watchdog to invoke Claude Skills for error resolution

Acceptance Criteria:

Tasks:

Implement Find-SkillForError function
Create error-to-skill mapping logic
Implement skill command generation
Add skill invocation tracking
Test with sample skills
Document skill integration patterns

WI-2.4: Cost Tracking System

Priority: P0 (Critical) Estimated Effort: 3 hours Assigned To: Developer Dependencies: WI-2.1

Description: Track API costs and enforce budget limits

Acceptance Criteria:

Tracks token usage per call
Calculates costs based on pricing
Aggregates costs per project
Warns at 80% of daily limit
Stops API calls at 100% of limit
Generates cost reports

Tasks:

Implement Update-APICosts function
Implement Get-APICosts function
Implement Calculate-APICost function
Add cost threshold checks
Add warning/limit enforcement
Create cost report generator
Test with simulated usage

WI-2.5: Enhanced State Detection

Priority: P1 (High) Estimated Effort: 3 hours Assigned To: Developer Dependencies: Sprint 1 WI-1.3

Description: Improve state detection accuracy and add more states

Acceptance Criteria:

Detects compilation errors specifically
Detects test failures specifically
Identifies skill invocations
Parses error severity levels
Handles multi-line errors
98%+ accuracy

Tasks:

Add compilation error detection
Add test failure detection
Improve error severity classification
Add multi-line error parsing
Create additional test fixtures
Validate accuracy improvements

WI-2.6: Decision Log Enhancements

Priority: P1 (High) Estimated Effort: 2 hours Assigned To: Developer Dependencies: WI-2.2

Description: Enhance decision logs with API metadata and richer context

Acceptance Criteria:

Tasks:

Update Add-DecisionToLog function
Add API metadata fields
Add skill invocation details
Improve markdown formatting
Add decision comparison (API vs Rules)
Test log readability

WI-2.7: API Configuration Management

Priority: P2 (Medium) Estimated Effort: 2 hours Assigned To: Developer Dependencies: WI-2.1

Description: Create configuration system for API settings

Acceptance Criteria:

Tasks:

Add API settings to global config
Implement Set-APISettings function
Implement Get-APISettings function
Add validation for settings
Test configuration persistence

WI-2.8: Integration Testing

Priority: P1 (High) Estimated Effort: 3 hours Assigned To: Developer Dependencies: WI-2.2, WI-2.3, WI-2.4

Description: Test AI-powered decision making end-to-end

Acceptance Criteria:

Tasks:

Set up test project with API enabled
Create scenarios for testing
Monitor decision quality
Verify skill invocations
Check cost calculations
Test fallback scenarios
Document findings

Sprint 2 Metrics

Total Story Points: 26 Total Estimated Hours: 26 Key Deliverables:

Claude API integration
AI-powered decisions
Skill-based error resolution
Cost tracking and limits
Enhanced decision logging

Sprint 3: Multi-Project & Git Operations

Dates: Week 3 Goal: Enable concurrent project monitoring and automated Git operations Success Criteria: Watchdog manages 3+ projects simultaneously with automatic commits and PRs

Work Items

WI-3.1: Multi-Project Session Detection

Priority: P0 (Critical) Estimated Effort: 4 hours Assigned To: Developer Dependencies: Sprint 2 Complete

Description: Enable watchdog to identify and track multiple Claude Code sessions

Acceptance Criteria:

Detects all open Claude Code tabs
Maps sessions to registered projects
Handles projects without active sessions
Distinguishes between different projects
Updates session mapping dynamically

Tasks:

Implement Find-ClaudeCodeSession function
Add window title parsing
Add URL-based project identification
Create session-to-project mapping
Handle multiple browser windows
Test with 3+ concurrent sessions

WI-3.2: Concurrent Project Processing

Priority: P0 (Critical) Estimated Effort: 3 hours Assigned To: Developer Dependencies: WI-3.1

Description: Refactor main loop to process multiple projects efficiently

Acceptance Criteria:

Processes all active projects each cycle
Isolates errors per project
Maintains separate state per project
No interference between projects
Resource usage acceptable (<5% CPU)

Tasks:

Refactor Process-Project for parallel execution
Add project isolation logic
Implement error quarantine per project
Add resource monitoring
Test with 5 concurrent projects
Optimize for performance

WI-3.3: Git Integration Module

Priority: P0 (Critical) Estimated Effort: 5 hours Assigned To: Developer Dependencies: None (can start early)

Description: Create Git wrapper functions for all operations

Acceptance Criteria:

Tasks:

Implement Invoke-GitBranch function
Implement Invoke-GitCommit function
Implement Invoke-GitPush function
Implement Wait-ForGitCommit function
Add Git status checking
Add authentication handling
Test with test repository

WI-3.4: Phase Transition Logic

Priority: P0 (Critical) Estimated Effort: 4 hours Assigned To: Developer Dependencies: WI-3.3

Description: Implement phase-based workflow management

Acceptance Criteria:

Detects phase completion
Triggers commits at phase boundaries
Advances to next phase automatically
Sends notifications on transitions
Logs phase transitions
Handles final phase completion

Tasks:

Implement Invoke-PhaseTransition function
Add phase completion detection
Implement commit triggering
Add next phase initialization
Implement project completion detection
Add transition logging
Test full phase progression

WI-3.5: GitHub Pull Request Creation

Priority: P0 (Critical) Estimated Effort: 4 hours Assigned To: Developer Dependencies: WI-3.3

Description: Automate PR creation using GitHub API

Acceptance Criteria:

Tasks:

Implement New-GitHubPullRequest function
Add GitHub API integration
Implement PR title/body generation
Add authentication handling
Add error handling for API failures
Test PR creation
Verify PR formatting

WI-3.6: Session Recovery System

Priority: P1 (High) Estimated Effort: 4 hours Assigned To: Developer Dependencies: WI-3.1

Description: Enable recovery from watchdog or browser crashes

Acceptance Criteria:

Tasks:

Implement state persistence on shutdown
Implement Restore-ProjectState function
Add session loss detection
Add automatic state recovery
Implement manual recovery command
Add recovery notifications
Test crash scenarios

WI-3.7: Progress Reporting

Priority: P2 (Medium) Estimated Effort: 3 hours Assigned To: Developer Dependencies: WI-3.4

Description: Generate progress reports and summaries

Acceptance Criteria:

Tasks:

Implement Generate-ProgressReport function
Implement Generate-DailySummary function
Add time tracking logic
Create report templates
Add CSV export
Schedule daily reports

WI-3.8: Integration Testing

Priority: P1 (High) Estimated Effort: 4 hours Assigned To: Developer Dependencies: WI-3.2, WI-3.4, WI-3.5

Description: Test multi-project workflows with Git operations

Acceptance Criteria:

3+ projects monitored simultaneously
Phase transitions work correctly
Commits created at right times
PRs created successfully
Recovery works after interruption
8+ hour continuous operation

Tasks:

Set up 3 test projects
Start all projects in Claude Code
Monitor phase progressions
Verify all commits
Verify all PRs
Test recovery scenarios
Review all logs
Document issues

Sprint 3 Metrics

Total Story Points: 31 Total Estimated Hours: 31 Key Deliverables:

Multi-project monitoring
Git operations (commit, push, PR)
Phase-based workflows
Session recovery
Progress reporting

Sprint 4: Polish, Testing & Documentation

Dates: Week 4 Goal: Production-ready system with comprehensive testing and documentation Success Criteria: System can be deployed by any user and runs reliably for days

Work Items

WI-4.1: Comprehensive Error Handling

Priority: P0 (Critical) Estimated Effort: 4 hours Assigned To: Developer Dependencies: Sprint 3 Complete

Description: Add robust error handling across all modules

Acceptance Criteria:

All functions have try/catch blocks
Meaningful error messages
Errors logged appropriately
Graceful degradation on failures
No unhandled exceptions
Recovery attempts before failing

Tasks:

Audit all functions for error handling
Add try/catch to all external calls
Improve error messages
Add error recovery logic
Test failure scenarios
Document error behaviors

WI-4.2: Unit Test Suite

Priority: P0 (Critical) Estimated Effort: 6 hours Assigned To: Developer Dependencies: None (can start early)

Description: Create comprehensive unit tests using Pester

Acceptance Criteria:

Tasks:

Set up Pester test framework
Create test fixtures
Write tests for state detection
Write tests for decision engine
Write tests for Git operations
Write tests for logging
Set up test runner
Achieve 80% coverage

WI-4.3: Integration Test Suite

Priority: P1 (High) Estimated Effort: 4 hours Assigned To: Developer Dependencies: WI-4.2

Description: Create end-to-end integration tests

Acceptance Criteria:

Tasks:

Create test project repository
Write full workflow tests
Write multi-project tests
Write recovery tests
Write Git operation tests
Automate test execution
Document test procedures

WI-4.4: Performance Optimization

Priority: P1 (High) Estimated Effort: 3 hours Assigned To: Developer Dependencies: Sprint 3 Complete

Description: Optimize for resource usage and responsiveness

Acceptance Criteria:

Tasks:

Profile resource usage
Optimize state detection
Add caching where appropriate
Optimize logging I/O
Add resource monitoring
Load test with 10 projects
Document performance metrics

WI-4.5: User Documentation

Priority: P0 (Critical) Estimated Effort: 4 hours Assigned To: Developer Dependencies: All features complete

Description: Create comprehensive user-facing documentation

Acceptance Criteria:

Tasks:

Update README.md
Create QUICKSTART.md
Create CONFIGURATION.md
Add usage examples
Add troubleshooting section
Capture screenshots
Review for clarity

WI-4.6: Developer Documentation

Priority: P1 (High) Estimated Effort: 3 hours Assigned To: Developer Dependencies: All features complete

Description: Document architecture and development guidelines

Acceptance Criteria:

Tasks:

Finalize ARCHITECTURE.md
Create API-REFERENCE.md
Create DEVELOPMENT.md
Create CONTRIBUTING.md
Add code comments
Generate module diagrams

WI-4.7: Troubleshooting Guide

Priority: P1 (High) Estimated Effort: 2 hours Assigned To: Developer Dependencies: Testing complete

Description: Document common issues and solutions

Acceptance Criteria:

Tasks:

Create TROUBLESHOOTING.md
Document common issues
Add diagnostic procedures
Create FAQ section
Add support contact info
Test solutions work

WI-4.8: Installation Wizard Enhancement

Priority: P2 (Medium) Estimated Effort: 3 hours Assigned To: Developer Dependencies: WI-4.5

Description: Improve installation script with better UX

Acceptance Criteria:

Tasks:

Add interactive prompts
Add module auto-installation
Add configuration wizard
Add validation checks
Add rollback logic
Test on clean system

WI-4.9: Production Deployment Testing

Priority: P0 (Critical) Estimated Effort: 4 hours Assigned To: Developer Dependencies: All WI-4.x items

Description: Deploy and test in production-like environment

Acceptance Criteria:

Tasks:

Set up clean Windows VM
Run installation wizard
Configure 3 real projects
Start watchdog
Monitor for 24+ hours
Collect metrics
Review all logs
Fix any critical issues
Validate success criteria

WI-4.10: Release Preparation

Priority: P0 (Critical) Estimated Effort: 2 hours Assigned To: Developer Dependencies: WI-4.9

Description: Prepare for v1.0 release

Acceptance Criteria:

Tasks:

Update version numbers
Create CHANGELOG.md
Write release notes
Create GitHub release
Package installation files
Add LICENSE file
Tag release in Git

Sprint 4 Metrics

Total Story Points: 35 Total Estimated Hours: 35 Key Deliverables:

Comprehensive testing (unit + integration)
Complete documentation
Performance optimization
Production-ready deployment
v1.0 release

Project Summary

Total Effort

Total Story Points: 122
Total Estimated Hours: 122 hours
Sprints: 4
Work Items: 38

Risk Mitigation

High Risk Items:

Windows MCP reliability - Mitigation: Extensive error handling and retry logic
API cost overruns - Mitigation: Strict cost limits and fallback to rules
Session detection accuracy - Mitigation: Comprehensive testing and refinement
Multi-project interference - Mitigation: Strong isolation and separate state

Success Metrics

Can monitor 5+ projects simultaneously
95%+ state detection accuracy
Auto-continues on TODOs with 90%+ success rate
Stays under $10/day API costs
Runs 24+ hours without crashes
Complete documentation
80%+ code coverage

Definition of Done

A work item is "Done" when:

Sprint Schedule

Sprint	Dates	Focus	Key Deliverable
Sprint 1	Week 1	Foundation	Basic watchdog working
Sprint 2	Week 2	Intelligence	AI-powered decisions
Sprint 3	Week 3	Scale	Multi-project + Git
Sprint 4	Week 4	Polish	Production-ready

Notes for Developers

Daily Workflow

Review previous day's progress
Update TODO list
Work on highest priority item
Test incrementally
Commit frequently
Update documentation
End-of-day status update

Code Standards

Follow PowerShell best practices
Use approved verbs (Get-, Set-, Invoke-, etc.)
Comment complex logic
Write tests for all functions
Keep functions focused (single responsibility)
Handle errors gracefully

Communication

Daily standup notes in logs
Blockers reported immediately
Questions documented and answered
Decisions logged with reasoning

Created: 2024-11-22 Last Updated: 2024-11-22 Version: 1.0

FilesExpand file tree

SPRINT-PLANNING.md

Latest commit

History

SPRINT-PLANNING.md

File metadata and controls

Sprint Planning - Claude Code Watchdog

Project Overview

Sprint Structure

Sprint 1: Core Watchdog Foundation

Work Items

WI-1.1: Project Structure Setup

WI-1.2: Windows MCP Integration Wrapper

WI-1.3: State Detection Engine

WI-1.4: Rule-Based Decision Engine

WI-1.5: Command Execution Module

WI-1.6: Project Registration System

WI-1.7: Main Watchdog Loop

WI-1.8: Logging Infrastructure

WI-1.9: Installation Script

WI-1.10: Integration Testing

Sprint 1 Metrics

Sprint 2: Intelligent Decision Making

Work Items

WI-2.1: Claude API Integration

WI-2.2: Advanced Decision Engine

WI-2.3: Skill-Based Error Resolution

WI-2.4: Cost Tracking System

WI-2.5: Enhanced State Detection

WI-2.6: Decision Log Enhancements

WI-2.7: API Configuration Management

WI-2.8: Integration Testing

Sprint 2 Metrics

Sprint 3: Multi-Project & Git Operations

Work Items

WI-3.1: Multi-Project Session Detection

WI-3.2: Concurrent Project Processing

WI-3.3: Git Integration Module

WI-3.4: Phase Transition Logic

WI-3.5: GitHub Pull Request Creation

WI-3.6: Session Recovery System

WI-3.7: Progress Reporting

WI-3.8: Integration Testing

Sprint 3 Metrics

Sprint 4: Polish, Testing & Documentation

Work Items

WI-4.1: Comprehensive Error Handling

WI-4.2: Unit Test Suite

WI-4.3: Integration Test Suite

WI-4.4: Performance Optimization

WI-4.5: User Documentation

WI-4.6: Developer Documentation

WI-4.7: Troubleshooting Guide

WI-4.8: Installation Wizard Enhancement

WI-4.9: Production Deployment Testing

WI-4.10: Release Preparation

Sprint 4 Metrics

Project Summary

Total Effort

Risk Mitigation

Success Metrics

Definition of Done

Sprint Schedule

Notes for Developers

Daily Workflow

Code Standards

Communication