smugVision Image Processor

The ImageProcessor is the core orchestration module that ties together all smugVision components to automatically generate and update metadata for SmugMug photos.

Overview

The processor handles the complete pipeline:

Download - Fetches images from SmugMug to local cache
Extract - Pulls EXIF data (GPS, date, camera info)
Detect - Identifies faces using face recognition
Analyze - Generates captions and tags using AI vision model
Format - Combines AI output with EXIF data and person names
Update - Pushes metadata back to SmugMug
Mark - Adds marker tag to track processed images

Quick Start

Test the Processor

# Process an album (dry run first to preview)
python test_processor.py b38H7c --dry-run

# Actually process the album
python test_processor.py b38H7c

# Force reprocess already-tagged images
python test_processor.py b38H7c --force-reprocess

# Verbose output
python test_processor.py b38H7c --verbose

Use in Code

from smugvision.config import ConfigManager
from smugvision.processing import ImageProcessor

# Load config
config = ConfigManager.load()

# Create processor
processor = ImageProcessor(
    config=config,
    dry_run=False  # Set True to preview without updating
)

# Process entire album
stats = processor.process_album(
    album_key="b38H7c",
    force_reprocess=False,
    skip_videos=True
)

# Check results
print(f"Processed: {stats.processed}")
print(f"Skipped: {stats.skipped}")
print(f"Errors: {stats.errors}")

Architecture

ImageProcessor Class

The main orchestrator that coordinates all components:

ImageProcessor(
    config: ConfigManager,           # Configuration
    smugmug_client: SmugMugClient,  # Optional: SmugMug API
    vision_model: VisionModel,       # Optional: AI vision model
    cache_manager: CacheManager,     # Optional: Image cache
    face_recognizer: FaceRecognizer, # Optional: Face detection
    dry_run: bool = False           # Preview mode
)

Key Methods:

process_album(album_key, force_reprocess, skip_videos) - Process all images in album
process_image(image, album, force_reprocess) - Process single image

MetadataFormatter Class

Handles metadata formatting and combination:

MetadataFormatter(
    preserve_existing: bool = True,  # Keep existing captions/tags
    marker_tag: str = "smugvision"   # Processing marker
)

Key Methods:

format_caption(ai_caption, existing_caption, location, person_names) - Combine caption sources
format_tags(ai_tags, existing_tags, person_names, location_tags) - Merge tags
create_update_payload(caption, tags, title) - Create SmugMug API payload

Processing Pipeline

Step-by-Step Flow

For each image in album:
  │
  ├─ Check marker tag
  │  └─ Skip if already processed (unless force_reprocess)
  │
  ├─ Download to cache
  │  └─ Skip if already cached
  │
  ├─ Extract EXIF data
  │  ├─ GPS coordinates → reverse geocode to location
  │  ├─ Camera info
  │  └─ Date/time
  │
  ├─ Detect faces
  │  ├─ Find faces in image
  │  ├─ Match against reference faces
  │  └─ Get person names with confidence
  │
  ├─ Build enhanced prompts
  │  ├─ Add location context
  │  ├─ Add person names
  │  └─ Add date/time
  │
  ├─ Generate AI metadata
  │  ├─ Caption (1-2 sentences)
  │  └─ Tags (5-10 keywords)
  │
  ├─ Format metadata
  │  ├─ Merge AI caption with location + person names
  │  ├─ Combine tags from AI, faces, and location
  │  └─ Add marker tag
  │
  └─ Update SmugMug
     ├─ PATCH image metadata
     └─ Log results

Example Output

Processing album: 2025:03:26 Grand Finale Cleaning House (16 items)
Skipping 1 video file(s)

[1/15] Processing: IMG_9887.JPG
  Identified: Alice, Bob
  Result: ✓ Success (12.3s)

[2/15] Processing: IMG_9888.JPG
  Result: ○ Skipped (already processed)

...

Processing Complete:
  Total images:    15
  Processed:       12
  Skipped:         2
  Errors:          1
  Total time:      145.6s
  Avg time/image:  9.7s

Configuration

Required Settings

# SmugMug credentials
smugmug:
  api_key: "YOUR_KEY"
  api_secret: "YOUR_SECRET"
  user_token: "YOUR_TOKEN"
  user_secret: "YOUR_SECRET"

# Vision model
vision:
  model: "llama3.2-vision"
  endpoint: "http://localhost:11434"

# Processing options
processing:
  marker_tag: "smugvision"        # Tag for processed images
  generate_captions: true         # Enable captions
  generate_tags: true             # Enable tags
  preserve_existing: true         # Keep existing metadata
  image_size: "Medium"            # Download size

# Prompts
prompts:
  caption: "Analyze this image and provide a concise caption..."
  tags: "Generate 5-10 relevant keyword tags..."

Optional Settings

# Face recognition
face_recognition:
  enabled: true
  reference_faces_dir: "~/.smugvision/reference_faces"
  min_confidence: 0.25

# Cache
cache:
  directory: "~/.smugvision/cache"
  preserve_structure: true

# EXIF/Geocoding
exif:
  enable_geocoding: true
  reverse_geocoding:
    provider: "nominatim"

Data Models

ProcessingResult

Result of processing a single image:

@dataclass
class ProcessingResult:
    image_key: str              # SmugMug image key
    filename: str               # Image filename
    success: bool               # Processing succeeded
    skipped: bool              # Already processed
    caption_generated: bool    # Caption was created
    tags_generated: int        # Number of tags created
    faces_detected: int        # Number of faces found
    processing_time: float     # Seconds taken
    error: Optional[str]       # Error message if failed

BatchProcessingStats

Statistics for album processing:

@dataclass
class BatchProcessingStats:
    total_images: int          # Total in album
    processed: int             # Successfully processed
    skipped: int               # Skipped (already done)
    errors: int                # Failed
    total_time: float          # Total seconds
    results: List[ProcessingResult]  # Individual results

Error Handling

Strategy

The processor uses continue-on-error by default:

Individual image failures don't stop album processing
All errors are logged with full context
Statistics track success/skip/error counts
Failed images can be retried with --force-reprocess

Common Errors

SmugMugError: API access issues

try:
    stats = processor.process_album(album_key)
except SmugMugError as e:
    logger.error(f"SmugMug API error: {e}")

Vision Model Timeout: AI model not responding

# Check Ollama is running:
ollama serve
ollama pull llama3.2-vision

Face Recognition Error: Reference faces not found

# Check reference faces directory:
ls ~/.smugvision/reference_faces/

Performance

Typical Processing Times

Image download: 0.5-2s (depends on size and network)
EXIF extraction: 0.1-0.3s
Face detection: 1-3s (if enabled)
AI caption/tags: 5-15s (depends on model and hardware)
SmugMug update: 0.2-0.5s

Total per image: ~8-20 seconds

Optimization Tips

Use cached images: Skip re-downloading with cache.preserve_structure: true
Medium size images: Balance quality vs speed (image_size: "Medium")
Disable face recognition: If not needed, saves 1-3s per image
Batch processing: Process albums in off-peak hours
Local AI model: Llama 3.2 Vision is faster than cloud APIs

Advanced Usage

Custom Vision Model

from smugvision.vision import VisionModelFactory

# Use different model
vision = VisionModelFactory.create_model(
    model_name="gpt-4o",  # Or other supported model
    config=config
)

processor = ImageProcessor(
    config=config,
    vision_model=vision
)

Process Specific Images

# Get album images
images = smugmug_client.get_album_images(album_key)

# Filter specific images
selected = [img for img in images if "2025" in img.file_name]

# Process individually
for image in selected:
    result = processor.process_image(
        image=image,
        album=album,
        force_reprocess=True
    )

Custom Metadata Formatting

from smugvision.processing import MetadataFormatter

# Create custom formatter
formatter = MetadataFormatter(
    preserve_existing=False,  # Replace existing metadata
    marker_tag="my-custom-tag"
)

# Format manually
caption = formatter.format_caption(
    ai_caption="A beautiful sunset",
    location="Golden Gate Bridge, San Francisco",
    person_names=["Alice", "Bob"]
)
# Result: "A beautiful sunset. Featuring Alice and Bob at Golden Gate Bridge, San Francisco."

Testing

Unit Tests (TODO)

pytest tests/test_processor.py
pytest tests/test_metadata.py

Integration Test

# Test with small album first
python test_processor.py TEST_ALBUM --dry-run --verbose

# Then process for real
python test_processor.py TEST_ALBUM

Troubleshooting

"No images to process"

Check album key is correct
Verify album has images (not just videos)
Check skip_videos setting

"Authentication failed"

Verify SmugMug credentials in config.yaml
Check token hasn't expired
Run python get_smugmug_tokens.py to refresh

"Vision model timeout"

Ensure Ollama is running: ollama serve
Check model is downloaded: ollama list
Try smaller/faster model if M4 Pro struggles

"All images skipped"

Images already have marker tag
Use --force-reprocess to process again
Or change marker_tag in config

Next Steps

Add parallel processing for faster throughput
Implement resume capability for interrupted processing
Add progress bar with ETA
Support folder-level recursive processing
Add metadata backup before updates
Create rollback functionality

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

smugVision Image Processor

Overview

Quick Start

Test the Processor

Use in Code

Architecture

ImageProcessor Class

MetadataFormatter Class

Processing Pipeline

Step-by-Step Flow

Example Output

Configuration

Required Settings

Optional Settings

Data Models

ProcessingResult

BatchProcessingStats

Error Handling

Strategy

Common Errors

Performance

Typical Processing Times

Optimization Tips

Advanced Usage

Custom Vision Model

Process Specific Images

Custom Metadata Formatting

Testing

Unit Tests (TODO)

Integration Test

Troubleshooting

"No images to process"

"Authentication failed"

"Vision model timeout"

"All images skipped"

Next Steps

See Also

FilesExpand file tree

README_PROCESSOR.md

Latest commit

History

README_PROCESSOR.md

File metadata and controls

smugVision Image Processor

Overview

Quick Start

Test the Processor

Use in Code

Architecture

ImageProcessor Class

MetadataFormatter Class

Processing Pipeline

Step-by-Step Flow

Example Output

Configuration

Required Settings

Optional Settings

Data Models

ProcessingResult

BatchProcessingStats

Error Handling

Strategy

Common Errors

Performance

Typical Processing Times

Optimization Tips

Advanced Usage

Custom Vision Model

Process Specific Images

Custom Metadata Formatting

Testing

Unit Tests (TODO)

Integration Test

Troubleshooting

"No images to process"

"Authentication failed"

"Vision model timeout"

"All images skipped"

Next Steps

See Also