CLI Reference

Complete reference for all Forge commands.

forge inspect

Analyze a dataset's structure and schema.

# Basic inspection
forge inspect /path/to/dataset

# Inspect from HuggingFace Hub
forge inspect hf://lerobot/pusht

# Quick inspect (metadata only, no download)
forge inspect hf://lerobot/pusht --quick

# Generate a conversion config template
forge inspect /path/to/dataset --generate-config config.yaml

# Output as JSON
forge inspect /path/to/dataset --output json

# Deep scan (reads all episodes, slower but more accurate)
forge inspect /path/to/dataset --deep

# Sample specific number of episodes
forge inspect /path/to/dataset --samples 10

Output includes:

Detected format
Episode and frame counts
Camera names and resolutions
State/action dimensions
Language instruction samples

forge convert

Convert datasets between formats.

# Basic conversion
forge convert /path/to/input /path/to/output --format lerobot-v3

# From HuggingFace Hub
forge convert hf://lerobot/pusht ./output --format lerobot-v3

# With camera name mapping
forge convert input/ output/ --format lerobot-v3 --camera wrist_cam=img

# Multiple camera mappings
forge convert input/ output/ --format lerobot-v3 \
    --camera agentview=front \
    --camera eye_in_hand=wrist

# Parallel processing (faster on multi-core systems)
forge convert input/ output/ --format lerobot-v3 --workers 4

# Using a config file
forge convert input/ output/ --config config.yaml

# Dry run (preview without writing)
forge convert input/ output/ --format lerobot-v3 --dry-run

# Open visualizer after conversion to compare
forge convert input/ output/ --format lerobot-v3 --visualize

# Specify source format (if auto-detection fails)
forge convert input/ output/ --format lerobot-v3 --source-format hdf5

Target formats:

lerobot-v3 - LeRobot v3 (recommended for HuggingFace)
rlds - RLDS/TensorFlow Datasets
robodm - RoboDM .vla format (up to 70x compression)

forge visualize

Interactive dataset viewer.

# View a dataset
forge visualize /path/to/dataset

# Compare two datasets side by side
forge visualize /path/to/original --compare /path/to/converted

# Specify starting episode
forge visualize /path/to/dataset --episode 5

# Use fast OpenCV backend (better for video playback)
forge visualize /path/to/dataset --backend opencv

Backends:

matplotlib (default) - Interactive with sliders, slower playback
opencv - Fast video playback, keyboard controls

Matplotlib controls:

Episode slider: Navigate between episodes
Frame slider: Navigate frames within an episode
Play/Pause button: Auto-play frames

OpenCV controls:

Space: Play/Pause
Left/Right or A/D: Previous/Next frame
Up/Down or W/S: Previous/Next episode
+/-: Increase/Decrease playback speed
Q or Escape: Quit

forge quality

Episode-level quality scoring using proprioception data (no video processing).

# Basic quality report
forge quality /path/to/dataset

# From HuggingFace Hub
forge quality hf://lerobot/aloha_sim_cube

# With options
forge quality /path/to/dataset --gripper-dim 6 --fps 30
forge quality /path/to/dataset --export report.json
forge quality /path/to/dataset --export-flagged flagged.json

# Quick mode (skip expensive metrics)
forge quality /path/to/dataset --quick

# Known action bounds (tighter saturation detection)
forge quality /path/to/dataset --action-bounds -1.0,1.0

# Sample subset
forge quality /path/to/dataset --sample 50

Metrics computed:

Smoothness (LDLJ) — jerk-based smoothness score
Dead actions — zero/constant action detection
Gripper chatter — rapid open/close transitions
Static detection — idle periods
Timestamp regularity — dropped frames, jitter
Action saturation — time at hardware limits
Action entropy — diversity vs repetitiveness
Path length — wandering in joint space

Output: Overall score (0-10), per-metric subscores, flags, and actionable recommendations.

See forge/quality/README.md for full metric details and paper references.

forge filter

Filter dataset episodes based on quality scores, flags, or episode IDs. Writes the same format — no conversion.

# Dry-run: preview what passes/fails
forge filter /path/to/dataset --min-quality 6.0

# Write filtered dataset
forge filter /path/to/dataset /path/to/output --min-quality 6.0

# Exclude by flags
forge filter /path/to/dataset /path/to/output --exclude-flags jerky,mostly_static

# Use pre-computed quality report (faster)
forge quality /path/to/dataset --export report.json
forge filter /path/to/dataset /path/to/output --from-report report.json --min-quality 7.0

# Explicit episode lists
forge filter /path/to/dataset /path/to/output --include-episodes ep_000,ep_001
forge filter /path/to/dataset /path/to/output --exclude-episodes ep_003,ep_010

Filter criteria:

--min-quality — Keep episodes scoring >= threshold (0-10)
--exclude-flags — Exclude episodes with matching flags (comma-separated)
--include-episodes / --exclude-episodes — Explicit episode selection
--from-report — Skip re-analysis, use existing quality report JSON

Output: Summary of kept/excluded episodes with reasons. Dry-run if no output path given.

See forge/filter/README.md for full details.

forge segment

Episode segmentation via PELT changepoint detection on proprioception signals. Splits episodes into contiguous phases (sub-skills, regime changes, idle periods) without video processing.

# Basic segmentation
forge segment /path/to/dataset

# From HuggingFace Hub
forge segment hf://lerobot/droid_100

# Export JSON report and timeline visualization
forge segment /path/to/dataset --export segments.json --plot timeline.png

# Choose signal and tune PELT parameters
forge segment /path/to/dataset --signal action --penalty 5.0 --cost-model l2

# Sample a subset of episodes
forge segment /path/to/dataset --sample 20

# Disable per-dimension normalization
forge segment /path/to/dataset --no-normalize

# Use AIC penalty instead of BIC
forge segment /path/to/dataset --penalty aic --min-segment-length 15

Options:

--signal: Proprioception signal to segment on (observation.state, qpos, action, joint_positions, joint_velocities)
--penalty: PELT penalty — bic (default, adapts to signal length/dim), aic (less conservative), or a numeric value
--cost-model: Cost function for segment homogeneity (rbf, l2, l1, normal, ar)
--min-segment-length: Minimum segment length in frames (default: 10)
--normalize / --no-normalize: Z-score normalize per dimension (default: enabled)
--sample: Analyze a random subset of episodes
--export: Save JSON report with per-episode segmentation results
--plot: Generate a timeline PNG visualization
--format: Format hint for dataset loading

Output: Per-episode changepoints, segment boundaries with frame/time durations, and dataset-level summary statistics (mean/median/min/max segments).

Dependencies: Requires ruptures>=1.1.0 — install with pip install forge-robotics[segment]. Timeline plotting requires matplotlib>=3.7.0.

See forge/segment/README.md for algorithm details and penalty selection guide.

forge stats

Compute dataset statistics.

# Basic statistics
forge stats /path/to/dataset

# With distribution plots (requires matplotlib)
forge stats /path/to/dataset --plot

# Export to JSON
forge stats /path/to/dataset --output stats.json

# Sample subset of episodes (faster)
forge stats /path/to/dataset --sample 100

# Include quality metrics
forge stats /path/to/dataset --quality

Statistics include:

Episode counts (total, min/max/mean frames)
Coverage metrics (language, success labels, rewards)
Action/state distributions (min, max, mean, std per dimension)
Quality metrics (with --quality flag)

forge export-video

Export camera videos from any dataset format.

# Export first episode (all cameras as grid)
forge export-video /path/to/dataset -o demo.mp4

# Export specific episode
forge export-video /path/to/dataset -e 5 -o episode5.mp4

# Export specific camera only
forge export-video /path/to/dataset -c wrist_cam -o wrist.mp4

# Export all episodes to a directory
forge export-video /path/to/dataset --all -o ./videos/

# From HuggingFace Hub
forge export-video hf://lerobot/pusht -o pusht_demo.mp4

# Override FPS
forge export-video /path/to/dataset -o demo.mp4 --fps 30

# Force grid layout for multiple cameras
forge export-video /path/to/dataset -o demo.mp4 --grid

Options:

-e, --episode: Episode index (default: 0)
-c, --camera: Export only this camera
-a, --all: Export all episodes
-f, --fps: Override frames per second
-g, --grid: Combine cameras into grid layout

forge hub

Search and download datasets from HuggingFace Hub.

# List popular robotics datasets
forge hub

# Search by query
forge hub "robot manipulation"
forge hub "droid"

# Filter by author/organization
forge hub --author lerobot
forge hub --author berkeley-humanoid

# Download a dataset
forge hub --download lerobot/pusht

Downloaded datasets are cached in ~/.cache/forge/datasets/.

forge formats

List supported formats and their capabilities.

forge formats

Shows read/write/visualize support for each format.

forge version

Show version information.

forge version

Environment Variables

Variable	Description	Default
`FORGE_CACHE_DIR`	Dataset cache location	`~/.cache/forge`
`FORGE_LOG_LEVEL`	Logging verbosity	`INFO`

Examples

Convert Open-X dataset for LeRobot training

# Download from HuggingFace
forge hub --download openvla/droid_100

# Inspect to understand structure
forge inspect ~/.cache/forge/datasets/openvla/droid_100

# Convert to LeRobot v3
forge convert ~/.cache/forge/datasets/openvla/droid_100 \
    ./droid_lerobot \
    --format lerobot-v3 \
    --workers 4

Convert LeRobot dataset for OpenVLA/Octo training

# LeRobot → RLDS
forge convert hf://lerobot/pusht ./pusht_rlds --format rlds

Convert to RoboDM for efficient storage

# Any format → RoboDM (up to 70x compression)
forge convert hf://lerobot/pusht ./pusht_robodm --format robodm

# Visualize with fast OpenCV backend
forge visualize ./pusht_robodm --backend opencv

Verify conversion quality

# Compare original vs converted
forge visualize original_dataset/ --compare converted_dataset/

# Check statistics match
forge stats original_dataset/ --output original.json
forge stats converted_dataset/ --output converted.json
diff original.json converted.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

CLI Reference

forge inspect

forge convert

forge visualize

forge quality

forge filter

forge segment

forge stats

forge export-video

forge hub

forge formats

forge version

Environment Variables

Examples

Convert Open-X dataset for LeRobot training

Convert LeRobot dataset for OpenVLA/Octo training

Convert to RoboDM for efficient storage

Verify conversion quality

FilesExpand file tree

cli.md

Latest commit

History

cli.md

File metadata and controls

CLI Reference

forge inspect

forge convert

forge visualize

forge quality

forge filter

forge segment

forge stats

forge export-video

forge hub

forge formats

forge version

Environment Variables

Examples

Convert Open-X dataset for LeRobot training

Convert LeRobot dataset for OpenVLA/Octo training

Convert to RoboDM for efficient storage

Verify conversion quality