diff --git a/.github/workflows/refresh-profile.yml b/.github/workflows/refresh-profile.yml
index 98ab198..a177a2d 100644
--- a/.github/workflows/refresh-profile.yml
+++ b/.github/workflows/refresh-profile.yml
@@ -1,16 +1,20 @@
-name: Update Profile README
+name: Update Profile and Deploy Pages
 
 on:
   schedule:
     - cron: '0 5 * * *'
   workflow_dispatch:
 
-permissions:
-  contents: read
+concurrency:
+  group: pages
+  cancel-in-progress: false
 
 jobs:
   refresh:
     runs-on: ubuntu-latest
+    permissions:
+      contents: write
+      pull-requests: write
     steps:
       - uses: actions/checkout@v4
 
@@ -23,29 +27,49 @@ jobs:
 
       - run: uv sync --all-groups --frozen
 
-      - name: Update README
-        env:
-          GITHUB_TOKEN: ${{ secrets.SCORE_BOT_PAT }}
-        run: uv run generate-profile-readme
+      - name: Restore snapshot cache
+        uses: actions/cache@v4
+        with:
+          path: profile/cache/repo_overview.json
+          key: snapshot-${{ github.run_id }}
+          restore-keys: snapshot-
 
       - name: Collect metrics
         env:
           GITHUB_TOKEN: ${{ secrets.SCORE_BOT_PAT }}
-        run: uv run python scripts/collect_metrics.py
+        run: uv run generate-repo-overview collect
+
+      - name: Render overview (MD)
+        run: uv run generate-repo-overview render-overview
 
       - name: Create Pull Request
         uses: peter-evans/create-pull-request@v7
         with:
-          title: Update profile README and metrics
+          title: Update profile README
           author: eclipse-score-bot <187756813+eclipse-score-bot@users.noreply.github.com>
           committer: eclipse-score-bot <187756813+eclipse-score-bot@users.noreply.github.com>
           body: |
-            This PR updates:
-            - The repository descriptions and grouping in `profile/README.md`
-            - The cross-repo metrics report in `profile/metrics.md`
-            Please review and merge if everything looks good.
-          commit-message: "chore: auto-refresh profile readme and metrics"
+            Auto-generated update of `profile/README.md` from the latest snapshot.
+            The HTML metrics dashboard is deployed separately to GitHub Pages.
+          commit-message: "chore: auto-refresh profile readme"
           base: main
           branch: bot/status-update
         env:
           GITHUB_TOKEN: ${{ secrets.SCORE_BOT_PAT }}
+
+      - name: Render details (HTML)
+        run: uv run generate-repo-overview render-details
+
+      - uses: actions/upload-pages-artifact@v5
+        with:
+          path: _site
+
+  deploy:
+    needs: refresh
+    runs-on: ubuntu-latest
+    permissions:
+      pages: write
+      id-token: write
+    steps:
+      - id: deployment
+        uses: actions/deploy-pages@v5
diff --git a/.gitignore b/.gitignore
index c903b31..a3b98d6 100644
--- a/.gitignore
+++ b/.gitignore
@@ -2,3 +2,8 @@ __pycache__/
 *.py[cod]
 .pytest_cache/
 .ruff_cache/
+/.codex
+/profile/cache/bazel_registry_checkout/
+/profile/cache/reference_integration_checkout/
+/profile/cache/repo_overview.json
+/_site/
diff --git a/AGENTS.md b/AGENTS.md
new file mode 100644
index 0000000..3050c44
--- /dev/null
+++ b/AGENTS.md
@@ -0,0 +1,37 @@
+# AGENTS.md
+
+Context file for AI coding assistants. See `docs/repo-overview-tool-design.md` for architecture, data model, and caching details.
+
+## Quick reference
+
+```sh
+uv sync --all-groups --frozen                   # install deps
+uv run generate-repo-overview collect           # GitHub API → snapshot JSON
+uv run generate-repo-overview render-overview   # snapshot → profile/README.md
+uv run generate-repo-overview render-details    # snapshot → _site/ (index + per-repo pages)
+uv run pytest                                   # run tests
+uv run ruff check src/ tests/                   # lint
+uv run basedpyright src/                        # type check
+```
+
+## Key files for website work
+
+```
+src/generate_repo_overview/
+  metrics_html.py     — HTML renderer (index + per-repo detail pages)
+  metrics_report.py   — shared helpers: grouping, version comparison, badges
+  models.py           — RepoEntry, RepoSnapshot, signal dataclasses
+  cli.py              — render-details writes all pages from render_all_pages()
+  constants.py        — default paths (DEFAULT_METRICS_HTML_OUTPUT = _site/)
+tests/
+  test_cli_render.py  — render output tests
+```
+
+## Website rendering notes
+
+- No static site generator or template engine — pure Python string concatenation.
+- CSS is inlined per page via the `CSS` constant in `_html_common.py`. Dark theme using CSS variables.
+- `render_all_pages(snapshot)` returns `dict[str, str]` of relative path to HTML content.
+- Index page: tabs, filters, sortable columns — all client-side JS in `_render_script()`.
+- Detail pages (`<repo>/index.html`): static HTML, no JS.
+- Repo name links on the index go to detail pages; GitHub links use a separate icon.
diff --git a/CLAUDE.md b/CLAUDE.md
new file mode 100644
index 0000000..8f62ad3
--- /dev/null
+++ b/CLAUDE.md
@@ -0,0 +1 @@
+See [AGENTS.md](AGENTS.md) for project context, key files, and dev commands.
diff --git a/README.md b/README.md
index 0c8f05a..c53fcfd 100644
--- a/README.md
+++ b/README.md
@@ -2,6 +2,7 @@
 
 This repository hosts the start page when you visit the eclipse-score GitHub organization. It contains links to the Eclipse Score website, documentation, and other resources related to the Eclipse Score project.
 
+The Python tool in this repo now acts as a small repo-overview generator: it collects a cached snapshot of organization metadata once, then renders multiple Markdown views from that shared snapshot.
 
 ## Development
 
@@ -11,18 +12,55 @@ Use `uv` to create a virtual environment and install the project dependencies:
 uv sync --all-groups
 ```
 
-To generate the organization profile README:
+The CLI now has a built-in overview:
 
+```sh
+uv run generate-repo-overview
+```
+
+For a cache-only re-render of the profile README and the HTML dashboard:
+
+```sh
+uv run generate-repo-overview render-overview
+uv run generate-repo-overview render-details
+```
+
+For a fresh GitHub pull before rendering, run:
+
+```sh
+uv run generate-repo-overview collect
+```
+
+By default, `collect` now does a cache-aware refresh: it checks fast, high-level
+repository state and reuses cached deep details for repositories whose default
+branch SHA has not changed. Use this for regular updates.
+
+For volatile repository metrics (open PRs/issues, release counters, and recent
+activity), fast mode keeps a per-repository fetch timestamp and refreshes those
+values automatically when they are older than 1 hour.
+
+You can tune this freshness window with `REPO_OVERVIEW_VOLATILE_TTL_MINUTES`
+(default: `60`).
+
+If you need a full deep refresh for every repository, run:
+
+```sh
+uv run generate-repo-overview collect --deep
 ```
-uv run generate-profile-readme
+
+If you only want the profile README:
+
+```sh
+uv run generate-repo-overview render-overview
 ```
 
 Category order and category descriptions are configured in
-`src/profile_readme_generator/profile_readme_config.toml`. Pass
+`src/generate_repo_overview/profile_readme_config.toml`. Pass
 `--config /path/to/file.toml` to use a different config file.
 
-The generator reads repository custom properties from GitHub and expects `GITHUB_TOKEN` to be set.
-If `GITHUB_TOKEN` is not set, it falls back to `gh auth token`.
+The generator reads repository custom properties from GitHub and expects `GITHUB_TOKEN` to be set. If `GITHUB_TOKEN` is not set, it falls back to `gh auth token`.
+
+Architecture notes for the package live in [src/generate_repo_overview/README.md](src/generate_repo_overview/README.md). The broader design notes are in [docs/repo-overview-tool-design.md](docs/repo-overview-tool-design.md).
 
 To run the local checks:
 
diff --git a/docs/repo-overview-tool-design.md b/docs/repo-overview-tool-design.md
new file mode 100644
index 0000000..355c665
--- /dev/null
+++ b/docs/repo-overview-tool-design.md
@@ -0,0 +1,105 @@
+# Repo Overview Tool Design
+
+## Goals
+
+- Collect GitHub organization data once and reuse it across multiple reports.
+- Keep local iteration fast by rendering from a cached snapshot instead of re-querying GitHub on every run.
+- Separate GitHub collection, content enrichment, and rendering so new views are easy to add.
+- Extend the profile README workflow with cross-repo metrics — Markdown, HTML dashboard, and GitHub Pages deployment — using a shared snapshot.
+
+## Architecture
+
+The tool is split into three layers:
+
+1. `collector/`
+   - Connects to GitHub.
+   - Loads active repositories and custom properties.
+   - Derives content-based signals such as `has_ci`, `has_lint_config`, `has_coverage_config`, `bazel_version`, and `referenced_by_reference_integration`.
+   - Writes and reads a local JSON snapshot cache.
+2. `profile_readme.py`, `metrics_report.py`, `metrics_html.py` (with `_html_index.py`, `_html_detail.py`, `_html_common.py`)
+   - Render different views (Markdown and HTML) from the same normalized data model.
+   - Keep presentation decisions out of the collection layer.
+3. `cli.py`
+   - Orchestrates cache-aware commands: `collect`, `render-overview`, and `render-details`.
+
+## Data Model
+
+The shared model lives in `models.py`.
+
+- `RepoEntry` contains both grouping metadata and overview metrics.
+- `RepoSnapshot` stores:
+  - schema version
+  - organization name
+  - generation timestamp
+  - normalized repositories
+
+The snapshot is intentionally renderer-agnostic. It stores neutral values such as booleans and plain strings rather than Markdown-specific markers.
+
+## Caching Strategy
+
+The default cache file is `profile/cache/repo_overview.json`.
+
+The cache is used in two ways:
+
+- Render commands read the snapshot directly and never contact GitHub.
+- Collection commands reuse content-derived signals for repositories whose default-branch SHA has not changed.
+
+That means changing a template or report layout is a local-only operation, and refreshing the snapshot only re-fetches file-tree data for repositories whose content likely changed.
+
+## Why The Tool Uses The GitHub API Instead Of Cloning Repositories
+
+The current report set mainly needs:
+
+- repository metadata
+- custom properties
+- release dates
+- open pull request counts
+- file-presence checks
+- a few small file contents such as `.bazelversion`
+- cloned shared metadata repositories such as `bazel_registry` and `reference_integration`
+
+For those needs, API access is cheaper and simpler than cloning every repository.
+
+The collector uses:
+
+- repository metadata from the organization API
+- repository trees to detect whether files or directories exist
+- targeted file-content reads only when a detector needs a small file
+
+Cloning remains a future option if the project later needs heavyweight analysis such as line counting, local static analysis, or parsing large groups of files.
+
+## Command Surface
+
+The generic entry point is:
+
+```sh
+uv run generate-repo-overview <command>
+```
+
+Built-in commands:
+
+- `collect`
+  - Sync the cached snapshot from GitHub and write it to disk.
+  - Use `--deep` to force a full refresh for every repository instead of reusing cached signals for unchanged ones.
+- `render-overview`
+  - Render the profile README from an existing snapshot.
+- `render-details`
+  - Render the HTML metrics page from an existing snapshot.
+
+The `collect` command always performs a sync. The render commands never contact GitHub.
+
+## Extension Points
+
+To add a new view:
+
+1. Extend `RepoEntry` only if the new view needs new normalized data.
+2. Add or update detectors in `collector/` if new collection logic is required.
+3. Create a new renderer that accepts `RepoSnapshot` or `list[RepoEntry]`.
+4. Add a CLI command that reads the cached snapshot and calls the renderer.
+
+To add a new detector, prefer:
+
+- tree-based file existence checks for simple presence signals
+- targeted small-file reads for version or config parsing
+
+Avoid coupling detectors directly to output format. The collector should produce plain data; the renderer should decide how that data is displayed.
diff --git a/profile/README.md b/profile/README.md
index 45f6ca5..1d66786 100644
--- a/profile/README.md
+++ b/profile/README.md
@@ -1,5 +1,7 @@
 # Welcome to eclipse-score
 
+**[Metrics, Status, etc](https://eclipse-score.github.io/.github/)** — for all repositories in this organization.
+
 This Github organization contains artifacts developed by the [Eclipse S-CORE Project](https://projects.eclipse.org/projects/automotive.score).
 
 ## Introduction to Eclipse S-CORE Project
@@ -32,6 +34,7 @@ Core S-CORE modules, libraries, and APIs.
 | [communication](https://github.com/eclipse-score/communication) | Repository for the communication module LoLa |
 | [config_management](https://github.com/eclipse-score/config_management) | Repository for config management |
 | [feo](https://github.com/eclipse-score/feo) | Repository for the Fixed Order Execution (FEO) framework |
+| [inc_security_crypto](https://github.com/eclipse-score/inc_security_crypto) | Incubation repository for Security & Cryptography feature |
 | [kyron](https://github.com/eclipse-score/kyron) | Safe async runtime for Rust |
 | [lifecycle](https://github.com/eclipse-score/lifecycle) | Repository for the lifecycle feature |
 | [logging](https://github.com/eclipse-score/logging) | Repository for logging daemon |
@@ -93,6 +96,12 @@ Integration repositories for various systems and components.
 | [rules_imagefs](https://github.com/eclipse-score/rules_imagefs) | Repository for Image FileSystem Bazel rules and toolchains definitions |
 | [testing_tools](https://github.com/eclipse-score/testing_tools) | Repository for testing utilities |
 
+#### testing
+
+| Repository | Description |
+|------------|-------------|
+| [qnx_unit_tests](https://github.com/eclipse-score/qnx_unit_tests) | Infrastructure for running unit tests in QNX VMs |
+
 #### Toolchains
 
 Toolchain repositories for compilers, linters, and other development tools.
diff --git a/profile/metrics.md b/profile/metrics.md
deleted file mode 100644
index d7a4408..0000000
--- a/profile/metrics.md
+++ /dev/null
@@ -1,77 +0,0 @@
-# Cross-Repo Metrics Report
-
-Generated on 2026-02-19T14:20:36.089865+00:00
-
-| Repo |Last Commit | Issues | PRs | Bazel | Lint | CI | Test Coverage | Latest Release | Stars | Forks |
-|------|------------|--------|-----|-------|------|----|---------------|----------------|-------|-------|
-| [.eclipsefdn](https://github.com/eclipse-score/.eclipsefdn) | 2026-02-19 | 4 | 3 | ⚠️ missing | ❌ no | ✅ yes | ❌ no | - | 0 | 31 |
-| [.github](https://github.com/eclipse-score/.github) | 2026-02-19 | 2 | 2 | ⚠️ missing | ❌ no | ✅ yes | ❌ no | - | 0 | 8 |
-| [apt-install](https://github.com/eclipse-score/apt-install) | 2025-07-24 | 0 | 0 | ⚠️ missing | ❌ no | ✅ yes | ❌ no | - | 2 | 1 |
-| [baselibs](https://github.com/eclipse-score/baselibs) | 2026-02-18 | 42 | 16 | 8.3.1 | ❌ no | ✅ yes | ❌ no | 2026-02-16 | 20 | 39 |
-| [baselibs_rust](https://github.com/eclipse-score/baselibs_rust) | 2026-02-19 | 12 | 2 | 8.4.2 | ❌ no | ✅ yes | ❌ no | 2026-02-10 | 1 | 5 |
-| [bazel-tools-cc](https://github.com/eclipse-score/bazel-tools-cc) | 2026-01-23 | 1 | 1 | 8.4.2 | ❌ no | ✅ yes | ❌ no | 2025-12-15 | 1 | 3 |
-| [bazel-tools-python](https://github.com/eclipse-score/bazel-tools-python) | 2025-12-15 | 1 | 1 | 7.5.0 | ✅ yes | ✅ yes | ❌ no | 2025-11-25 | 0 | 2 |
-| [bazel_cpp_toolchains](https://github.com/eclipse-score/bazel_cpp_toolchains) | 2026-02-18 | 5 | 2 | ⚠️ missing | ❌ no | ❌ no | ❌ no | 2026-02-18 | 2 | 4 |
-| [bazel_platforms](https://github.com/eclipse-score/bazel_platforms) | 2026-02-18 | 0 | 0 | ⚠️ missing | ❌ no | ❌ no | ❌ no | 2026-02-18 | 1 | 7 |
-| [bazel_registry](https://github.com/eclipse-score/bazel_registry) | 2026-02-19 | 2 | 0 | 7.4.0 | ❌ no | ✅ yes | ❌ no | 2025-12-22 | 3 | 17 |
-| [bazel_registry_ui](https://github.com/eclipse-score/bazel_registry_ui) | 2026-02-19 | 4 | 3 | 8.4.2 | ✅ yes | ✅ yes | ❌ no | - | 0 | 2 |
-| [cicd-workflows](https://github.com/eclipse-score/cicd-workflows) | 2026-02-17 | 13 | 5 | ⚠️ missing | ❌ no | ✅ yes | ❌ no | - | 0 | 7 |
-| [communication](https://github.com/eclipse-score/communication) | 2026-02-18 | 53 | 18 | 8.3.0 | ❌ no | ✅ yes | ❌ no | 2025-12-19 | 35 | 45 |
-| [config_management](https://github.com/eclipse-score/config_management) | 2026-01-29 | 1 | 0 | 8.3.0 | ❌ no | ✅ yes | ❌ no | - | 0 | 2 |
-| [dash-license-scan](https://github.com/eclipse-score/dash-license-scan) | 2026-02-09 | 2 | 1 | ⚠️ missing | ❌ no | ✅ yes | ❌ no | 2025-12-19 | 1 | 1 |
-| [devcontainer](https://github.com/eclipse-score/devcontainer) | 2026-02-17 | 9 | 4 | ⚠️ missing | ✅ yes | ✅ yes | ❌ no | 2025-11-28 | 2 | 7 |
-| [docs-as-code](https://github.com/eclipse-score/docs-as-code) | 2026-02-19 | 40 | 12 | 8.3.0 | ❌ no | ✅ yes | ❌ no | 2026-02-13 | 5 | 20 |
-| [eclipse-score-website](https://github.com/eclipse-score/eclipse-score-website) | 2026-02-19 | 1 | 1 | ⚠️ missing | ❌ no | ✅ yes | ❌ no | - | 0 | 9 |
-| [eclipse-score-website-preview](https://github.com/eclipse-score/eclipse-score-website-preview) | 2026-02-19 | 0 | 0 | ⚠️ missing | ❌ no | ❌ no | ❌ no | - | 0 | 1 |
-| [eclipse-score-website-published](https://github.com/eclipse-score/eclipse-score-website-published) | 2026-02-19 | 2 | 0 | ⚠️ missing | ❌ no | ❌ no | ❌ no | - | 0 | 1 |
-| [eclipse-score.github.io](https://github.com/eclipse-score/eclipse-score.github.io) | 2026-01-08 | 6 | 3 | 7.4.0 | ✅ yes | ✅ yes | ❌ no | - | 7 | 14 |
-| [examples](https://github.com/eclipse-score/examples) | 2025-07-24 | 1 | 1 | ⚠️ missing | ❌ no | ❌ no | ❌ no | - | 0 | 4 |
-| [feo](https://github.com/eclipse-score/feo) | 2026-02-19 | 1 | 0 | 8.3.0 | ❌ no | ✅ yes | ❌ no | 2026-02-19 | 2 | 10 |
-| [ferrocene_toolchain_builder](https://github.com/eclipse-score/ferrocene_toolchain_builder) | 2026-01-26 | 0 | 0 | ⚠️ missing | ❌ no | ✅ yes | ❌ no | 2026-01-14 | 0 | 1 |
-| [inc_abi_compatible_datatypes](https://github.com/eclipse-score/inc_abi_compatible_datatypes) | 2025-12-18 | 1 | 1 | 8.3.0 | ❌ no | ✅ yes | ❌ no | - | 0 | 2 |
-| [inc_ai_platform](https://github.com/eclipse-score/inc_ai_platform) | 2025-10-27 | 0 | 0 | 8.3.0 | ❌ no | ✅ yes | ❌ no | - | 0 | 1 |
-| [inc_config_management](https://github.com/eclipse-score/inc_config_management) | 2025-11-03 | 2 | 2 | 8.3.0 | ❌ no | ✅ yes | ❌ no | - | 1 | 2 |
-| [inc_daal](https://github.com/eclipse-score/inc_daal) | 2026-01-20 | 2 | 2 | 8.3.0 | ❌ no | ✅ yes | ❌ no | - | 4 | 3 |
-| [inc_diagnostics](https://github.com/eclipse-score/inc_diagnostics) | 2025-10-27 | 0 | 0 | 8.3.0 | ❌ no | ✅ yes | ❌ no | - | 0 | 1 |
-| [inc_feo](https://github.com/eclipse-score/inc_feo) | 2025-09-15 | 2 | 2 | ⚠️ missing | ❌ no | ✅ yes | ❌ no | - | 8 | 9 |
-| [inc_gen_ai](https://github.com/eclipse-score/inc_gen_ai) | 2025-10-27 | 0 | 0 | 8.3.0 | ❌ no | ✅ yes | ❌ no | - | 0 | 1 |
-| [inc_json](https://github.com/eclipse-score/inc_json) | 2025-08-12 | 1 | 0 | 7.4.0 | ❌ no | ✅ yes | ❌ no | - | 0 | 1 |
-| [inc_mw_com](https://github.com/eclipse-score/inc_mw_com) | 2026-01-14 | 6 | 4 | ⚠️ missing | ❌ no | ❌ no | ❌ no | - | 5 | 9 |
-| [inc_mw_log](https://github.com/eclipse-score/inc_mw_log) | 2025-10-29 | 5 | 5 | ⚠️ missing | ❌ no | ❌ no | ❌ no | - | 0 | 7 |
-| [inc_os_autosd](https://github.com/eclipse-score/inc_os_autosd) | 2026-02-19 | 0 | 0 | 8.3.0 | ❌ no | ✅ yes | ❌ no | - | 0 | 6 |
-| [inc_process_test_management](https://github.com/eclipse-score/inc_process_test_management) | 2025-07-24 | 1 | 1 | ⚠️ missing | ❌ no | ❌ no | ❌ no | - | 0 | 3 |
-| [inc_process_variant_management](https://github.com/eclipse-score/inc_process_variant_management) | 2025-08-07 | 0 | 0 | ⚠️ missing | ❌ no | ✅ yes | ❌ no | - | 0 | 3 |
-| [inc_score_codegen](https://github.com/eclipse-score/inc_score_codegen) | 2026-01-22 | 0 | 0 | ⚠️ missing | ❌ no | ❌ no | ❌ no | - | 0 | 1 |
-| [inc_security_crypto](https://github.com/eclipse-score/inc_security_crypto) | 2026-01-22 | 0 | 0 | 8.3.0 | ❌ no | ✅ yes | ❌ no | - | 0 | 1 |
-| [inc_someip_gateway](https://github.com/eclipse-score/inc_someip_gateway) | 2026-02-18 | 22 | 13 | 8.3.0 | ✅ yes | ✅ yes | ❌ no | - | 1 | 3 |
-| [inc_time](https://github.com/eclipse-score/inc_time) | 2026-02-06 | 3 | 3 | 8.3.0 | ❌ no | ✅ yes | ❌ no | - | 0 | 3 |
-| [infrastructure](https://github.com/eclipse-score/infrastructure) | 2026-02-12 | 0 | 0 | ⚠️ missing | ❌ no | ❌ no | ❌ no | - | 0 | 1 |
-| [itf](https://github.com/eclipse-score/itf) | 2026-02-13 | 2 | 0 | 8.1.0 | ❌ no | ✅ yes | ✅ yes | 2025-09-23 | 0 | 12 |
-| [kyron](https://github.com/eclipse-score/kyron) | 2026-02-18 | 18 | 2 | 8.3.0 | ❌ no | ✅ yes | ❌ no | 2026-02-17 | 1 | 3 |
-| [lifecycle](https://github.com/eclipse-score/lifecycle) | 2026-02-19 | 29 | 11 | 8.4.2 | ❌ no | ✅ yes | ❌ no | 2026-02-17 | 0 | 14 |
-| [logging](https://github.com/eclipse-score/logging) | 2026-02-19 | 11 | 5 | 8.3.0 | ❌ no | ✅ yes | ❌ no | 2026-02-19 | 0 | 10 |
-| [module_template](https://github.com/eclipse-score/module_template) | 2026-02-03 | 4 | 3 | 8.3.0 | ❌ no | ✅ yes | ❌ no | - | 3 | 12 |
-| [more-disk-space](https://github.com/eclipse-score/more-disk-space) | 2026-01-20 | 0 | 0 | ⚠️ missing | ❌ no | ✅ yes | ❌ no | - | 0 | 1 |
-| [nlohmann_json](https://github.com/eclipse-score/nlohmann_json) | 2026-02-19 | 5 | 4 | ⚠️ missing | ❌ no | ✅ yes | ❌ no | - | 1 | 5 |
-| [operating_system](https://github.com/eclipse-score/operating_system) | 2025-07-24 | 2 | 1 | 8.1.0 | ❌ no | ❌ no | ❌ no | - | 1 | 2 |
-| [orchestrator](https://github.com/eclipse-score/orchestrator) | 2026-02-17 | 15 | 0 | 8.3.0 | ❌ no | ✅ yes | ❌ no | 2026-02-17 | 4 | 11 |
-| [os_images](https://github.com/eclipse-score/os_images) | 2025-11-27 | 3 | 2 | ⚠️ missing | ❌ no | ✅ yes | ❌ no | - | 0 | 3 |
-| [persistency](https://github.com/eclipse-score/persistency) | 2026-02-19 | 31 | 11 | 8.4.2 | ❌ no | ✅ yes | ❌ no | 2026-02-17 | 1 | 25 |
-| [process_description](https://github.com/eclipse-score/process_description) | 2026-02-19 | 68 | 4 | 8.3.0 | ❌ no | ✅ yes | ❌ no | 2026-02-05 | 1 | 17 |
-| [reference_integration](https://github.com/eclipse-score/reference_integration) | 2026-02-19 | 9 | 8 | 8.4.2 | ❌ no | ✅ yes | ❌ no | 2025-12-22 | 3 | 22 |
-| [rules_imagefs](https://github.com/eclipse-score/rules_imagefs) | 2026-02-18 | 1 | 1 | ⚠️ missing | ❌ no | ❌ no | ❌ no | - | 0 | 1 |
-| [rules_rust](https://github.com/eclipse-score/rules_rust) | 2026-02-18 | 2 | 2 | 8.4.2 | ✅ yes | ✅ yes | ❌ no | 2026-02-18 | 0 | 1 |
-| [score](https://github.com/eclipse-score/score) | 2026-02-19 | 590 | 21 | 8.3.0 | ✅ yes | ✅ yes | ❌ no | 2026-02-10 | 91 | 81 |
-| [score-crates](https://github.com/eclipse-score/score-crates) | 2026-02-09 | 2 | 2 | ⚠️ missing | ❌ no | ❌ no | ❌ no | 2026-02-09 | 1 | 9 |
-| [score_rust_policies](https://github.com/eclipse-score/score_rust_policies) | 2026-02-05 | 0 | 0 | ⚠️ missing | ❌ no | ✅ yes | ❌ no | 2026-02-05 | 0 | 3 |
-| [scrample](https://github.com/eclipse-score/scrample) | 2026-02-12 | 5 | 3 | 8.3.0 | ❌ no | ✅ yes | ❌ no | 2026-01-26 | 2 | 8 |
-| [test_integration](https://github.com/eclipse-score/test_integration) | 2025-10-10 | 0 | 0 | ⚠️ missing | ❌ no | ❌ no | ❌ no | - | 0 | 1 |
-| [test_module_a](https://github.com/eclipse-score/test_module_a) | 2025-10-10 | 0 | 0 | 8.3.0 | ❌ no | ✅ yes | ❌ no | - | 0 | 1 |
-| [test_module_b](https://github.com/eclipse-score/test_module_b) | 2025-10-10 | 0 | 0 | 8.3.0 | ❌ no | ✅ yes | ❌ no | - | 0 | 1 |
-| [testing_tools](https://github.com/eclipse-score/testing_tools) | 2026-02-19 | 0 | 0 | 8.4.2 | ❌ no | ✅ yes | ❌ no | 2026-02-19 | 1 | 4 |
-| [toolchains_gcc](https://github.com/eclipse-score/toolchains_gcc) | 2025-12-02 | 5 | 2 | ⚠️ missing | ❌ no | ❌ no | ❌ no | 2025-12-02 | 6 | 12 |
-| [toolchains_gcc_packages](https://github.com/eclipse-score/toolchains_gcc_packages) | 2026-01-21 | 0 | 0 | ⚠️ missing | ❌ no | ✅ yes | ❌ no | - | 0 | 7 |
-| [toolchains_qnx](https://github.com/eclipse-score/toolchains_qnx) | 2026-02-09 | 6 | 1 | 8.1.0 | ❌ no | ✅ yes | ❌ no | 2026-02-09 | 4 | 8 |
-| [toolchains_rust](https://github.com/eclipse-score/toolchains_rust) | 2026-02-10 | 2 | 1 | ⚠️ missing | ❌ no | ❌ no | ❌ no | 2026-02-10 | 1 | 7 |
-| [tooling](https://github.com/eclipse-score/tooling) | 2026-02-16 | 16 | 8 | 8.3.1 | ❌ no | ✅ yes | ❌ no | 2026-02-13 | 5 | 16 |
-| [tools](https://github.com/eclipse-score/tools) | 2026-02-16 | 1 | 1 | ⚠️ missing | ❌ no | ❌ no | ❌ no | - | 1 | 1 |
\ No newline at end of file
diff --git a/pyproject.toml b/pyproject.toml
index edc3868..7020eb8 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -3,16 +3,17 @@ requires = ["hatchling>=1.27.0"]
 build-backend = "hatchling.build"
 
 [project]
-name = "profile-readme-generator"
+name = "generate-repo-overview"
 version = "0.0.0"
-description = "Generate the eclipse-score organization profile README from GitHub repository properties"
+description = "Collect cached GitHub organization overviews and render Markdown reports"
 requires-python = ">=3.12"
 dependencies = [
   "PyGithub",
+  "tqdm",
 ]
 
 [project.scripts]
-generate-profile-readme = "profile_readme_generator.generator:main"
+generate-repo-overview = "generate_repo_overview.cli:main"
 
 [dependency-groups]
 dev = [
@@ -23,21 +24,18 @@ dev = [
 ]
 
 [tool.hatch.build.targets.wheel]
-packages = ["src/profile_readme_generator"]
+packages = ["src/generate_repo_overview"]
 
 [tool.hatch.build.targets.wheel.force-include]
-"src/profile_readme_generator/templates" = "profile_readme_generator/templates"
-"src/profile_readme_generator/profile_readme_config.toml" = "profile_readme_generator/profile_readme_config.toml"
+"src/generate_repo_overview/templates" = "generate_repo_overview/templates"
+"src/generate_repo_overview/profile_readme_config.toml" = "generate_repo_overview/profile_readme_config.toml"
 
 [tool.uv]
 package = true
 
 [tool.ruff]
-src = ["src", "tests", "scripts"]
+src = ["src", "tests"]
 target-version = "py312"
-exclude = [
-  "scripts/collect_metrics.py",
-]
 
 [tool.ruff.lint]
 select = [
@@ -67,7 +65,7 @@ ignore = [
 ]
 
 [tool.ruff.lint.isort]
-known-first-party = ["profile_readme_generator"]
+known-first-party = ["generate_repo_overview"]
 combine-as-imports = true
 
 [tool.ruff.lint.per-file-ignores]
@@ -93,7 +91,6 @@ reportUnknownVariableType = "warning"
 reportUnusedVariable = "warning"
 include = [
   "src",
-  "scripts",
   "tests",
 ]
 exclude = [
@@ -102,7 +99,6 @@ exclude = [
   ".venv*/**",
   "build",
   "dist",
-  "scripts/collect_metrics.py",
 ]
 venvPath = "."
 venv = ".venv"
diff --git a/requirements.txt b/requirements.txt
deleted file mode 100644
index c803fed..0000000
--- a/requirements.txt
+++ /dev/null
@@ -1 +0,0 @@
-PyGithub==2.7.0
diff --git a/scripts/collect_metrics.py b/scripts/collect_metrics.py
deleted file mode 100644
index 426939a..0000000
--- a/scripts/collect_metrics.py
+++ /dev/null
@@ -1,167 +0,0 @@
-# *******************************************************************************
-# Copyright (c) 2025 Contributors to the Eclipse Foundation
-#
-# See the NOTICE file(s) distributed with this work for additional
-# information regarding copyright ownership.
-#
-# This program and the accompanying materials are made available under the
-# terms of the Apache License Version 2.0 which is available at
-# https://www.apache.org/licenses/LICENSE-2.0
-#
-# SPDX-License-Identifier: Apache-2.0
-# *******************************************************************************
-
-#!/usr/bin/env python3
-"""
-Collect extended metrics across all repositories in eclipse-score
-and write them into a Markdown report file.
-"""
-
-import os
-import pathlib
-import re
-from dataclasses import dataclass
-from datetime import datetime, timedelta, timezone
-from typing import Optional
-
-from github import Github
-
-ORG = "eclipse-score"
-OUTPUT_DIR = pathlib.Path("profile")
-OUTPUT_FILE = OUTPUT_DIR / "metrics.md"
-
-gh = Github(os.getenv("GITHUB_TOKEN"))
-NOW = datetime.now(timezone.utc)
-
-@dataclass
-class RepoData:
-    name: str
-    description: str
-    last_commit: Optional[str]
-    open_issues: int
-    open_prs: int
-    bazel_version: str
-    lint_config: str
-    ci_setup: str
-    test_coverage: str
-    latest_release: Optional[str]
-    stars: int
-    forks: int
-
-def file_exists(repo, path):
-    try:
-        repo.get_contents(path)
-        return True
-    except:
-        return False
-
-
-def detect_bazel_version(repo):
-    try:
-        content = repo.get_contents(".bazelversion").decoded_content.decode()
-        for line in content.splitlines():
-            line = line.strip()
-            if not line or line.startswith("#"):
-                continue
-            return line
-    except Exception:
-        pass
-
-    pattern = re.compile(r'\b\d+\.\d+(?:\.\d+)?\b')
-    for ws_name in ["WORKSPACE", "WORKSPACE.bzlmod"]:
-        try:
-            content = repo.get_contents(ws_name).decoded_content.decode()
-            for line in content.splitlines():
-                line = line.strip()
-                if line.startswith("#"):
-                    continue
-                match = pattern.search(line)
-                if match:
-                    return match.group(0)
-        except Exception:
-            continue
-
-    return "⚠️ missing"
-
-
-def detect_lint_config(repo):
-    for candidate in [".gitlint", ".editorconfig", ".pre-commit-config.yaml"]:
-        if file_exists(repo, candidate):
-            return "✅ yes"
-    return "❌ no"
-
-def detect_ci_setup(repo):
-    for candidate in [".github/workflows", "Jenkinsfile"]:
-        if file_exists(repo, candidate):
-            return "✅ yes"
-    return "❌ no"
-
-def detect_test_coverage(repo):
-    for candidate in ["coverage.yml", "coverage.xml", "pytest.ini", ".coveragerc"]:
-        if file_exists(repo, candidate):
-            return "✅ yes"
-    return "❌ no"
-
-def get_latest_release_date(repo):
-    try:
-        release = repo.get_latest_release()
-        return release.published_at.date().isoformat()
-    except:
-        return None
-
-def query_github_org_for_repo_data(gh: Github, org: str):
-    repo_data_list = []
-    user = gh.get_user(org)
-    for repo in user.get_repos():
-        description = repo.description or ""
-        last_commit = repo.pushed_at.date().isoformat() if repo.pushed_at else None
-        open_issues = repo.open_issues_count
-        open_prs = repo.get_pulls(state="open").totalCount
-        bazel_version = detect_bazel_version(repo)
-        lint_config = detect_lint_config(repo)
-        ci_setup = detect_ci_setup(repo)
-        test_coverage = detect_test_coverage(repo)
-        latest_release = get_latest_release_date(repo)
-        stars = repo.stargazers_count
-        forks = repo.forks_count
-
-        repo_data_list.append(
-            RepoData(
-                name=repo.name,
-                description=description.replace("|", "‖"),
-                last_commit=last_commit,
-                open_issues=open_issues,
-                open_prs=open_prs,
-                bazel_version=bazel_version,
-                lint_config=lint_config,
-                ci_setup=ci_setup,
-                test_coverage=test_coverage,
-                latest_release=latest_release,
-                stars=stars,
-                forks=forks,
-            )
-        )
-    return repo_data_list
-
-def render_markdown(repos):
-    header = (
-        f"# Cross-Repo Metrics Report\n\n"
-        f"Generated on {NOW.isoformat()}\n\n"
-        "| Repo |Last Commit | Issues | PRs | Bazel | Lint | CI | Test Coverage | Latest Release | Stars | Forks |\n"
-        "|------|------------|--------|-----|-------|------|----|---------------|----------------|-------|-------|"
-    )
-    rows = []
-    for r in sorted(repos, key=lambda x: x.name.lower()):
-        rows.append(
-            f"| [{r.name}](https://github.com/{ORG}/{r.name}) | {r.last_commit or '-'} | "
-            f"{r.open_issues} | {r.open_prs} | {r.bazel_version} | {r.lint_config} | "
-            f"{r.ci_setup} | {r.test_coverage} | {r.latest_release or '-'} | {r.stars} | {r.forks} |"
-        )
-    return "\n".join([header] + rows)
-
-if __name__ == "__main__":
-    OUTPUT_DIR.mkdir(parents=True, exist_ok=True)
-    repos = query_github_org_for_repo_data(gh, ORG)
-    md = render_markdown(repos)
-    OUTPUT_FILE.write_text(md, encoding="utf-8")
-    print(f"Wrote {len(repos)} repos to {OUTPUT_FILE}")
diff --git a/src/generate_repo_overview/README.md b/src/generate_repo_overview/README.md
new file mode 100644
index 0000000..96e1369
--- /dev/null
+++ b/src/generate_repo_overview/README.md
@@ -0,0 +1,187 @@
+# `generate_repo_overview` Architecture
+
+This package is organized around a single idea:
+
+- collect a normalized snapshot of GitHub organization data
+- cache that snapshot on disk
+- render multiple views (Markdown and HTML) from the same cached data
+
+This document explains the package structure and cache behavior. It intentionally does not cover CLI usage.
+
+## Module Layout
+
+- `cli.py`
+  - Wires the top-level commands together.
+  - Decides whether a command should read the cache only, reuse the cache when possible, or perform a live collection.
+- `collector/`
+  - Subpackage that talks to GitHub and manages the snapshot cache.
+  - `__init__.py` — orchestration: connects to GitHub, dispatches parallel collection, writes the snapshot.
+  - `repo_entry.py` — per-repository collection logic: fast/medium/slow paths, volatile metrics.
+  - `signal_detection.py` — deep content inspection: Bazel, CI, lint, coverage, CODEOWNERS, languages.
+  - `reference_integration.py` — detects which repos are `bazel_dep` dependencies of `reference_integration`.
+  - `registry_metadata.py` — parses the `bazel_registry` for maintainers and latest module versions.
+  - `git_checkout.py` — manages shallow git checkouts for local inspection.
+  - `snapshot_io.py` — reads and writes the JSON snapshot cache.
+- `models.py`
+  - Defines the normalized data structures shared by collection and rendering.
+  - The key types are `RepoEntry` and `RepoSnapshot`.
+- `profile_readme.py`
+  - Renders the organization profile README from normalized repository data.
+  - Owns category config parsing, grouping, and README-oriented table rendering.
+- `metrics_report.py`
+  - Renders the cross-repository Markdown metrics report.
+- `metrics_html.py`
+  - Coordinates HTML page rendering and exposes `render_all_pages()`.
+- `_html_common.py`
+  - Shared HTML building blocks: CSS, icons, language badges, version badges.
+- `_html_index.py`
+  - Renders the main HTML metrics dashboard (tabs, filters, sortable columns).
+- `_html_detail.py`
+  - Renders per-repository HTML detail pages.
+- `constants.py`
+  - Centralizes default org, cache, and output paths.
+- `console.py`
+  - Keeps status output formatting in one place.
+
+## Data Flow
+
+The package has three layers:
+
+1. Collection
+   - `collector/` fetches live GitHub data and converts it into `RepoEntry` values.
+2. Snapshot
+   - The collected repos are stored inside a `RepoSnapshot`.
+3. Rendering
+   - `profile_readme.py` renders the Markdown profile README.
+   - `metrics_report.py` renders a Markdown metrics report.
+   - `metrics_html.py` (with `_html_index.py`, `_html_detail.py`, `_html_common.py`) renders the HTML dashboard.
+
+The renderers do not talk to GitHub directly. They only consume normalized data.
+
+## What Is Cached
+
+The main cache file is:
+
+- `profile/cache/repo_overview.json`
+
+That file stores a serialized `RepoSnapshot` containing:
+
+- schema version
+- organization name
+- generation timestamp
+- all normalized repositories
+
+The cache loader only accepts the current schema version. If the snapshot schema does not match, the cache is treated as unusable and collection falls back to a fresh GitHub fetch.
+
+For each repository, the snapshot currently stores:
+
+- repository identity and grouping
+  - `name`
+  - `description`
+  - `category`
+  - `subcategory`
+- branch identity used for cache reuse
+  - `default_branch`
+  - `default_branch_sha`
+- volatile metrics (refreshed on a TTL, see below)
+  - `last_push_date` (default-branch last commit date when available; falls back to repository pushed timestamp)
+  - `merged_prs_30_days`
+  - `open_issues`
+  - `open_prs`
+  - `open_ready_prs`
+  - `open_draft_prs`
+  - `latest_release_version`
+  - `latest_release_date`
+  - `commits_since_latest_release`
+  - `release_bazel_version`
+  - `release_bazel_deps`
+  - `volatile_metrics_fetched_at`
+- registry metadata
+  - `maintainers_in_bazel_registry`
+  - `latest_bazel_registry_version`
+- top-level fields
+  - `stars`
+  - `forks`
+- content-derived signals (reused when `default_branch_sha` is unchanged)
+  - `is_bazel_repo`
+  - `bazel_version`
+  - `codeowners`
+  - `docs_as_code_version`
+  - `referenced_by_reference_integration`
+  - `has_lint_config`
+  - `has_gitlint_config`
+  - `has_pyproject_toml`
+  - `has_pre_commit_config`
+  - `has_ci`
+  - `uses_cicd_daily_workflow`
+  - `has_coverage_config`
+  - `top_languages`
+  - `bazel_deps`
+
+## What Is Cached Where
+
+There is only one persistent cache file today:
+
+- `profile/cache/repo_overview.json`
+
+There is no separate per-repository cache directory and no checked-out repository mirror.
+
+Instead, the snapshot itself carries enough information to support selective reuse:
+
+- `default_branch_sha` is stored per repository
+- on the next live collection, that SHA is compared with the current GitHub default-branch SHA
+- if the SHA has not changed, the existing content-derived signals are reused from the snapshot
+
+That means the persistent cache lives in one JSON file, while reuse decisions happen per repository inside the collector.
+
+## What Is Not Cached Separately
+
+The package does not currently maintain separate caches for:
+
+- raw GitHub API responses
+- repository trees
+- individual file contents
+- cloned repositories
+- rendered Markdown outputs beyond whatever files the CLI writes
+
+Rendered outputs such as `profile/README.md` and `_site/` are products of the snapshot, not part of the snapshot cache itself.
+
+## Cache Semantics By Layer
+
+- Render-only paths read `profile/cache/repo_overview.json` and do not contact GitHub.
+- Collection paths always contact GitHub for current repository metadata.
+- During collection, some content-derived fields can still be reused from the previous snapshot when the repository content fingerprint (`default_branch_sha`) matches.
+
+The `collect` command defaults to a cache-aware mode for unchanged repositories:
+
+- it still fetches high-level state (including current default-branch SHA)
+- if the SHA matches the previous snapshot, it reuses cached deep details
+- if the SHA changed, it runs the slower deep inspection path for that repository
+
+Volatile metrics (for example PR/issue counts and release deltas) are tracked
+with a per-repository `volatile_metrics_fetched_at` timestamp. In fast mode,
+those values are reused only while they are fresh (1 hour by default); once the
+timestamp is older than the configured TTL, only volatile metrics are refreshed
+while deep content signals remain cached.
+
+Set `REPO_OVERVIEW_VOLATILE_TTL_MINUTES` to adjust this freshness window.
+
+Use `collect --deep` when you need a full deep refresh for every repository.
+
+This is why cached rendering is fast, while live collection is incremental rather than “download everything again.”
+
+## Why The Package Uses API Access Instead Of Cloning Repositories
+
+The current reports mostly need:
+
+- repository metadata
+- custom properties
+- release dates
+- pull request counts
+- file and directory presence checks
+- a few small text files such as `.bazelversion`
+- cloned shared metadata repositories such as `bazel_registry` and `reference_integration`
+
+For that workload, API access is cheaper and simpler than maintaining local clones for every repository.
+
+If the project later needs heavyweight analysis such as line counting, large-scale parsing, or local static analysis across many files, a clone-based backend could be added as a separate collection strategy.
diff --git a/src/generate_repo_overview/__init__.py b/src/generate_repo_overview/__init__.py
new file mode 100644
index 0000000..faedc7b
--- /dev/null
+++ b/src/generate_repo_overview/__init__.py
@@ -0,0 +1 @@
+"""Collect cached GitHub organization overviews and render Markdown reports."""
diff --git a/src/generate_repo_overview/_html_common.py b/src/generate_repo_overview/_html_common.py
new file mode 100644
index 0000000..0f3abb3
--- /dev/null
+++ b/src/generate_repo_overview/_html_common.py
@@ -0,0 +1,111 @@
+from __future__ import annotations
+
+import html
+from pathlib import Path
+from typing import TYPE_CHECKING
+
+from .metrics_report import parse_version_key
+
+if TYPE_CHECKING:
+    from .models import RepoEntry
+
+_TEMPLATES = Path(__file__).parent / "templates"
+
+CSS = (_TEMPLATES / "styles.css").read_text(encoding="utf-8")
+
+BAZEL_ICON = (
+    '<img src="https://bazel.build/_pwa/bazel/icons/icon-72x72.png"'
+    ' alt="Bazel" class="icon-bazel">'
+)
+
+GITHUB_ICON = (
+    '<svg viewBox="0 0 16 16" fill="currentColor">'
+    '<path d="M8 0C3.58 0 0 3.58 0 8c0 3.54 2.29 6.53 5.47 7.59.4.07.55-.17'
+    ".55-.38 0-.19-.01-.82-.01-1.49-2.01.37-2.53-.49-2.69-.94-.09-.23-.48-.94"
+    "-.82-1.13-.28-.15-.68-.52-.01-.53.63-.01 1.08.58 1.23.82.72 1.21 1.87.87"
+    " 2.33.66.07-.52.28-.87.51-1.07-1.78-.2-3.64-.89-3.64-3.95 0-.87.31-1.59"
+    ".82-2.15-.08-.2-.36-1.02.08-2.12 0 0 .67-.21 2.2.82.64-.18 1.32-.27 2-.27"
+    ".68 0 1.36.09 2 .27 1.53-1.04 2.2-.82 2.2-.82.44 1.1.16 1.92.08 2.12.51"
+    '.56.82 1.27.82 2.15 0 3.07-1.87 3.75-3.65 3.95.29.25.54.73.54 1.48 0 1.07'
+    '-.01 1.93-.01 2.2 0 .21.15.46.55.38A8.01 8.01 0 0016 8c0-4.42-3.58-8-8-8z"/>'
+    "</svg>"
+)
+
+
+_LANGUAGE_COLORS: dict[str, str] = {
+    "Python": "#3572A5",
+    "C++": "#f34b7d",
+    "C": "#555555",
+    "Go": "#00ADD8",
+    "Rust": "#dea584",
+    "Java": "#b07219",
+    "Kotlin": "#A97BFF",
+    "TypeScript": "#3178c6",
+    "JavaScript": "#f1e05a",
+    "Starlark": "#76d275",
+    "Shell": "#89e051",
+    "CMake": "#DA3434",
+    "Makefile": "#427819",
+}
+
+
+def e(text: str) -> str:
+    return html.escape(text, quote=True)
+
+
+def language_badge(lang: str | None) -> str:
+    if not lang:
+        return '<span class="text-muted">—</span>'
+    color = _LANGUAGE_COLORS.get(lang, "#888888")
+    return (
+        f'<span class="lang-badge" style="--lang-color:{color}">'
+        f"{e(lang)}</span>"
+    )
+
+
+def repo_name_cell(entry: RepoEntry, org_name: str, *, bazel_icon: bool = True) -> str:
+    detail_url = f"{e(entry.name)}/"
+    github_url = f"https://github.com/{org_name}/{entry.name}"
+    cell = f'<a href="{detail_url}">{e(entry.name)}</a>'
+    if bazel_icon and entry.content.is_bazel_repo:
+        cell += f" {BAZEL_ICON}"
+    cell += (
+        f' <a href="{e(github_url)}" class="gh-link" title="Open on GitHub ↗"'
+        f' target="_blank" rel="noopener">{GITHUB_ICON}</a>'
+    )
+    return cell
+
+
+def version_badge(
+    version: str | None,
+    max_bazel: tuple[int, ...] | None,
+    *,
+    latest_dac: str | None,
+    is_bazel: bool,
+) -> str:
+    if version is None or not version.strip():
+        return '<span class="badge muted">—</span>'
+
+    cleaned = version.strip()
+    parsed = parse_version_key(cleaned)
+
+    if is_bazel:
+        if parsed is not None and max_bazel is not None and parsed == max_bazel:
+            return f'<span class="badge green">{e(cleaned)}</span>'
+        return f'<span class="badge red">{e(cleaned)}</span>'
+
+    if latest_dac is None:
+        return f'<span class="badge muted">{e(cleaned)}</span>'
+    latest_cleaned = latest_dac.strip()
+    if cleaned == latest_cleaned:
+        return f'<span class="badge green">{e(cleaned)}</span>'
+    if parsed is not None:
+        latest_parsed = parse_version_key(latest_cleaned)
+        if (
+            latest_parsed is not None
+            and len(parsed) >= 2
+            and len(latest_parsed) >= 2
+            and parsed[:2] == latest_parsed[:2]
+        ):
+            return f'<span class="badge yellow">{e(cleaned)}</span>'
+    return f'<span class="badge red">{e(cleaned)}</span>'
diff --git a/src/generate_repo_overview/_html_detail.py b/src/generate_repo_overview/_html_detail.py
new file mode 100644
index 0000000..e9df6f4
--- /dev/null
+++ b/src/generate_repo_overview/_html_detail.py
@@ -0,0 +1,344 @@
+from __future__ import annotations
+
+from typing import TYPE_CHECKING
+
+from ._html_common import BAZEL_ICON, CSS, GITHUB_ICON, e, language_badge, version_badge
+
+if TYPE_CHECKING:
+    from .models import RepoEntry, RepoSnapshot
+
+
+def render_detail_page(
+    entry: RepoEntry,
+    org_name: str,
+    snapshot: RepoSnapshot,
+    max_bazel: tuple[int, ...] | None,
+    latest_dac: str | None,
+) -> str:
+    return (
+        "<!DOCTYPE html>\n"
+        '<html lang="en">\n<head>\n'
+        '  <meta charset="UTF-8">\n'
+        '  <meta name="viewport" content="width=device-width, initial-scale=1.0">\n'
+        f"  <title>{e(entry.name)} — {e(org_name)}</title>\n"
+        f"  <style>{CSS}</style>\n"
+        "</head>\n<body>\n"
+        + _render_hero(entry, org_name)
+        + _render_stat_grid(entry)
+        + _render_release_section(entry)
+        + _render_dep_diff_section(entry)
+        + _render_tooling_section(entry)
+        + _render_ownership_section(entry)
+        + _render_versions_section(entry, max_bazel, latest_dac)
+        + _render_footer(snapshot)
+        + "</body>\n</html>\n"
+    )
+
+
+def _render_hero(entry: RepoEntry, org_name: str) -> str:
+    github_url = f"https://github.com/{org_name}/{entry.name}"
+    name_html = e(entry.name)
+    if entry.content.is_bazel_repo:
+        name_html += f" {BAZEL_ICON}"
+
+    chips = f'<span class="badge muted">{e(entry.category)}</span>'
+    if entry.subcategory and entry.subcategory != entry.category:
+        chips += f' <span class="badge muted">{e(entry.subcategory)}</span>'
+    for lang in entry.content.top_languages:
+        chips += f" {language_badge(lang)}"
+
+    desc = e(entry.description) if entry.description else ""
+
+    return (
+        "<header>\n"
+        '  <nav class="breadcrumb">\n'
+        '    <a href="../">Cross-Repo Metrics</a> &rsaquo; '
+        f"{e(entry.name)}\n"
+        "  </nav>\n"
+        f"  <h1>{name_html}"
+        f' <a href="{e(github_url)}" class="gh-link" title="Open on GitHub ↗"'
+        f' target="_blank" rel="noopener">{GITHUB_ICON}</a>'
+        f"</h1>\n"
+        f'  <p class="subtitle">{desc}</p>\n'
+        f'  <div class="meta-chips">{chips}</div>\n'
+        "</header>\n\n"
+    )
+
+
+def _render_stat_grid(entry: RepoEntry) -> str:
+    v = entry.volatile
+    last_push = e(v.last_push_date) if v.last_push_date else "—"
+    prs_text = f"{v.open_ready_prs}+{v.open_draft_prs}"
+
+    cards = [
+        (str(entry.stars), "Stars"),
+        (str(entry.forks), "Forks"),
+        (str(v.open_issues), "Open Issues"),
+        (prs_text, "Open PRs (ready+draft)"),
+        (str(v.merged_prs_30_days), "Merged PRs (30d)"),
+        (last_push, "Last Push"),
+    ]
+
+    items = "\n".join(
+        f'  <div class="stat-card">'
+        f'<div class="stat-value">{e(val)}</div>'
+        f'<div class="stat-label">{label}</div>'
+        f"</div>"
+        for val, label in cards
+    )
+    return f'<div class="stat-grid">\n{items}\n</div>\n\n'
+
+
+def _render_release_section(entry: RepoEntry) -> str:
+    v = entry.volatile
+    if v.latest_release_version is None and v.latest_release_date is None:
+        version_html = '<span class="text-muted">No releases</span>'
+        return (
+            '<section class="detail-section">\n'
+            '  <div class="section-header"><span class="section-title">Release</span></div>\n'
+            f'  <div class="detail-body">{version_html}</div>\n'
+            "</section>\n\n"
+        )
+
+    items: list[str] = []
+    if v.latest_release_version:
+        items.append(
+            f'<div class="info-item">'
+            f'<div class="info-label">Latest Version</div>'
+            f'<span class="mono">{e(v.latest_release_version)}</span>'
+            f"</div>"
+        )
+    if v.latest_release_date:
+        items.append(
+            f'<div class="info-item">'
+            f'<div class="info-label">Release Date</div>'
+            f"{e(v.latest_release_date)}"
+            f"</div>"
+        )
+    if v.commits_since_latest_release is not None:
+        count = v.commits_since_latest_release
+        badge_class = (
+            "green" if count == 0 else ("yellow" if count <= 20 else "red")
+        )
+        items.append(
+            f'<div class="info-item">'
+            f'<div class="info-label">Commits Since Release</div>'
+            f'<span class="badge {badge_class}">{count}</span>'
+            f"</div>"
+        )
+
+    return (
+        '<section class="detail-section">\n'
+        '  <div class="section-header"><span class="section-title">Release</span></div>\n'
+        f'  <div class="detail-body"><div class="info-grid">{"".join(items)}</div></div>\n'
+        "</section>\n\n"
+    )
+
+
+def _render_dep_diff_section(entry: RepoEntry) -> str:
+    v = entry.volatile
+    if v.latest_release_version is None:
+        return ""
+
+    head_deps = dict(entry.content.bazel_deps)
+    release_deps = dict(v.release_bazel_deps)
+
+    all_names = sorted(set(head_deps) | set(release_deps))
+
+    head_bazel = entry.content.bazel_version
+    release_bazel = v.release_bazel_version
+
+    rows: list[str] = []
+
+    bazel_status, bazel_class = _dep_diff_status(head_bazel, release_bazel)
+    rows.append(
+        f"      <tr>\n"
+        f"        <td><span class='mono'>Bazel</span></td>\n"
+        f"        <td><span class='mono'>{e(head_bazel) if head_bazel else '<span class=\"text-muted\">—</span>'}</span></td>\n"
+        f"        <td><span class='mono'>{e(release_bazel) if release_bazel else '<span class=\"text-muted\">—</span>'}</span></td>\n"
+        f"        <td>{_dep_status_badge(bazel_status, bazel_class)}</td>\n"
+        f"      </tr>"
+    )
+
+    for name in all_names:
+        head_ver = head_deps.get(name)
+        rel_ver = release_deps.get(name)
+        status, css_class = _dep_diff_status(head_ver, rel_ver)
+        rows.append(
+            f"      <tr>\n"
+            f"        <td><span class='mono'>{e(name)}</span></td>\n"
+            f"        <td><span class='mono'>{e(head_ver) if head_ver else '<span class=\"text-muted\">—</span>'}</span></td>\n"
+            f"        <td><span class='mono'>{e(rel_ver) if rel_ver else '<span class=\"text-muted\">—</span>'}</span></td>\n"
+            f"        <td>{_dep_status_badge(status, css_class)}</td>\n"
+            f"      </tr>"
+        )
+
+    changed_count = sum(
+        1
+        for r in rows
+        if "badge yellow" in r or "badge green" in r or "badge red" in r
+    )
+
+    if changed_count == 0 and v.commits_since_latest_release:
+        summary = (
+            f'<p class="text-muted" style="margin:0 0 0.5rem">No dependency changes since '
+            f"{e(v.latest_release_version)}.</p>"
+        )
+    else:
+        summary = ""
+
+    release_label = e(v.latest_release_version)
+    table = (
+        f"  <table>\n"
+        f"    <thead><tr>\n"
+        f"      <th>Dependency</th>\n"
+        f"      <th>HEAD</th>\n"
+        f"      <th>Release ({release_label})</th>\n"
+        f"      <th>Status</th>\n"
+        f"    </tr></thead>\n"
+        f"    <tbody>\n"
+        + "\n".join(rows)
+        + "\n    </tbody>\n  </table>"
+    )
+
+    return (
+        '<section class="detail-section">\n'
+        '  <div class="section-header">'
+        '<span class="section-title">Dependencies: HEAD vs. Release</span>'
+        "</div>\n"
+        f"  <div class=\"detail-body\">{summary}{table}</div>\n"
+        "</section>\n\n"
+    )
+
+
+def _dep_diff_status(
+    head: str | None, release: str | None
+) -> tuple[str, str]:
+    if head is None and release is None:
+        return "—", "muted"
+    if release is None:
+        return "added", "green"
+    if head is None:
+        return "removed", "red"
+    if head == release:
+        return "—", "muted"
+    return "changed", "yellow"
+
+
+def _dep_status_badge(status: str, css_class: str) -> str:
+    if status == "—":
+        return '<span class="text-muted">—</span>'
+    return f'<span class="badge {css_class}">{e(status)}</span>'
+
+
+def _render_tooling_section(entry: RepoEntry) -> str:
+    c = entry.content
+    signals = [
+        (c.has_ci, "GitHub Actions (CI)"),
+        (c.uses_cicd_daily_workflow, "Daily Workflow"),
+        (c.has_lint_config, "Lint Config"),
+        (c.has_gitlint_config, "Gitlint"),
+        (c.has_pre_commit_config, "Pre-commit"),
+        (c.has_pyproject_toml, "pyproject.toml"),
+        (c.has_coverage_config, "Coverage Config"),
+        (c.is_bazel_repo, "Bazel Repo"),
+    ]
+
+    items = "\n".join(
+        f'    <div class="signal-item">'
+        f'<span class="signal-{"yes" if val else "no"}">'
+        f'{"&#10003;" if val else "—"}</span> {e(label)}</div>'
+        for val, label in signals
+    )
+    return (
+        '<section class="detail-section">\n'
+        '  <div class="section-header"><span class="section-title">Build &amp; Tooling</span></div>\n'
+        f'  <div class="detail-body"><div class="signal-grid">\n{items}\n  </div></div>\n'
+        "</section>\n\n"
+    )
+
+
+def _render_ownership_section(entry: RepoEntry) -> str:
+    parts: list[str] = []
+    if entry.content.codeowners:
+        handles = ", ".join(e(h) for h in entry.content.codeowners)
+        parts.append(
+            f'<div class="info-item">'
+            f'<div class="info-label">Codeowners</div>{handles}</div>'
+        )
+    if entry.registry.maintainers_in_bazel_registry:
+        handles = ", ".join(
+            e(h) for h in entry.registry.maintainers_in_bazel_registry
+        )
+        parts.append(
+            f'<div class="info-item">'
+            f'<div class="info-label">Registry Maintainers</div>{handles}</div>'
+        )
+
+    if not parts:
+        parts.append('<span class="text-muted">No ownership information available</span>')
+
+    return (
+        '<section class="detail-section">\n'
+        '  <div class="section-header"><span class="section-title">Ownership</span></div>\n'
+        f'  <div class="detail-body"><div class="info-grid">{"".join(parts)}</div></div>\n'
+        "</section>\n\n"
+    )
+
+
+def _render_versions_section(
+    entry: RepoEntry,
+    max_bazel: tuple[int, ...] | None,
+    latest_dac: str | None,
+) -> str:
+    items: list[str] = []
+
+    bazel_badge = version_badge(
+        entry.content.bazel_version, max_bazel, latest_dac=None, is_bazel=True
+    )
+    items.append(
+        f'<div class="info-item">'
+        f'<div class="info-label">Bazel Version</div>{bazel_badge}</div>'
+    )
+
+    dac_badge = version_badge(
+        entry.content.docs_as_code_version, None, latest_dac=latest_dac, is_bazel=False
+    )
+    items.append(
+        f'<div class="info-item">'
+        f'<div class="info-label">Docs-As-Code Version</div>{dac_badge}</div>'
+    )
+
+    refint = (
+        '<span class="badge green">yes</span>'
+        if entry.content.referenced_by_reference_integration
+        else '<span class="text-muted">no</span>'
+    )
+    items.append(
+        f'<div class="info-item">'
+        f'<div class="info-label">Reference Integration</div>{refint}</div>'
+    )
+
+    if entry.registry.latest_bazel_registry_version:
+        items.append(
+            f'<div class="info-item">'
+            f'<div class="info-label">Latest Registry Version</div>'
+            f'<span class="mono">{e(entry.registry.latest_bazel_registry_version)}</span>'
+            f"</div>"
+        )
+
+    return (
+        '<section class="detail-section">\n'
+        '  <div class="section-header"><span class="section-title">Versions</span></div>\n'
+        f'  <div class="detail-body"><div class="info-grid">{"".join(items)}</div></div>\n'
+        "</section>\n\n"
+    )
+
+
+def _render_footer(snapshot: RepoSnapshot) -> str:
+    return (
+        "\n<footer>\n"
+        f'  <a href="../">&larr; Back to overview</a>'
+        f" — generated {e(snapshot.generated_at)}\n"
+        "</footer>\n\n"
+    )
diff --git a/src/generate_repo_overview/_html_index.py b/src/generate_repo_overview/_html_index.py
new file mode 100644
index 0000000..7875e92
--- /dev/null
+++ b/src/generate_repo_overview/_html_index.py
@@ -0,0 +1,723 @@
+from __future__ import annotations
+
+import json
+from collections import Counter
+from datetime import date
+from pathlib import Path
+from typing import TYPE_CHECKING
+
+from ._html_common import (
+    BAZEL_ICON,
+    CSS,
+    e,
+    language_badge,
+    repo_name_cell,
+    version_badge,
+)
+from .metrics_report import (
+    get_latest_docs_as_code_release,
+    get_max_bazel_version,
+    group_repos_by_category,
+    has_latest_release,
+    parse_version_key,
+)
+
+if TYPE_CHECKING:
+    from .models import RepoEntry, RepoSnapshot
+
+_INDEX_JS = (Path(__file__).parent / "templates" / "index.js").read_text(
+    encoding="utf-8"
+)
+
+
+def render_index_page(snapshot: RepoSnapshot) -> str:
+    repos = sorted(snapshot.repos, key=lambda r: r.name.casefold())
+    categories = group_repos_by_category(repos)
+    return (
+        "<!DOCTYPE html>\n"
+        '<html lang="en">\n<head>\n'
+        '  <meta charset="UTF-8">\n'
+        '  <meta name="viewport" content="width=device-width, initial-scale=1.0">\n'
+        f"  <title>Cross-Repo Metrics — {e(snapshot.org_name)}</title>\n"
+        f"  <style>{CSS}</style>\n"
+        "</head>\n<body>\n"
+        + _render_header(snapshot, repos)
+        + _render_tab_bar()
+        + _render_filters_placeholder()
+        + '<div id="sections">\n'
+        + _render_overview_sections(categories, snapshot.org_name)
+        + _render_versions_sections(categories, repos, snapshot.org_name)
+        + _render_automation_sections(categories, snapshot.org_name)
+        + _render_timeline_section(repos, snapshot.org_name)
+        + "</div>\n"
+        + _render_footer(snapshot)
+        + _render_script(categories)
+        + "</body>\n</html>\n"
+    )
+
+
+def _render_header(snapshot: RepoSnapshot, repos: list[RepoEntry]) -> str:
+    total = len(repos)
+    with_ci = sum(r.content.has_ci for r in repos)
+    with_releases = sum(has_latest_release(r) for r in repos)
+    with_lint = sum(r.content.has_lint_config for r in repos)
+    bazel_repos = sum(r.content.is_bazel_repo for r in repos)
+
+    lang_chips = _render_language_distribution(repos)
+
+    return (
+        "<header>\n"
+        "  <h1>Cross-Repo Metrics Report</h1>\n"
+        f'  <p class="subtitle">Generated {e(snapshot.generated_at)}</p>\n'
+        '  <div id="summary">\n'
+        f'    <span class="summary-chip"><span class="dot" style="background:var(--accent)"></span>{total} repositories</span>\n'
+        f'    <span class="summary-chip"><span class="dot" style="background:var(--green)"></span>{with_ci} with CI</span>\n'
+        f'    <span class="summary-chip"><span class="dot" style="background:var(--yellow)"></span>{with_releases} with releases</span>\n'
+        f'    <span class="summary-chip"><span class="dot" style="background:var(--orange)"></span>{bazel_repos} Bazel repos</span>\n'
+        f'    <span class="summary-chip"><span class="dot" style="background:var(--muted)"></span>{with_lint} with lint config</span>\n'
+        "  </div>\n"
+        + (f'  <div id="lang-summary">{lang_chips}</div>\n' if lang_chips else "")
+        + "</header>\n\n"
+    )
+
+
+def _render_language_distribution(repos: list[RepoEntry]) -> str:
+    counts = Counter(
+        r.content.top_languages[0] for r in repos if r.content.top_languages
+    )
+    if not counts:
+        return ""
+    top = counts.most_common(4)
+    other = sum(counts.values()) - sum(c for _, c in top)
+    parts = [
+        f"{language_badge(lang)} <span class='lang-count'>{count}</span>"
+        for lang, count in top
+    ]
+    if other > 0:
+        parts.append(f'<span class="text-muted">+{other} other</span>')
+    return " ".join(parts)
+
+
+def _render_tab_bar() -> str:
+    return (
+        '<div class="tab-bar">\n'
+        '  <button class="tab-btn active" data-tab="overview">Repository Overview</button>\n'
+        '  <button class="tab-btn" data-tab="versions">Versions</button>\n'
+        '  <button class="tab-btn" data-tab="tech-stack">Tech Stack</button>\n'
+        '  <button class="tab-btn" data-tab="timeline">Releases</button>\n'
+        "</div>\n\n"
+    )
+
+
+def _render_filters_placeholder() -> str:
+    return '<div id="filters"></div>\n\n'
+
+
+def _render_overview_sections(
+    categories: list[tuple[str, list[RepoEntry]]],
+    org_name: str,
+) -> str:
+    parts: list[str] = []
+    for category, cat_repos in categories:
+        rows = "\n".join(_overview_row(r, org_name) for r in cat_repos)
+        parts.append(
+            f'<div class="section" data-tab="overview" data-category="{e(category)}">\n'
+            f'  <div class="section-header">\n'
+            f'    <span class="section-title">{e(category)}</span>\n'
+            f'    <span class="section-count">{len(cat_repos)}</span>\n'
+            f"  </div>\n"
+            f"  <table>\n"
+            f"    <thead><tr>\n"
+            f'      <th data-sort="name">Repository <span class="sort-arrow"></span></th>\n'
+            f'      <th data-sort="merged" class="text-right" title="Number of pull requests merged into the main branch in the last 30 days. A higher number means more active development.">Merged PRs (30d) <span class="sort-arrow"></span></th>\n'
+            f'      <th data-sort="issues" class="text-right" data-tooltip="Number of open issues in this repository, including bug reports and feature requests.">Open Issues <span class="sort-arrow"></span></th>\n'
+            f'      <th data-sort="prs" class="text-right" data-tooltip="Open pull requests: the first number is ready for review, the second is still in draft. A red badge means more than 5 are waiting for review.">Open PRs <span class="sort-arrow"></span></th>\n'
+            f'      <th data-sort="release" title="The most recent published release. Green = no unreleased commits, yellow = up to 20 commits not yet released, red = more than 20 commits not yet released.">Latest Release <span class="sort-arrow"></span></th>\n'
+            f'      <th data-sort="stars" class="text-right">Stars / Forks <span class="sort-arrow"></span></th>\n'
+            f"    </tr></thead>\n"
+            f"    <tbody>\n{rows}\n    </tbody>\n"
+            f"  </table>\n"
+            f"</div>\n"
+        )
+    return "".join(parts)
+
+
+def _overview_row(entry: RepoEntry, org_name: str) -> str:
+    name_cell = repo_name_cell(entry, org_name)
+    repo_url = f"https://github.com/{org_name}/{entry.name}"
+
+    merged = _render_merged_badge(entry.volatile.merged_prs_30_days)
+    issues_cell = _render_issues_cell(entry.volatile.open_issues, repo_url)
+    prs_cell = _render_prs_cell(
+        entry.volatile.open_ready_prs,
+        entry.volatile.open_draft_prs,
+        repo_url,
+    )
+    release = _render_release(
+        entry.volatile.latest_release_version,
+        entry.volatile.commits_since_latest_release,
+    )
+    stars_forks = f"{entry.stars} / {entry.forks}"
+
+    cnt = entry.volatile.merged_prs_30_days
+    if cnt == 0:
+        merged_tip = "No pull requests were merged in the last 30 days."
+    elif cnt >= 10:
+        merged_tip = f"\U0001f525 {cnt} pull requests merged in the last 30 days — very active!"
+    else:
+        merged_tip = (
+            f"{cnt} pull request{'s' if cnt != 1 else ''} merged in the last 30 days."
+        )
+
+    n = entry.volatile.open_issues
+    issues_tip = f"{n} open issue{'s' if n != 1 else ''} in this repository."
+
+    ready = entry.volatile.open_ready_prs
+    draft = entry.volatile.open_draft_prs
+    total_prs = ready + draft
+    prs_tip = f"{ready} ready for review + {draft} in draft — {total_prs} open pull request{'s' if total_prs != 1 else ''} in total."
+
+    ver = entry.volatile.latest_release_version
+    commits = entry.volatile.commits_since_latest_release
+    if ver is None:
+        release_tip = "No release has been published for this repository."
+    elif commits is None:
+        release_tip = str(ver)
+    elif commits == 0:
+        release_tip = f"{ver} — the main branch is fully up to date with this release."
+    else:
+        release_tip = f"{ver} — {commits} commit{'s' if commits != 1 else ''} on the main branch not yet included in a release."
+
+    stars_tip = f"{entry.stars} star{'s' if entry.stars != 1 else ''} · {entry.forks} fork{'s' if entry.forks != 1 else ''}"
+
+    return (
+        f'    <tr data-name="{e(entry.name)}" data-merged="{entry.volatile.merged_prs_30_days}"'
+        f' data-issues="{entry.volatile.open_issues}" data-stars="{entry.stars}">\n'
+        f"      <td>{name_cell}</td>\n"
+        f'      <td class="text-right" data-tooltip="{e(merged_tip)}">{merged}</td>\n'
+        f'      <td class="text-right" data-tooltip="{e(issues_tip)}">{issues_cell}</td>\n'
+        f'      <td class="text-right" data-tooltip="{e(prs_tip)}">{prs_cell}</td>\n'
+        f'      <td data-tooltip="{e(release_tip)}">{release}</td>\n'
+        f'      <td class="text-right" data-tooltip="{e(stars_tip)}">{stars_forks}</td>\n'
+        f"    </tr>"
+    )
+
+
+def _render_merged_badge(count: int) -> str:
+    if count >= 10:
+        return f'<span class="badge fire">\U0001f525 {count}</span>'
+    return str(count)
+
+
+def _render_issues_cell(issues: int, repo_url: str) -> str:
+    if issues == 0:
+        return '<span class="text-muted">—</span>'
+    url = e(f"{repo_url}/issues")
+    return (
+        f'<a href="{url}" class="gh-count" target="_blank" rel="noopener">{issues}</a>'
+    )
+
+
+def _render_prs_cell(ready_prs: int, draft_prs: int, repo_url: str) -> str:
+    if ready_prs == 0 and draft_prs == 0:
+        return '<span class="text-muted">—</span>'
+    url = e(f"{repo_url}/pulls")
+    if ready_prs > 5:
+        content = f'<span class="badge red">{ready_prs}</span>+{draft_prs}'
+    else:
+        content = f"{ready_prs}+{draft_prs}"
+    return (
+        f'<a href="{url}" class="gh-count" target="_blank" rel="noopener">{content}</a>'
+    )
+
+
+def _render_release(version: str | None, commits_since: int | None) -> str:
+    if version is None and commits_since is None:
+        return '<span class="text-muted">—</span>'
+    ver = e(version) if version else "—"
+    if commits_since is None:
+        return f'<span class="mono">{ver}</span>'
+    badge_class = (
+        "green" if commits_since == 0 else ("yellow" if commits_since <= 20 else "red")
+    )
+    icon = "✓" if commits_since == 0 else str(commits_since)
+    return (
+        f'<span class="mono">{ver}</span> '
+        f'<span class="badge {badge_class}">+{icon}</span>'
+    )
+
+
+_DAC_DEP_NAME = "score_docs_as_code"
+
+
+def _build_version_tooltip(
+    *,
+    dependency_version_as_used_on_main_branch: str | None,
+    latest_available_dependency_version: str | None,
+    dependency_version_as_used_in_last_release: str | None,
+    component_name: str,
+    last_release_tag: str | None = None,
+) -> str:
+    """Build a human-readable tooltip for version comparison.
+
+    Generic function to compare a component's current version (on main) with the
+    latest available version and what was used in the last release.
+
+    Args:
+        dependency_version_as_used_on_main_branch: Version currently in use on main branch
+        latest_available_dependency_version: Latest available version globally
+        dependency_version_as_used_in_last_release: Version used in the most recent release
+        component_name: Human-readable component name (e.g., "Bazel", "Docs-As-Code")
+        last_release_tag: Optional release tag for "was X at <tag>" suffix
+
+    Returns:
+        Human-readable tooltip text
+    """
+    if dependency_version_as_used_on_main_branch is not None:
+        assert (
+            dependency_version_as_used_on_main_branch
+            == dependency_version_as_used_on_main_branch.strip()
+        )
+    if latest_available_dependency_version is not None:
+        assert (
+            latest_available_dependency_version
+            == latest_available_dependency_version.strip()
+        )
+
+    # Handle component not in use
+    if not dependency_version_as_used_on_main_branch:
+        if dependency_version_as_used_in_last_release:
+            return (
+                f"{component_name} is not currently used on the main branch,"
+                f" but was used in the last release."
+            )
+        else:
+            return f"{component_name} is not used in this repository."
+
+    # Handle missing latest version (no comparison possible)
+    if latest_available_dependency_version is None:
+        return f"{component_name} {dependency_version_as_used_on_main_branch} is in use."
+
+    # Build intro: note if version changed between the last release and main
+    version_changed = (
+        dependency_version_as_used_in_last_release
+        and last_release_tag
+        and dependency_version_as_used_in_last_release
+        != dependency_version_as_used_on_main_branch
+    )
+    if version_changed:
+        tip = (
+            f"{component_name} was {dependency_version_as_used_in_last_release}"
+            f" at {last_release_tag}, updated to"
+            f" {dependency_version_as_used_on_main_branch} on the main branch"
+        )
+    else:
+        tip = f"{component_name} {dependency_version_as_used_on_main_branch}"
+
+    # Append up-to-date status
+    if dependency_version_as_used_on_main_branch == latest_available_dependency_version:
+        tip += " — now up to date." if version_changed else " — up to date (latest known version)."
+    else:
+        current_parts = parse_version_key(dependency_version_as_used_on_main_branch)
+        latest_parts = parse_version_key(latest_available_dependency_version)
+        is_patch_only = (
+            current_parts
+            and latest_parts
+            and len(current_parts) >= 2
+            and len(latest_parts) >= 2
+            and current_parts[:2] == latest_parts[:2]
+        )
+        if is_patch_only:
+            tip += f" — a patch update to {latest_available_dependency_version} is available."
+        else:
+            tip += f" — an update to {latest_available_dependency_version} is available."
+
+    return tip
+
+
+def _render_dep_changes(
+    entry: RepoEntry, excluded_deps: frozenset[str] = frozenset()
+) -> tuple[str, str]:
+    """Return (cell_html, tooltip) for the Other Dep Changes column."""
+    if entry.volatile.latest_release_version is None:
+        return '<span class="text-muted">—</span>', "No release has been published — nothing to compare against."
+
+    head_deps = dict(entry.content.bazel_deps)
+    release_deps = dict(entry.volatile.release_bazel_deps)
+
+    changes: list[str] = []
+    all_names = sorted(set(head_deps) | set(release_deps))
+    for name in all_names:
+        if name in excluded_deps:
+            continue
+        hv = head_deps.get(name)
+        rv = release_deps.get(name)
+        if hv != rv:
+            changes.append(f"{name}: {rv or '—'} → {hv or '—'}")
+
+    count = len(changes)
+    if count == 0:
+        tip = f"No dependency changes between {entry.volatile.latest_release_version} and the current main branch."
+        cell = '<span class="badge green">no changes</span>'
+        return cell, tip
+
+    badge_class = "yellow" if count <= 5 else "red"
+    cell = f'<span class="badge {badge_class}">{count} changed</span>'
+    tip = "; ".join(changes[:8])
+    if len(changes) > 8:
+        tip += f" (+{len(changes) - 8} more)"
+    return cell, tip
+
+
+def _render_versions_sections(
+    categories: list[tuple[str, list[RepoEntry]]],
+    repos: list[RepoEntry],
+    org_name: str,
+) -> str:
+    max_bazel = get_max_bazel_version(repos)
+    latest_dac = get_latest_docs_as_code_release(repos)
+    parts: list[str] = []
+    for category, cat_repos in categories:
+        rows = "\n".join(
+            _versions_row(r, org_name, max_bazel, latest_dac) for r in cat_repos
+        )
+        parts.append(
+            f'<div class="section hidden" data-tab="versions" data-category="{e(category)}">\n'
+            f'  <div class="section-header">\n'
+            f'    <span class="section-title">{e(category)}</span>\n'
+            f'    <span class="section-count">{len(cat_repos)}</span>\n'
+            f"  </div>\n"
+            f"  <table>\n"
+            f"    <thead><tr>\n"
+            f'      <th data-sort="name">Repository <span class="sort-arrow"></span></th>\n'
+            f'      <th data-sort="bazel" title="The version of Bazel (the build tool) in use. Green = on the latest known version, red = a newer version is available.">{BAZEL_ICON} Bazel Version <span class="sort-arrow"></span></th>\n'
+            f'      <th data-sort="dac" title="The version of the Docs-As-Code tooling in use. Green = up to date, yellow = a patch update is available, red = a major or minor update is needed.">Docs-As-Code Version <span class="sort-arrow"></span></th>\n'
+            f'      <th data-sort="refint" class="text-center" title="Whether this repository is included in the shared reference integration test suite.">Reference Integration <span class="sort-arrow"></span></th>\n'
+            f'      <th data-sort="release" title="The most recent published release. Green = no unreleased commits, yellow = up to 20 commits not yet released, red = more than 20 commits not yet released.">Latest Release <span class="sort-arrow"></span></th>\n'
+            f'      <th data-sort="depchanges" title="Number of dependency version changes on the main branch since the last release. Bazel and Docs-As-Code versions are shown in their own columns.">Other Dep Changes <span class="sort-arrow"></span></th>\n'
+            f"    </tr></thead>\n"
+            f"    <tbody>\n{rows}\n    </tbody>\n"
+            f"  </table>\n"
+            f"</div>\n"
+        )
+    return "".join(parts)
+
+
+def _versions_row(
+    entry: RepoEntry,
+    org_name: str,
+    max_bazel: tuple[int, ...] | None,
+    latest_dac: str | None,
+) -> str:
+    name_cell = repo_name_cell(entry, org_name)
+
+    bazel_cell = version_badge(
+        entry.content.bazel_version, max_bazel, latest_dac=None, is_bazel=True
+    )
+    release_bazel = entry.volatile.release_bazel_version
+    if release_bazel and release_bazel != entry.content.bazel_version:
+        bazel_cell = (
+            f'<span class="mono text-muted">{e(release_bazel)}</span> → {bazel_cell}'
+        )
+
+    release_deps = dict(entry.volatile.release_bazel_deps)
+    release_dac = release_deps.get(_DAC_DEP_NAME)
+    dac_cell = version_badge(
+        entry.content.docs_as_code_version, None, latest_dac=latest_dac, is_bazel=False
+    )
+    if release_dac and release_dac != entry.content.docs_as_code_version:
+        dac_cell = f'<span class="mono text-muted">{e(release_dac)}</span> → {dac_cell}'
+
+    # Deps rendered in their own column — excluded from "Other Dep Changes"
+    dedicated_deps = frozenset({_DAC_DEP_NAME})
+    refint = (
+        '<span class="badge green">yes</span>'
+        if entry.content.referenced_by_reference_integration
+        else '<span class="text-muted">no</span>'
+    )
+
+    # Format latest Bazel version as string for generic comparison
+    max_bazel_str = ".".join(str(x) for x in max_bazel) if max_bazel else None
+    bazel_tip = _build_version_tooltip(
+        dependency_version_as_used_on_main_branch=entry.content.bazel_version,
+        latest_available_dependency_version=max_bazel_str,
+        dependency_version_as_used_in_last_release=release_bazel,
+        component_name="Bazel",
+        last_release_tag=entry.volatile.latest_release_version,
+    )
+
+    # Generate Docs-As-Code version comparison tooltip
+    dac_tip = _build_version_tooltip(
+        dependency_version_as_used_on_main_branch=entry.content.docs_as_code_version,
+        latest_available_dependency_version=latest_dac,
+        dependency_version_as_used_in_last_release=release_dac,
+        component_name="Docs-As-Code",
+        last_release_tag=entry.volatile.latest_release_version,
+    )
+
+    refint_tip = (
+        "This repository is included in the shared reference integration."
+        if entry.content.referenced_by_reference_integration
+        else "This repository is not included in the shared reference integration."
+    )
+
+    release = _render_release(
+        entry.volatile.latest_release_version,
+        entry.volatile.commits_since_latest_release,
+    )
+    ver = entry.volatile.latest_release_version
+    commits = entry.volatile.commits_since_latest_release
+    if ver is None:
+        release_tip = "No release has been published for this repository."
+    elif commits is None:
+        release_tip = str(ver)
+    elif commits == 0:
+        release_tip = f"{ver} — the main branch is fully up to date with this release."
+    else:
+        release_tip = f"{ver} — {commits} commit{'s' if commits != 1 else ''} on the main branch not yet included in a release."
+
+    dep_changes_cell, dep_changes_tip = _render_dep_changes(entry, dedicated_deps)
+
+    return (
+        f"    <tr>\n"
+        f"      <td>{name_cell}</td>\n"
+        f'      <td data-tooltip="{e(bazel_tip)}">{bazel_cell}</td>\n'
+        f'      <td data-tooltip="{e(dac_tip)}">{dac_cell}</td>\n'
+        f'      <td class="text-center" data-tooltip="{e(refint_tip)}">{refint}</td>\n'
+        f'      <td data-tooltip="{e(release_tip)}">{release}</td>\n'
+        f'      <td data-tooltip="{e(dep_changes_tip)}">{dep_changes_cell}</td>\n'
+        f"    </tr>"
+    )
+
+
+def _render_automation_sections(
+    categories: list[tuple[str, list[RepoEntry]]],
+    org_name: str,
+) -> str:
+    parts: list[str] = []
+    for category, cat_repos in categories:
+        rows = "\n".join(_automation_row(r, org_name) for r in cat_repos)
+        parts.append(
+            f'<div class="section hidden" data-tab="tech-stack" data-category="{e(category)}">\n'
+            f'  <div class="section-header">\n'
+            f'    <span class="section-title">{e(category)}</span>\n'
+            f'    <span class="section-count">{len(cat_repos)}</span>\n'
+            f"  </div>\n"
+            f"  <table>\n"
+            f"    <thead><tr>\n"
+            f'      <th data-sort="name">Repository <span class="sort-arrow"></span></th>\n'
+            f'      <th data-sort="lang">Language <span class="sort-arrow"></span></th>\n'
+            f'      <th data-sort="bazel" class="text-center" title="Whether this repository uses Bazel as its build system.">Bazel <span class="sort-arrow"></span></th>\n'
+            f'      <th data-sort="gitlint" class="text-center" title="Whether this repository enforces commit message formatting rules (gitlint).">Gitlint <span class="sort-arrow"></span></th>\n'
+            f'      <th data-sort="pyproject" class="text-center" title="Whether this repository has a pyproject.toml — the standard configuration file for Python projects.">Pyproject <span class="sort-arrow"></span></th>\n'
+            f'      <th data-sort="precommit" class="text-center" title="Whether this repository runs automated checks (formatting, linting, etc.) before each commit is accepted.">Pre-commit <span class="sort-arrow"></span></th>\n'
+            f'      <th data-sort="ci" class="text-center" title="Whether this repository has automated CI/CD pipelines that run on every push or pull request.">GitHub Actions <span class="sort-arrow"></span></th>\n'
+            f'      <th data-sort="daily" class="text-center" title="Whether this repository has a scheduled daily job that runs automated tests and checks.">Daily Workflow <span class="sort-arrow"></span></th>\n'
+            f'      <th data-sort="coverage" class="text-center" title="Whether this repository measures test coverage — tracking how much of the code is exercised by automated tests.">Coverage <span class="sort-arrow"></span></th>\n'
+            f"    </tr></thead>\n"
+            f"    <tbody>\n{rows}\n    </tbody>\n"
+            f"  </table>\n"
+            f"</div>\n"
+        )
+    return "".join(parts)
+
+
+def _automation_row(entry: RepoEntry, org_name: str) -> str:
+    name_cell = repo_name_cell(entry, org_name, bazel_icon=False)
+    c = entry.content
+
+    def _presence(val: bool, icon: str) -> str:
+        if val:
+            return f'<span class="badge green">{icon}</span>'
+        return '<span class="text-muted">—</span>'
+
+    def _yesno(val: bool) -> str:
+        if val:
+            return '<span class="badge green">yes</span>'
+        return '<span class="text-muted">no</span>'
+
+    tips = {
+        "bazel": "This repository uses Bazel as its build system."
+        if c.is_bazel_repo
+        else "This repository does not use Bazel.",
+        "gitlint": "This repository enforces commit message formatting rules (gitlint)."
+        if c.has_gitlint_config
+        else "This repository has no commit message formatting rules configured.",
+        "pyproject": "This repository has a pyproject.toml (standard Python project configuration)."
+        if c.has_pyproject_toml
+        else "This repository does not have a pyproject.toml.",
+        "precommit": "This repository runs automated checks (formatting, linting, etc.) before each commit is accepted."
+        if c.has_pre_commit_config
+        else "This repository has no automated pre-commit checks configured.",
+        "ci": "This repository has automated CI/CD pipelines that run on every push or pull request."
+        if c.has_ci
+        else "This repository has no automated CI/CD pipelines.",
+        "daily": "This repository has a scheduled daily job that runs automated tests and checks."
+        if c.uses_cicd_daily_workflow
+        else "This repository has no scheduled daily automated checks.",
+        "coverage": "This repository measures test coverage — tracking how much of the code is exercised by automated tests."
+        if c.has_coverage_config
+        else "This repository does not measure test coverage.",
+    }
+
+    langs = entry.content.top_languages
+    lang_cell = (
+        " ".join(language_badge(lang) for lang in langs)
+        if langs
+        else '<span class="text-muted">—</span>'
+    )
+    lang_tip = ", ".join(langs) if langs else "Language unknown"
+
+    return (
+        f"    <tr>\n"
+        f"      <td>{name_cell}</td>\n"
+        f'      <td data-tooltip="{e(lang_tip)}">{lang_cell}</td>\n'
+        f'      <td class="text-center" data-tooltip="{e(tips["bazel"])}">{_presence(c.is_bazel_repo, BAZEL_ICON)}</td>\n'
+        f'      <td class="text-center" data-tooltip="{e(tips["gitlint"])}">{_presence(c.has_gitlint_config, "\U0001f50d")}</td>\n'
+        f'      <td class="text-center" data-tooltip="{e(tips["pyproject"])}">{_presence(c.has_pyproject_toml, "\U0001f40d")}</td>\n'
+        f'      <td class="text-center" data-tooltip="{e(tips["precommit"])}">{_presence(c.has_pre_commit_config, "\U0001fa9d")}</td>\n'
+        f'      <td class="text-center" data-tooltip="{e(tips["ci"])}">{_presence(c.has_ci, "⚙️")}</td>\n'
+        f'      <td class="text-center" data-tooltip="{e(tips["daily"])}">{_yesno(c.uses_cicd_daily_workflow)}</td>\n'
+        f'      <td class="text-center" data-tooltip="{e(tips["coverage"])}">{_yesno(c.has_coverage_config)}</td>\n'
+        f"    </tr>"
+    )
+
+
+_TIMELINE_TIERS: list[tuple[str, int, int | None]] = [
+    ("Released in the last 30 days", 0, 30),
+    ("Released this quarter (30-90 days ago)", 30, 90),
+    ("Released more than 90 days ago", 90, None),
+]
+
+
+def _parse_release_date(r: RepoEntry) -> date | None:
+    raw = r.volatile.latest_release_date
+    if not raw:
+        return None
+    try:
+        return date.fromisoformat(raw)
+    except ValueError:
+        return None
+
+
+def _build_timeline_tier_html(
+    with_release: list[tuple[RepoEntry, date]],
+    org_name: str,
+    today: date,
+) -> str:
+    html_parts: list[str] = []
+    remaining = list(with_release)
+    for label, min_days, max_days in _TIMELINE_TIERS:
+        tier_rows: list[str] = []
+        next_remaining: list[tuple[RepoEntry, date]] = []
+        for r, d in remaining:
+            age = (today - d).days
+            in_tier = age >= min_days and (max_days is None or age < max_days)
+            if in_tier:
+                tier_rows.append(_timeline_row(r, org_name, d))
+            else:
+                next_remaining.append((r, d))
+        remaining = next_remaining
+        if tier_rows:
+            html_parts.append(
+                f'  <tr class="tier-header"><td colspan="4">{e(label)}</td></tr>\n'
+                + "".join(tier_rows)
+            )
+    return "".join(html_parts)
+
+
+def _render_timeline_section(repos: list[RepoEntry], org_name: str) -> str:
+    today = date.today()
+
+    with_release = sorted(
+        ((r, d) for r in repos if (d := _parse_release_date(r)) is not None),
+        key=lambda rd: rd[1],
+        reverse=True,
+    )
+    without_release = [r for r in repos if _parse_release_date(r) is None]
+
+    recent_count = sum(1 for _, d in with_release if (today - d).days <= 30)
+    unreleased_count = len(without_release)
+    summary = (
+        f"{recent_count} release{'s' if recent_count != 1 else ''} in the last 30 days"
+    )
+    if unreleased_count:
+        summary += f" · {unreleased_count} repo{'s' if unreleased_count != 1 else ''} with no release"
+
+    tier_html = _build_timeline_tier_html(with_release, org_name, today)
+
+    if without_release:
+        unreleased_rows = "".join(
+            _timeline_row_unreleased(r, org_name) for r in without_release
+        )
+        tier_html += (
+            '  <tr class="tier-header"><td colspan="4">No release</td></tr>\n'
+            + unreleased_rows
+        )
+
+    return (
+        '<div class="section hidden" data-tab="timeline">\n'
+        '  <div class="section-header">\n'
+        '    <span class="section-title">Release Timeline</span>\n'
+        f'    <span class="section-subtitle text-muted">{e(summary)}</span>\n'
+        "  </div>\n"
+        "  <table>\n"
+        "    <thead><tr>\n"
+        "      <th>Repository</th>\n"
+        "      <th>Version</th>\n"
+        "      <th>Released</th>\n"
+        '      <th title="Number of commits on the main branch not yet included in a release. A higher number means the repository has drifted further from its last published version.">Freshness</th>\n'
+        "    </tr></thead>\n"
+        f"    <tbody>\n{tier_html}    </tbody>\n"
+        "  </table>\n"
+        "</div>\n"
+    )
+
+
+def _timeline_row(entry: RepoEntry, org_name: str, release_date: object) -> str:
+    name_cell = repo_name_cell(entry, org_name)
+    ver = entry.volatile.latest_release_version or "—"
+    freshness = _render_release(
+        entry.volatile.latest_release_version,
+        entry.volatile.commits_since_latest_release,
+    )
+    date_str = str(release_date)
+    return (
+        f"    <tr>\n"
+        f"      <td>{name_cell}</td>\n"
+        f'      <td class="mono">{e(ver)}</td>\n'
+        f"      <td>{e(date_str)}</td>\n"
+        f"      <td>{freshness}</td>\n"
+        f"    </tr>\n"
+    )
+
+
+def _timeline_row_unreleased(entry: RepoEntry, org_name: str) -> str:
+    name_cell = repo_name_cell(entry, org_name)
+    return (
+        f"    <tr>\n"
+        f"      <td>{name_cell}</td>\n"
+        f'      <td class="text-muted">—</td>\n'
+        f'      <td class="text-muted">—</td>\n'
+        f'      <td class="text-muted">—</td>\n'
+        f"    </tr>\n"
+    )
+
+
+def _render_footer(snapshot: RepoSnapshot) -> str:
+    return (
+        f"\n<footer>\n"
+        f"  Cross-repo metrics for <strong>{e(snapshot.org_name)}</strong> "
+        f"— generated {e(snapshot.generated_at)}\n"
+        f"</footer>\n\n"
+    )
+
+
+def _render_script(
+    categories: list[tuple[str, list[RepoEntry]]],
+) -> str:
+    cat_names = json.dumps(["all"] + [c for c, _ in categories])
+    return (
+        f"<script>const categories = {cat_names};</script>\n"
+        f"<script>\n{_INDEX_JS}</script>\n"
+    )
diff --git a/src/generate_repo_overview/_text_utils.py b/src/generate_repo_overview/_text_utils.py
new file mode 100644
index 0000000..67c7c03
--- /dev/null
+++ b/src/generate_repo_overview/_text_utils.py
@@ -0,0 +1,6 @@
+from __future__ import annotations
+
+
+def escape_markdown_table_cell(text: str) -> str:
+    normalized = text.replace("\r\n", " ").replace("\n", " ").replace("\r", " ")
+    return normalized.replace("|", r"\|")
diff --git a/src/generate_repo_overview/cli.py b/src/generate_repo_overview/cli.py
new file mode 100644
index 0000000..64e0cff
--- /dev/null
+++ b/src/generate_repo_overview/cli.py
@@ -0,0 +1,201 @@
+from __future__ import annotations
+
+import argparse
+from pathlib import Path
+from textwrap import dedent
+from typing import TYPE_CHECKING
+
+from .collector import collect_snapshot, load_snapshot
+from .console import print_status
+from .constants import (
+    DEFAULT_CACHE,
+    DEFAULT_METRICS_HTML_OUTPUT,
+    DEFAULT_ORG,
+    DEFAULT_OUTPUT,
+    DEFAULT_TOKEN_ENV,
+)
+from .metrics_html import render_all_pages
+from .profile_readme import load_config, load_template, render_readme
+
+if TYPE_CHECKING:
+    from collections.abc import Sequence
+
+    from .models import RepoSnapshot
+
+
+CLI_EPILOG = dedent(
+    f"""\
+    Quick start:
+      uv run generate-repo-overview collect
+          Sync the cached snapshot from GitHub.
+
+      uv run generate-repo-overview render-overview
+          Re-render the profile README from the local cache.
+
+      uv run generate-repo-overview render-details
+          Re-render the HTML metrics page from the local cache.
+
+    Defaults:
+      Cache:   {DEFAULT_CACHE}
+      README:  {DEFAULT_OUTPUT}
+
+    Use `uv run generate-repo-overview <command> --help` for command-specific options.
+    """
+)
+
+
+def build_parser() -> argparse.ArgumentParser:
+    parser = argparse.ArgumentParser(
+        description=(
+            "Collect cached GitHub organization repository overviews and render "
+            "different views from the same snapshot."
+        ),
+        epilog=CLI_EPILOG,
+        formatter_class=argparse.RawDescriptionHelpFormatter,
+    )
+    subparsers = parser.add_subparsers(
+        dest="command",
+        metavar="command",
+    )
+
+    collect_parser = subparsers.add_parser(
+        "collect",
+        help="Collect and write the cached repository snapshot.",
+    )
+    collect_parser.add_argument(
+        "--org", default=DEFAULT_ORG, help="GitHub organization name"
+    )
+    collect_parser.add_argument(
+        "--cache", type=Path, default=DEFAULT_CACHE, help="JSON snapshot cache file"
+    )
+    collect_parser.add_argument(
+        "--token-env",
+        default=DEFAULT_TOKEN_ENV,
+        help="Environment variable that contains the GitHub token",
+    )
+    collect_parser.add_argument(
+        "--deep",
+        action="store_true",
+        help=(
+            "Force a deep refresh for every repository. "
+            "By default, unchanged repositories reuse cached detailed signals."
+        ),
+    )
+
+    overview_parser = subparsers.add_parser(
+        "render-overview",
+        help="Render the profile README from a cached snapshot.",
+    )
+    overview_parser.add_argument(
+        "--input",
+        type=Path,
+        default=DEFAULT_CACHE,
+        help="JSON snapshot file to render from",
+    )
+    overview_parser.add_argument(
+        "--output", type=Path, default=DEFAULT_OUTPUT, help="Markdown file to write"
+    )
+    overview_parser.add_argument(
+        "--template",
+        type=Path,
+        help="Optional markdown template file with a {{ repo_sections }} placeholder",
+    )
+    overview_parser.add_argument(
+        "--config",
+        type=Path,
+        help="Optional category config file that defines order and descriptions",
+    )
+
+    details_parser = subparsers.add_parser(
+        "render-details",
+        help="Render the HTML metrics page from a cached snapshot.",
+    )
+    details_parser.add_argument(
+        "--input",
+        type=Path,
+        default=DEFAULT_CACHE,
+        help="JSON snapshot file to render from",
+    )
+    details_parser.add_argument(
+        "--output",
+        type=Path,
+        default=DEFAULT_METRICS_HTML_OUTPUT,
+        help="Output directory for HTML pages",
+    )
+
+    return parser
+
+
+def main(argv: Sequence[str] | None = None) -> int:
+    parser = build_parser()
+    args = parser.parse_args(argv)
+    command = args.command
+
+    if command is None:
+        parser.print_help()
+        return 0
+
+    if command == "collect":
+        return run_collect(args)
+    if command == "render-overview":
+        return run_render_overview(args)
+    if command == "render-details":
+        return run_render_details(args)
+    raise ValueError(f"Unsupported command {command!r}.")
+
+
+def run_collect(args: argparse.Namespace) -> int:
+    collect_snapshot(
+        org_name=args.org,
+        token_env=args.token_env,
+        cache_path=args.cache,
+        reuse_unchanged_repositories=not args.deep,
+        status_prefix="repo-overview",
+    )
+    return 0
+
+
+def run_render_overview(args: argparse.Namespace) -> int:
+    snapshot = load_snapshot(args.input)
+    markdown = render_profile_readme(
+        snapshot,
+        template_path=args.template,
+        config_path=args.config,
+    )
+    write_text_file(path=args.output, content=markdown, status_prefix="repo-overview")
+    return 0
+
+
+def run_render_details(args: argparse.Namespace) -> int:
+    snapshot = load_snapshot(args.input)
+    pages = render_all_pages(snapshot)
+    output_dir: Path = args.output
+    for relative_path, content in pages.items():
+        write_text_file(
+            path=output_dir / relative_path,
+            content=content,
+            status_prefix="repo-overview",
+        )
+    return 0
+
+
+def render_profile_readme(
+    snapshot: RepoSnapshot,
+    *,
+    template_path: Path | None,
+    config_path: Path | None,
+) -> str:
+    template = load_template(template_path)
+    config = load_config(config_path)
+    return render_readme(
+        list(snapshot.repos),
+        template=template,
+        config=config,
+        org_name=snapshot.org_name,
+    )
+
+
+def write_text_file(*, path: Path, content: str, status_prefix: str) -> None:
+    path.parent.mkdir(parents=True, exist_ok=True)
+    path.write_text(content, encoding="utf-8")
+    print_status(f"Wrote {path}", prefix=status_prefix)
diff --git a/src/generate_repo_overview/collector/__init__.py b/src/generate_repo_overview/collector/__init__.py
new file mode 100644
index 0000000..9609eed
--- /dev/null
+++ b/src/generate_repo_overview/collector/__init__.py
@@ -0,0 +1,463 @@
+from __future__ import annotations
+
+import os
+import subprocess
+import sys
+from concurrent.futures import Future, ThreadPoolExecutor, as_completed
+from dataclasses import dataclass
+from datetime import UTC, datetime
+from typing import TYPE_CHECKING, Any, Protocol, cast
+
+from tqdm import tqdm
+
+from generate_repo_overview.console import print_status
+from generate_repo_overview.constants import (
+    DEFAULT_CACHE,
+    DEFAULT_ORG,
+    DEFAULT_TOKEN_ENV,
+)
+from generate_repo_overview.models import (
+    SNAPSHOT_SCHEMA_VERSION,
+    CustomPropertyValue,
+    RepoEntry,
+    RepoSnapshot,
+)
+
+from . import reference_integration, registry_metadata, repo_entry
+from .registry_metadata import RegistrySignalsPayload
+from .snapshot_io import load_snapshot, load_snapshot_if_present, write_snapshot
+
+if TYPE_CHECKING:
+    from pathlib import Path
+
+
+class OrganizationLike(Protocol):
+    @property
+    def login(self) -> str: ...
+
+    requester: Any
+
+
+class GitHubClientLike(Protocol):
+    def get_rate_limit(self) -> object: ...
+
+
+@dataclass(frozen=True, slots=True)
+class ActiveRepositoryData:
+    repository: object
+    custom_properties: dict[str, CustomPropertyValue]
+
+
+DEFAULT_MAX_COLLECTION_WORKERS = 8
+
+__all__ = [
+    "DEFAULT_MAX_COLLECTION_WORKERS",
+    "SNAPSHOT_SCHEMA_VERSION",
+    "ActiveRepositoryData",
+    "RegistrySignalsPayload",
+    "collect_snapshot",
+    "ensure_snapshot",
+    "fetch_active_repositories",
+    "fetch_active_repositories_via_rest",
+    "fetch_repositories",
+    "fetch_repository_descriptions",
+    "get_gh_auth_token",
+    "load_snapshot",
+    "load_snapshot_if_present",
+    "paginate_github_rest_list",
+    "parse_repository_custom_properties",
+    "resolve_github_token",
+    "resolve_max_collection_workers",
+    "write_snapshot",
+]
+
+
+def resolve_github_token(token_env: str = DEFAULT_TOKEN_ENV) -> str | None:
+    token = os.getenv(token_env)
+    if token:
+        return token
+    return get_gh_auth_token()
+
+
+def get_gh_auth_token() -> str | None:
+    try:
+        result = subprocess.run(
+            ["gh", "auth", "token"],
+            check=True,
+            capture_output=True,
+            text=True,
+        )
+    except (FileNotFoundError, subprocess.CalledProcessError):
+        return None
+
+    token = result.stdout.strip()
+    return token or None
+
+
+def ensure_snapshot(
+    *,
+    org_name: str = DEFAULT_ORG,
+    cache_path: Path = DEFAULT_CACHE,
+    token_env: str = DEFAULT_TOKEN_ENV,
+    refresh: bool = False,
+    status_prefix: str = "repo-overview",
+) -> RepoSnapshot:
+    if not refresh:
+        cached_snapshot = load_snapshot_if_present(cache_path)
+        if cached_snapshot is not None:
+            print_status(
+                f"Loading cached snapshot from {cache_path}",
+                prefix=status_prefix,
+            )
+            return cached_snapshot
+
+    return collect_snapshot(
+        org_name=org_name,
+        token_env=token_env,
+        cache_path=cache_path,
+        status_prefix=status_prefix,
+    )
+
+
+def collect_snapshot(
+    *,
+    org_name: str = DEFAULT_ORG,
+    token_env: str = DEFAULT_TOKEN_ENV,
+    cache_path: Path | None = DEFAULT_CACHE,
+    reuse_unchanged_repositories: bool = False,
+    status_prefix: str = "repo-overview",
+) -> RepoSnapshot:
+    try:
+        from github import Auth, Github
+    except ModuleNotFoundError as exc:
+        raise SystemExit(
+            "Missing PyGithub. Install project dependencies before running the generator."
+        ) from exc
+
+    token = resolve_github_token(token_env)
+    if not token:
+        message = f"Missing GitHub token. Set {token_env} or authenticate with `gh auth login`."
+        raise SystemExit(message)
+
+    existing_snapshot = (
+        load_snapshot_if_present(cache_path) if cache_path is not None else None
+    )
+
+    print_status(f"Connecting to GitHub organization {org_name}", prefix=status_prefix)
+    github = Github(auth=Auth.Token(token), lazy=True)
+    print_rest_api_rate_limit(
+        github,
+        when="before collection",
+        status_prefix=status_prefix,
+    )
+    try:
+        organization = github.get_organization(org_name)
+        print_status("Collecting repository overview", prefix=status_prefix)
+        repos = fetch_repositories(
+            organization,
+            existing_snapshot=existing_snapshot,
+            reuse_unchanged_repositories=reuse_unchanged_repositories,
+            github_token=token,
+            status_prefix=status_prefix,
+        )
+
+        snapshot = RepoSnapshot(
+            schema_version=SNAPSHOT_SCHEMA_VERSION,
+            org_name=org_name,
+            generated_at=datetime.now(UTC).isoformat(),
+            repos=tuple(repos),
+        )
+        if cache_path is not None:
+            write_snapshot(snapshot, cache_path)
+            print_status(f"Wrote snapshot to {cache_path}", prefix=status_prefix)
+        return snapshot
+    finally:
+        print_rest_api_rate_limit(
+            github,
+            when="after collection",
+            status_prefix=status_prefix,
+        )
+
+
+def print_rest_api_rate_limit(
+    github_client: GitHubClientLike,
+    *,
+    when: str,
+    status_prefix: str,
+) -> None:
+    try:
+        rate_limit = github_client.get_rate_limit()
+        resources = getattr(rate_limit, "resources", None)
+        core_rate_limit = getattr(resources, "core", None)
+        if core_rate_limit is None:
+            core_rate_limit = getattr(rate_limit, "core", None)
+        if core_rate_limit is None:
+            raise AttributeError("Missing core rate limit data.")
+    except Exception as exc:
+        print_status(
+            f"GitHub REST API rate limit {when}: unavailable ({exc})",
+            prefix=status_prefix,
+        )
+        return
+
+    reset_at = getattr(core_rate_limit, "reset", None)
+    if isinstance(reset_at, datetime):
+        reset_display = reset_at.isoformat()
+    else:
+        reset_display = "unknown"
+
+    print_status(
+        "GitHub REST API rate limit "
+        f"{when}: remaining {getattr(core_rate_limit, 'remaining', 'unknown')}/"
+        f"{getattr(core_rate_limit, 'limit', 'unknown')}, "
+        f"used {getattr(core_rate_limit, 'used', 'unknown')}, "
+        f"resets at {reset_display}",
+        prefix=status_prefix,
+    )
+
+
+def fetch_repositories(
+    organization: OrganizationLike,
+    existing_snapshot: RepoSnapshot | None = None,
+    *,
+    reuse_unchanged_repositories: bool = False,
+    github_token: str | None = None,
+    status_prefix: str = "repo-overview",
+) -> list[RepoEntry]:
+    print_status("Loading active repositories", prefix=status_prefix)
+    active_repositories = fetch_active_repositories(organization)
+    print_status(
+        f"Found {len(active_repositories)} active repositories",
+        prefix=status_prefix,
+    )
+    print_status(
+        "Extracting repository custom properties from repo payloads",
+        prefix=status_prefix,
+    )
+    repositories_with_custom_properties = sum(
+        1
+        for repository_data in active_repositories.values()
+        if repository_data.custom_properties
+    )
+    print_status(
+        "Extracted custom properties for "
+        f"{repositories_with_custom_properties} repositories",
+        prefix=status_prefix,
+    )
+    print_status("Loading maintainers in bazel_registry", prefix=status_prefix)
+    bazel_registry_data = active_repositories.get("bazel_registry")
+    bazel_registry_metadata_by_repo = (
+        registry_metadata.fetch_bazel_registry_metadata_by_repo(
+            bazel_registry_repository=(
+                bazel_registry_data.repository
+                if bazel_registry_data is not None
+                else None
+            ),
+            active_repository_names=set(active_repositories),
+            github_token=github_token,
+        )
+    )
+    print_status(
+        "Loaded bazel_registry metadata for "
+        f"{len(bazel_registry_metadata_by_repo)} active repositories",
+        prefix=status_prefix,
+    )
+    print_status(
+        "Loading reference_integration Bazel dependencies",
+        prefix=status_prefix,
+    )
+    reference_integration_data = active_repositories.get("reference_integration")
+    reference_integration_repository_names = (
+        reference_integration.fetch_reference_integration_repository_names(
+            reference_integration_repository=(
+                reference_integration_data.repository
+                if reference_integration_data is not None
+                else None
+            ),
+            active_repository_names=set(active_repositories),
+            github_token=github_token,
+        )
+    )
+    print_status(
+        "Loaded reference_integration Bazel dependencies for "
+        f"{len(reference_integration_repository_names)} active repositories",
+        prefix=status_prefix,
+    )
+
+    cached_by_name = (
+        {repo.name: repo for repo in existing_snapshot.repos}
+        if existing_snapshot is not None
+        else {}
+    )
+    sorted_repositories = sorted(
+        active_repositories.items(),
+        key=lambda item: item[0].casefold(),
+    )
+
+    total_repositories = len(sorted_repositories)
+    if total_repositories == 0:
+        return []
+
+    max_workers = min(resolve_max_collection_workers(), total_repositories)
+    print_status(
+        f"Collecting repository details with up to {max_workers} parallel workers",
+        prefix=status_prefix,
+    )
+
+    repos_by_index: dict[int, RepoEntry] = {}
+    with (
+        ThreadPoolExecutor(max_workers=max_workers) as executor,
+        tqdm(
+            total=total_repositories,
+            desc="Finished",
+            unit="repo",
+            file=sys.stderr,
+            disable=not sys.stderr.isatty(),
+        ) as progress,
+    ):
+        futures: dict[Future[RepoEntry], tuple[int, str]] = {}
+        for index, (repository_name, repository_data) in enumerate(
+            sorted_repositories,
+            start=1,
+        ):
+            cached_entry = cached_by_name.get(repository_name)
+            future = executor.submit(
+                repo_entry.collect_repository_entry,
+                repository_name=repository_name,
+                repository=repository_data.repository,
+                custom_properties=repository_data.custom_properties,
+                bazel_registry_metadata=bazel_registry_metadata_by_repo.get(
+                    repository_name
+                ),
+                cached_entry=cached_entry,
+                referenced_by_reference_integration=(
+                    repository_name in reference_integration_repository_names
+                ),
+                reuse_cached_entry_when_unchanged=reuse_unchanged_repositories,
+            )
+            futures[future] = (index, repository_name)
+
+        for future in as_completed(futures):
+            index, repository_name = futures[future]
+            repos_by_index[index] = future.result()
+            progress.update(1)
+            progress.set_postfix_str(repository_name)
+
+    return [repos_by_index[index] for index in range(1, total_repositories + 1)]
+
+
+def resolve_max_collection_workers() -> int:
+    raw_value = os.getenv("REPO_OVERVIEW_MAX_WORKERS", "").strip()
+    if raw_value:
+        try:
+            parsed = int(raw_value)
+        except ValueError:
+            return DEFAULT_MAX_COLLECTION_WORKERS
+        if parsed > 0:
+            return parsed
+    return DEFAULT_MAX_COLLECTION_WORKERS
+
+
+def fetch_active_repositories(
+    organization: OrganizationLike,
+) -> dict[str, ActiveRepositoryData]:
+    return fetch_active_repositories_via_rest(
+        requester=organization.requester,
+        org_login=organization.login,
+    )
+
+
+def fetch_active_repositories_via_rest(
+    *,
+    requester: Any,
+    org_login: str,
+) -> dict[str, ActiveRepositoryData]:
+    from github.Repository import Repository
+
+    active_repositories: dict[str, ActiveRepositoryData] = {}
+    repo_items = paginate_github_rest_list(
+        requester=requester,
+        path=f"/orgs/{org_login}/repos",
+        parameters={"type": "all", "sort": "full_name", "direction": "asc"},
+    )
+    for response_headers, payload in repo_items:
+        repository = Repository(
+            requester=requester,
+            headers=response_headers,
+            attributes=payload,
+            completed=True,
+        )
+        repository_name = cast("str | None", getattr(repository, "name", None))
+        if repository_name is None or cast(
+            "bool", getattr(repository, "archived", False)
+        ):
+            continue
+        active_repositories[repository_name] = ActiveRepositoryData(
+            repository=repository,
+            custom_properties=parse_repository_custom_properties(repository),
+        )
+    return active_repositories
+
+
+def paginate_github_rest_list(
+    *,
+    requester: Any,
+    path: str,
+    parameters: dict[str, Any] | None = None,
+    per_page: int = 100,
+) -> list[tuple[dict[str, Any], dict[str, object]]]:
+    page = 1
+    items: list[tuple[dict[str, Any], dict[str, object]]] = []
+    while True:
+        page_parameters = dict(parameters or {})
+        page_parameters["per_page"] = per_page
+        page_parameters["page"] = page
+        response_headers, data = requester.requestJsonAndCheck(
+            "GET",
+            path,
+            parameters=page_parameters,
+        )
+        if not isinstance(data, list):
+            raise RuntimeError(
+                f"GitHub API call to {path} returned a non-list payload."
+            )
+        page_items = [item for item in data if isinstance(item, dict)]
+        items.extend(
+            (cast("dict[str, Any]", response_headers), item) for item in page_items
+        )
+        if len(data) < per_page:
+            break
+        page += 1
+    return items
+
+
+def fetch_repository_descriptions(
+    organization: OrganizationLike,
+) -> dict[str, str | None]:
+    return {
+        name: cast(
+            "str | None", getattr(repository_data.repository, "description", None)
+        )
+        for name, repository_data in fetch_active_repositories(organization).items()
+    }
+
+
+def parse_repository_custom_properties(
+    repository: object,
+) -> dict[str, CustomPropertyValue]:
+    repository_fields = vars(repository)
+    preloaded_attribute = repository_fields.get("_custom_properties")
+    preloaded_value = getattr(preloaded_attribute, "value", None)
+    if not isinstance(preloaded_value, dict):
+        return {}
+
+    parsed: dict[str, CustomPropertyValue] = {}
+    for key, value in preloaded_value.items():
+        if not isinstance(key, str):
+            continue
+        if value is None or isinstance(value, str):
+            parsed[key] = value
+            continue
+        if isinstance(value, list):
+            parsed[key] = [item for item in value if isinstance(item, str)]
+    return parsed
diff --git a/src/generate_repo_overview/collector/git_checkout.py b/src/generate_repo_overview/collector/git_checkout.py
new file mode 100644
index 0000000..af813cd
--- /dev/null
+++ b/src/generate_repo_overview/collector/git_checkout.py
@@ -0,0 +1,113 @@
+from __future__ import annotations
+
+import shutil
+import subprocess
+from typing import TYPE_CHECKING
+from urllib.parse import quote, urlsplit, urlunsplit
+
+if TYPE_CHECKING:
+    from pathlib import Path
+
+
+def sync_repository_checkout(
+    *,
+    clone_url: str,
+    default_branch: str,
+    github_token: str | None,
+    checkout_path: Path,
+) -> Path | None:
+    authenticated_url = build_authenticated_clone_url(clone_url, github_token)
+    checkout_path.parent.mkdir(parents=True, exist_ok=True)
+
+    if update_existing_checkout(checkout_path, default_branch):
+        return checkout_path
+
+    if not clone_fresh_checkout(
+        authenticated_url=authenticated_url,
+        default_branch=default_branch,
+        checkout_path=checkout_path,
+    ):
+        return None
+
+    return checkout_path
+
+
+def update_existing_checkout(checkout_path: Path, default_branch: str) -> bool:
+    git_dir = checkout_path / ".git"
+    if not git_dir.exists():
+        return False
+
+    fetch_ok = run_git_command(
+        [
+            "git",
+            "-C",
+            str(checkout_path),
+            "fetch",
+            "--depth",
+            "1",
+            "origin",
+            default_branch,
+        ]
+    )
+    checkout_ok = run_git_command(
+        [
+            "git",
+            "-C",
+            str(checkout_path),
+            "checkout",
+            "--force",
+            "--detach",
+            "FETCH_HEAD",
+        ]
+    )
+    if not (fetch_ok and checkout_ok):
+        return False
+
+    run_git_command(["git", "-C", str(checkout_path), "clean", "-fdx"])
+    return True
+
+
+def clone_fresh_checkout(
+    *,
+    authenticated_url: str,
+    default_branch: str,
+    checkout_path: Path,
+) -> bool:
+    shutil.rmtree(checkout_path, ignore_errors=True)
+    return run_git_command(
+        [
+            "git",
+            "clone",
+            "--depth",
+            "1",
+            "--branch",
+            default_branch,
+            authenticated_url,
+            str(checkout_path),
+        ]
+    )
+
+
+def run_git_command(command: list[str]) -> bool:
+    try:
+        subprocess.run(
+            command,
+            check=True,
+            stdout=subprocess.DEVNULL,
+            stderr=subprocess.DEVNULL,
+        )
+    except (OSError, subprocess.CalledProcessError):
+        return False
+    return True
+
+
+def build_authenticated_clone_url(clone_url: str, github_token: str | None) -> str:
+    if github_token is None:
+        return clone_url
+
+    parsed = urlsplit(clone_url)
+    auth = f"x-access-token:{quote(github_token, safe='')}"
+    netloc = f"{auth}@{parsed.netloc}"
+    return urlunsplit(
+        (parsed.scheme, netloc, parsed.path, parsed.query, parsed.fragment)
+    )
diff --git a/src/generate_repo_overview/collector/reference_integration.py b/src/generate_repo_overview/collector/reference_integration.py
new file mode 100644
index 0000000..c952dcc
--- /dev/null
+++ b/src/generate_repo_overview/collector/reference_integration.py
@@ -0,0 +1,250 @@
+from __future__ import annotations
+
+import re
+from pathlib import Path
+from typing import TYPE_CHECKING, cast
+from urllib.parse import urlsplit
+
+from .git_checkout import sync_repository_checkout
+from .registry_metadata import (
+    BAZEL_REGISTRY_LOCAL_CHECKOUT,
+    parse_bazel_registry_metadata,
+)
+from .signal_detection import dedupe_preserving_order
+
+if TYPE_CHECKING:
+    from collections.abc import Iterable
+
+REFERENCE_INTEGRATION_LOCAL_CHECKOUT = Path(
+    "profile/cache/reference_integration_checkout"
+)
+ROOT_MODULE_PATH = Path("MODULE.bazel")
+INCLUDE_PATTERN = re.compile(r'\binclude\s*\(\s*"(?P<label>[^"]+)"\s*\)')
+BAZEL_DEP_PATTERN = re.compile(r"\bbazel_dep\s*\((?P<body>.*?)\)", re.DOTALL)
+GIT_OVERRIDE_PATTERN = re.compile(r"\bgit_override\s*\((?P<body>.*?)\)", re.DOTALL)
+NAME_PATTERN = re.compile(r'\bname\s*=\s*"(?P<value>[^"]+)"')
+MODULE_NAME_PATTERN = re.compile(r'\bmodule_name\s*=\s*"(?P<value>[^"]+)"')
+REMOTE_PATTERN = re.compile(r'\bremote\s*=\s*"(?P<value>[^"]+)"')
+
+
+def fetch_reference_integration_repository_names(
+    *,
+    reference_integration_repository: object | None,
+    active_repository_names: set[str],
+    github_token: str | None,
+) -> set[str]:
+    if reference_integration_repository is None:
+        return set()
+
+    default_branch = cast(
+        "str | None",
+        getattr(reference_integration_repository, "default_branch", None),
+    )
+    clone_url = cast(
+        "str | None", getattr(reference_integration_repository, "clone_url", None)
+    )
+    if default_branch is None or clone_url is None:
+        return set()
+
+    checkout_path = sync_repository_checkout(
+        clone_url=clone_url,
+        default_branch=default_branch,
+        github_token=github_token,
+        checkout_path=REFERENCE_INTEGRATION_LOCAL_CHECKOUT,
+    )
+    if checkout_path is None:
+        return set()
+
+    module_file_contents = read_included_module_files(checkout_path)
+    module_names = get_bazel_dep_names_from_contents(module_file_contents.values())
+    git_override_repositories = get_git_override_repositories_by_module(
+        module_file_contents.values(),
+        active_repository_names=active_repository_names,
+    )
+    registry_repositories = get_bazel_registry_repositories_by_module(
+        active_repository_names=active_repository_names,
+    )
+
+    repositories: list[str] = []
+    for module_name in module_names:
+        repository_name = git_override_repositories.get(module_name)
+        if repository_name is None:
+            repository_name = registry_repositories.get(module_name)
+        if repository_name is not None:
+            repositories.append(repository_name)
+
+    return set(dedupe_preserving_order(repositories))
+
+
+def read_included_module_files(checkout_path: Path) -> dict[Path, str]:
+    pending = [ROOT_MODULE_PATH]
+    seen: set[Path] = set()
+    contents: dict[Path, str] = {}
+
+    while pending:
+        relative_path = pending.pop()
+        if relative_path in seen:
+            continue
+        seen.add(relative_path)
+
+        content = read_checkout_file(checkout_path, relative_path)
+        if content is None:
+            continue
+        contents[relative_path] = content
+
+        for include_label in get_include_labels(content):
+            included_path = resolve_include_label(
+                include_label,
+                current_file=relative_path,
+                checkout_path=checkout_path,
+            )
+            if included_path is not None and included_path not in seen:
+                pending.append(included_path)
+
+    return contents
+
+
+def read_checkout_file(checkout_path: Path, relative_path: Path) -> str | None:
+    try:
+        path = safe_checkout_path(checkout_path, relative_path)
+    except ValueError:
+        return None
+    try:
+        return path.read_text(encoding="utf-8")
+    except OSError:
+        return None
+
+
+def safe_checkout_path(checkout_path: Path, relative_path: Path) -> Path:
+    checkout_root = checkout_path.resolve()
+    candidate = (checkout_root / relative_path).resolve()
+    candidate.relative_to(checkout_root)
+    return candidate
+
+
+def get_include_labels(text: str) -> tuple[str, ...]:
+    return tuple(match.group("label") for match in INCLUDE_PATTERN.finditer(text))
+
+
+def resolve_include_label(
+    label: str,
+    *,
+    current_file: Path,
+    checkout_path: Path,
+) -> Path | None:
+    if label.startswith("//"):
+        label_path = label.removeprefix("//")
+        package, separator, target = label_path.partition(":")
+        if not separator or not target:
+            return None
+        relative_path = Path(package) / target
+    elif label.startswith(":"):
+        relative_path = current_file.parent / label.removeprefix(":")
+    else:
+        relative_path = current_file.parent / label
+
+    try:
+        safe_checkout_path(checkout_path, relative_path)
+    except ValueError:
+        return None
+    return relative_path
+
+
+def get_bazel_dep_names_from_contents(contents: Iterable[str]) -> tuple[str, ...]:
+    names: list[str] = []
+    for content in contents:
+        names.extend(get_bazel_dep_names(content))
+    return dedupe_preserving_order(names)
+
+
+def get_bazel_dep_names(text: str | None) -> tuple[str, ...]:
+    if not text:
+        return ()
+
+    names: list[str] = []
+    for match in BAZEL_DEP_PATTERN.finditer(text):
+        name_match = NAME_PATTERN.search(match.group("body"))
+        if name_match is not None:
+            names.append(name_match.group("value").strip())
+    return dedupe_preserving_order(names)
+
+
+def get_git_override_repositories_by_module(
+    contents: Iterable[str],
+    *,
+    active_repository_names: set[str],
+) -> dict[str, str]:
+    repositories_by_module: dict[str, str] = {}
+    for content in contents:
+        repositories_by_module.update(
+            get_git_override_repositories_from_text(
+                content,
+                active_repository_names=active_repository_names,
+            )
+        )
+    return repositories_by_module
+
+
+def get_git_override_repositories_from_text(
+    text: str | None,
+    *,
+    active_repository_names: set[str],
+) -> dict[str, str]:
+    if not text:
+        return {}
+
+    repositories_by_module: dict[str, str] = {}
+    for match in GIT_OVERRIDE_PATTERN.finditer(text):
+        body = match.group("body")
+        module_name_match = MODULE_NAME_PATTERN.search(body)
+        remote_match = REMOTE_PATTERN.search(body)
+        if module_name_match is None or remote_match is None:
+            continue
+        repository_name = parse_github_remote_repository_name(
+            remote_match.group("value")
+        )
+        if repository_name is None or repository_name not in active_repository_names:
+            continue
+        module_name = module_name_match.group("value").strip()
+        if module_name:
+            repositories_by_module[module_name] = repository_name
+    return repositories_by_module
+
+
+def parse_github_remote_repository_name(remote: str) -> str | None:
+    parsed = urlsplit(remote)
+    if parsed.netloc != "github.com":
+        return None
+
+    path_parts = [part for part in parsed.path.strip("/").split("/") if part]
+    if len(path_parts) != 2:
+        return None
+
+    owner, repository_name = path_parts
+    if owner != "eclipse-score":
+        return None
+
+    return repository_name.removesuffix(".git") or None
+
+
+def get_bazel_registry_repositories_by_module(
+    *,
+    active_repository_names: set[str],
+) -> dict[str, str]:
+    repositories_by_module: dict[str, str] = {}
+    for metadata_path in sorted(
+        BAZEL_REGISTRY_LOCAL_CHECKOUT.glob("modules/*/metadata.json")
+    ):
+        try:
+            content = metadata_path.read_text(encoding="utf-8")
+        except OSError:
+            continue
+
+        module_name = metadata_path.parent.name
+        metadata_by_repo = parse_bazel_registry_metadata(
+            content,
+            active_repository_names=active_repository_names,
+        )
+        for repository_name in metadata_by_repo:
+            repositories_by_module.setdefault(module_name, repository_name)
+    return repositories_by_module
diff --git a/src/generate_repo_overview/collector/registry_metadata.py b/src/generate_repo_overview/collector/registry_metadata.py
new file mode 100644
index 0000000..0a91b3b
--- /dev/null
+++ b/src/generate_repo_overview/collector/registry_metadata.py
@@ -0,0 +1,166 @@
+from __future__ import annotations
+
+import json
+from pathlib import Path
+from typing import TypedDict, cast
+
+from .git_checkout import sync_repository_checkout
+from .signal_detection import dedupe_preserving_order
+
+
+class RegistrySignalsPayload(TypedDict):
+    maintainers_in_bazel_registry: tuple[str, ...]
+    latest_bazel_registry_version: str | None
+
+
+BAZEL_REGISTRY_LOCAL_CHECKOUT = Path("profile/cache/bazel_registry_checkout")
+
+
+def fetch_bazel_registry_metadata_by_repo(
+    *,
+    bazel_registry_repository: object | None,
+    active_repository_names: set[str],
+    github_token: str | None,
+) -> dict[str, RegistrySignalsPayload]:
+    if bazel_registry_repository is None:
+        return {}
+
+    default_branch = cast(
+        "str | None", getattr(bazel_registry_repository, "default_branch", None)
+    )
+    clone_url = cast(
+        "str | None", getattr(bazel_registry_repository, "clone_url", None)
+    )
+    if default_branch is None or clone_url is None:
+        return {}
+
+    checkout_path = sync_repository_checkout(
+        clone_url=clone_url,
+        default_branch=default_branch,
+        github_token=github_token,
+        checkout_path=BAZEL_REGISTRY_LOCAL_CHECKOUT,
+    )
+    if checkout_path is None:
+        return {}
+
+    metadata_paths = sorted(checkout_path.glob("modules/*/metadata.json"))
+
+    metadata_by_repo_name: dict[str, RegistrySignalsPayload] = {}
+    for metadata_path in metadata_paths:
+        try:
+            content = metadata_path.read_text(encoding="utf-8")
+        except OSError:
+            continue
+        for repository_name, metadata in parse_bazel_registry_metadata(
+            content,
+            active_repository_names=active_repository_names,
+        ).items():
+            metadata_by_repo_name[repository_name] = merge_bazel_registry_metadata(
+                metadata_by_repo_name.get(repository_name),
+                metadata,
+            )
+    return metadata_by_repo_name
+
+
+def parse_bazel_registry_metadata(
+    text: str | None,
+    *,
+    active_repository_names: set[str],
+) -> dict[str, RegistrySignalsPayload]:
+    if not text:
+        return {}
+    try:
+        raw_metadata_object: object = json.loads(text)
+    except json.JSONDecodeError:
+        return {}
+    if not isinstance(raw_metadata_object, dict):
+        return {}
+    raw_metadata = cast("dict[str, object]", raw_metadata_object)
+
+    maintainers = parse_bazel_registry_maintainers(raw_metadata.get("maintainers"))
+    latest_version = parse_latest_bazel_registry_version(raw_metadata.get("versions"))
+
+    metadata_by_repo_name: dict[str, RegistrySignalsPayload] = {}
+    raw_repositories = raw_metadata.get("repository")
+    if not isinstance(raw_repositories, list):
+        return metadata_by_repo_name
+
+    repository_entries = cast("list[object]", raw_repositories)
+    for raw_repository in repository_entries:
+        repository_name = parse_github_repository_name(raw_repository)
+        if repository_name is None or repository_name not in active_repository_names:
+            continue
+        metadata_by_repo_name[repository_name] = {
+            "maintainers_in_bazel_registry": maintainers,
+            "latest_bazel_registry_version": latest_version,
+        }
+
+    return metadata_by_repo_name
+
+
+def parse_bazel_registry_maintainers(raw_maintainers: object) -> tuple[str, ...]:
+    if not isinstance(raw_maintainers, list):
+        return ()
+
+    maintainers: list[str] = []
+    maintainer_entries = cast("list[object]", raw_maintainers)
+    for raw_maintainer in maintainer_entries:
+        if not isinstance(raw_maintainer, dict):
+            continue
+        maintainer = cast("dict[str, object]", raw_maintainer)
+
+        name = maintainer.get("name")
+        github_handle = maintainer.get("github")
+        email = maintainer.get("email")
+
+        display_parts: list[str] = []
+        if isinstance(name, str) and name.strip():
+            display_parts.append(name.strip())
+        if isinstance(github_handle, str) and github_handle.strip():
+            display_parts.append(f"(@{github_handle.strip()})")
+        if not display_parts and isinstance(email, str) and email.strip():
+            display_parts.append(email.strip())
+        if display_parts:
+            maintainers.append(" ".join(display_parts))
+
+    return dedupe_preserving_order(maintainers)
+
+
+def parse_latest_bazel_registry_version(raw_versions: object) -> str | None:
+    if not isinstance(raw_versions, list):
+        return None
+    version_entries = cast("list[object]", raw_versions)
+    for raw_version in version_entries:
+        if isinstance(raw_version, str) and raw_version.strip():
+            return raw_version.strip()
+    return None
+
+
+def parse_github_repository_name(value: object) -> str | None:
+    if not isinstance(value, str) or not value.startswith("github:"):
+        return None
+
+    owner_and_repo = value.removeprefix("github:")
+    if "/" not in owner_and_repo:
+        return None
+
+    _, repository_name = owner_and_repo.split("/", maxsplit=1)
+    repository_name = repository_name.strip()
+    return repository_name or None
+
+
+def merge_bazel_registry_metadata(
+    existing: RegistrySignalsPayload | None,
+    incoming: RegistrySignalsPayload,
+) -> RegistrySignalsPayload:
+    if existing is None:
+        return incoming
+
+    return {
+        "maintainers_in_bazel_registry": dedupe_preserving_order(
+            list(existing["maintainers_in_bazel_registry"])
+            + list(incoming["maintainers_in_bazel_registry"])
+        ),
+        "latest_bazel_registry_version": existing["latest_bazel_registry_version"]
+        or incoming["latest_bazel_registry_version"],
+    }
diff --git a/src/generate_repo_overview/collector/repo_entry.py b/src/generate_repo_overview/collector/repo_entry.py
new file mode 100644
index 0000000..1b7a03f
--- /dev/null
+++ b/src/generate_repo_overview/collector/repo_entry.py
@@ -0,0 +1,739 @@
+from __future__ import annotations
+
+import os
+from dataclasses import replace
+from datetime import UTC, date, datetime, timedelta
+from typing import TYPE_CHECKING, Any, TypedDict, cast
+
+from generate_repo_overview.models import (
+    DEFAULT_CATEGORY,
+    DEFAULT_SUBCATEGORY,
+    CustomPropertyValue,
+    DeepContentSignals,
+    RegistrySignals,
+    RepoEntry,
+    VolatileMetricsSnapshot,
+)
+
+from .signal_detection import (
+    DeepContentPayload,
+    detect_all_bazel_deps,
+    detect_bazel_version,
+    fetch_repository_tree_paths,
+    inspect_repository_content_slow,
+)
+
+if TYPE_CHECKING:
+    from .registry_metadata import RegistrySignalsPayload
+
+
+class PullRequestCounts(TypedDict):
+    ready: int
+    draft: int
+    total: int
+
+
+class LatestReleaseDetails(TypedDict):
+    version: str | None
+    date: str | None
+    commits_since_release: int | None
+    release_bazel_version: str | None
+    release_bazel_deps: tuple[tuple[str, str], ...]
+
+
+class VolatileMetricsPayload(TypedDict):
+    last_push_date: str | None
+    merged_prs_30_days: int
+    open_issues: int
+    open_prs: int
+    open_ready_prs: int
+    open_draft_prs: int
+    latest_release_version: str | None
+    latest_release_date: str | None
+    commits_since_latest_release: int | None
+    release_bazel_version: str | None
+    release_bazel_deps: tuple[tuple[str, str], ...]
+
+
+MERGED_PULL_REQUEST_WINDOW_DAYS = 30
+DEFAULT_VOLATILE_METRICS_TTL_MINUTES = 60
+VOLATILE_METRICS_TTL_ENV = "REPO_OVERVIEW_VOLATILE_TTL_MINUTES"
+
+
+def collect_repository_entry(
+    *,
+    repository_name: str,
+    repository: Any,
+    custom_properties: dict[str, CustomPropertyValue],
+    bazel_registry_metadata: RegistrySignalsPayload | None,
+    cached_entry: RepoEntry | None,
+    referenced_by_reference_integration: bool = False,
+    reuse_cached_entry_when_unchanged: bool = False,
+) -> RepoEntry:
+    """Collect one repository entry using explicit fast/slow collection paths.
+
+    Fast path: when cache reuse is enabled and default-branch state is unchanged,
+    reuse cached content indicators and optionally cached volatile metrics.
+
+    Slow path: when cache reuse is impossible (or disabled), inspect repository
+    content and refresh volatile metrics from live API calls.
+    """
+    fast_entry = maybe_collect_repository_entry_fast_path(
+        repository_name=repository_name,
+        repository=repository,
+        custom_properties=custom_properties,
+        bazel_registry_metadata=bazel_registry_metadata,
+        referenced_by_reference_integration=referenced_by_reference_integration,
+        cached_entry=cached_entry,
+        reuse_cached_entry_when_unchanged=reuse_cached_entry_when_unchanged,
+    )
+    if fast_entry is not None:
+        return fast_entry
+
+    return collect_repository_entry_slow_path(
+        repository_name=repository_name,
+        repository=repository,
+        custom_properties=custom_properties,
+        bazel_registry_metadata=bazel_registry_metadata,
+        referenced_by_reference_integration=referenced_by_reference_integration,
+        cached_entry=cached_entry,
+    )
+
+
+def maybe_collect_repository_entry_fast_path(
+    *,
+    repository_name: str,
+    repository: Any,
+    custom_properties: dict[str, CustomPropertyValue],
+    bazel_registry_metadata: RegistrySignalsPayload | None,
+    referenced_by_reference_integration: bool,
+    cached_entry: RepoEntry | None,
+    reuse_cached_entry_when_unchanged: bool,
+) -> RepoEntry | None:
+    """Attempt a fast collection path that avoids deep content inspection.
+
+    Returns ``None`` when the fast path is not applicable.
+    """
+    default_branch = cast("str | None", getattr(repository, "default_branch", None))
+    default_branch_sha = get_default_branch_sha(repository, default_branch)
+    cache_matches_default_branch = cached_entry_matches_default_branch(
+        cached_entry,
+        default_branch=default_branch,
+        default_branch_sha=default_branch_sha,
+    )
+
+    if not (reuse_cached_entry_when_unchanged and cache_matches_default_branch):
+        return None
+
+    assert cached_entry is not None
+    if should_reuse_cached_volatile_metrics(cached_entry):
+        return build_repo_entry_from_cached(
+            cached_entry=cached_entry,
+            repository_name=repository_name,
+            description=cast("str | None", getattr(repository, "description", None)),
+            custom_properties=custom_properties,
+            default_branch=default_branch,
+            default_branch_sha=default_branch_sha,
+            bazel_registry_metadata=bazel_registry_metadata,
+            referenced_by_reference_integration=referenced_by_reference_integration,
+            stars=getattr(repository, "stargazers_count", 0) or 0,
+            forks=getattr(repository, "forks_count", 0) or 0,
+        )
+
+    # Medium-fast variant: keep cached content indicators but refresh volatile API metrics.
+    content_signals = cached_signals_for_repository(
+        cached_entry,
+        default_branch=default_branch,
+        default_branch_sha=default_branch_sha,
+    )
+    assert content_signals is not None
+    content_signals["referenced_by_reference_integration"] = (
+        referenced_by_reference_integration
+    )
+    volatile_metrics = collect_volatile_metrics(
+        repository,
+        default_branch=default_branch,
+        default_branch_sha=default_branch_sha,
+    )
+    registry_signals = build_registry_signals(bazel_registry_metadata)
+    return build_repo_entry(
+        repository_name=repository_name,
+        description=cast("str | None", getattr(repository, "description", None)),
+        custom_properties=custom_properties,
+        default_branch=default_branch,
+        default_branch_sha=default_branch_sha,
+        content_signals=content_signals,
+        registry_signals=registry_signals,
+        volatile_metrics=volatile_metrics,
+        volatile_metrics_fetched_at=datetime.now(UTC).isoformat(),
+        stars=getattr(repository, "stargazers_count", 0) or 0,
+        forks=getattr(repository, "forks_count", 0) or 0,
+    )
+
+
+def collect_repository_entry_slow_path(
+    *,
+    repository_name: str,
+    repository: Any,
+    custom_properties: dict[str, CustomPropertyValue],
+    bazel_registry_metadata: RegistrySignalsPayload | None,
+    referenced_by_reference_integration: bool,
+    cached_entry: RepoEntry | None,
+) -> RepoEntry:
+    """Collect using slow path logic (deep content inspection when cache can't prove reuse)."""
+    default_branch = cast("str | None", getattr(repository, "default_branch", None))
+    default_branch_sha = get_default_branch_sha(repository, default_branch)
+
+    cached_content_signals = cached_signals_for_repository(
+        cached_entry,
+        default_branch=default_branch,
+        default_branch_sha=default_branch_sha,
+    )
+
+    if cached_content_signals is None:
+        content_signals = inspect_repository_content_slow(
+            repository,
+            ref=default_branch_sha,
+        )
+    else:
+        content_signals = cached_content_signals
+    content_signals["referenced_by_reference_integration"] = (
+        referenced_by_reference_integration
+    )
+    volatile_metrics = collect_volatile_metrics(
+        repository,
+        default_branch=default_branch,
+        default_branch_sha=default_branch_sha,
+    )
+    registry_signals = build_registry_signals(bazel_registry_metadata)
+
+    return build_repo_entry(
+        repository_name=repository_name,
+        description=cast("str | None", getattr(repository, "description", None)),
+        custom_properties=custom_properties,
+        default_branch=default_branch,
+        default_branch_sha=default_branch_sha,
+        content_signals=content_signals,
+        registry_signals=registry_signals,
+        volatile_metrics=volatile_metrics,
+        volatile_metrics_fetched_at=datetime.now(UTC).isoformat(),
+        stars=getattr(repository, "stargazers_count", 0) or 0,
+        forks=getattr(repository, "forks_count", 0) or 0,
+    )
+
+
+def collect_volatile_metrics(
+    repository: Any,
+    *,
+    default_branch: str | None,
+    default_branch_sha: str | None,
+) -> VolatileMetricsPayload:
+    """Collect volatile metrics from live API calls.
+
+    This is comparatively slow and intentionally refreshed on demand based on
+    the configured volatile-metric TTL.
+    """
+    open_pull_request_counts = get_open_pull_request_counts(repository)
+    merged_pull_request_count = get_merged_pull_request_count_last_30_days(
+        repository,
+        default_branch=default_branch,
+    )
+    latest_release = get_latest_release_details(
+        repository,
+        default_branch=default_branch,
+        default_branch_sha=default_branch_sha,
+    )
+    last_commit_date = get_default_branch_last_commit_date(
+        repository,
+        default_branch=default_branch,
+    )
+    return {
+        "last_push_date": last_commit_date
+        or iso_date(getattr(repository, "pushed_at", None)),
+        "merged_prs_30_days": merged_pull_request_count,
+        "open_issues": get_open_issue_count(
+            repository,
+            open_pull_request_total=open_pull_request_counts["total"],
+        ),
+        "open_prs": open_pull_request_counts["total"],
+        "open_ready_prs": open_pull_request_counts["ready"],
+        "open_draft_prs": open_pull_request_counts["draft"],
+        "latest_release_version": latest_release["version"],
+        "latest_release_date": latest_release["date"],
+        "commits_since_latest_release": latest_release["commits_since_release"],
+        "release_bazel_version": latest_release["release_bazel_version"],
+        "release_bazel_deps": latest_release["release_bazel_deps"],
+    }
+
+
+def get_default_branch_last_commit_date(
+    repository: Any,
+    *,
+    default_branch: str | None,
+) -> str | None:
+    if not default_branch:
+        return None
+
+    try:
+        branch = repository.get_branch(default_branch)
+    except Exception:
+        return None
+
+    commit = getattr(branch, "commit", None)
+    nested_commit = getattr(commit, "commit", None)
+    committer = getattr(nested_commit, "committer", None)
+    timestamp = getattr(committer, "date", None)
+    return iso_date(timestamp)
+
+
+def cached_signals_for_repository(
+    cached_entry: RepoEntry | None,
+    *,
+    default_branch: str | None,
+    default_branch_sha: str | None,
+) -> DeepContentPayload | None:
+    if not cached_entry_matches_default_branch(
+        cached_entry,
+        default_branch=default_branch,
+        default_branch_sha=default_branch_sha,
+    ):
+        return None
+
+    assert cached_entry is not None
+    return {
+        "is_bazel_repo": cached_entry.content.is_bazel_repo,
+        "bazel_version": cached_entry.content.bazel_version,
+        "codeowners": cached_entry.content.codeowners,
+        "docs_as_code_version": cached_entry.content.docs_as_code_version,
+        "referenced_by_reference_integration": (
+            cached_entry.content.referenced_by_reference_integration
+        ),
+        "has_lint_config": cached_entry.content.has_lint_config,
+        "has_gitlint_config": cached_entry.content.has_gitlint_config,
+        "has_pyproject_toml": cached_entry.content.has_pyproject_toml,
+        "has_pre_commit_config": cached_entry.content.has_pre_commit_config,
+        "has_ci": cached_entry.content.has_ci,
+        "uses_cicd_daily_workflow": cached_entry.content.uses_cicd_daily_workflow,
+        "has_coverage_config": cached_entry.content.has_coverage_config,
+        "top_languages": cached_entry.content.top_languages,
+        "bazel_deps": cached_entry.content.bazel_deps,
+    }
+
+
+def cached_entry_matches_default_branch(
+    cached_entry: RepoEntry | None,
+    *,
+    default_branch: str | None,
+    default_branch_sha: str | None,
+) -> bool:
+    if cached_entry is None:
+        return False
+
+    # Reuse cached repository details only when we can prove the default-branch state is unchanged.
+    cached_sha = cached_entry.default_branch_sha
+    if default_branch_sha is not None:
+        return cached_sha == default_branch_sha
+
+    if default_branch is not None:
+        return cached_entry.default_branch == default_branch
+
+    return False
+
+
+def build_repo_entry_from_cached(
+    *,
+    cached_entry: RepoEntry,
+    repository_name: str,
+    description: str | None,
+    custom_properties: dict[str, CustomPropertyValue],
+    default_branch: str | None,
+    default_branch_sha: str | None,
+    bazel_registry_metadata: RegistrySignalsPayload | None,
+    referenced_by_reference_integration: bool,
+    stars: int,
+    forks: int,
+) -> RepoEntry:
+    registry = build_registry_signals(bazel_registry_metadata)
+    content = replace(
+        cached_entry.content,
+        referenced_by_reference_integration=referenced_by_reference_integration,
+    )
+    return replace(
+        cached_entry,
+        name=repository_name,
+        description=description or "(no description)",
+        category=normalize_group_name(
+            custom_properties.get("category"), DEFAULT_CATEGORY
+        ),
+        subcategory=normalize_group_name(
+            custom_properties.get("subcategory"),
+            DEFAULT_SUBCATEGORY,
+        ),
+        default_branch=default_branch,
+        default_branch_sha=default_branch_sha,
+        content=content,
+        registry=registry,
+        stars=stars,
+        forks=forks,
+    )
+
+
+def build_repo_entry(
+    repository_name: str,
+    description: str | None,
+    custom_properties: dict[str, CustomPropertyValue],
+    *,
+    default_branch: str | None = None,
+    default_branch_sha: str | None = None,
+    content_signals: DeepContentPayload,
+    registry_signals: RegistrySignals,
+    volatile_metrics: VolatileMetricsPayload,
+    volatile_metrics_fetched_at: str | None = None,
+    stars: int = 0,
+    forks: int = 0,
+) -> RepoEntry:
+    category = normalize_group_name(custom_properties.get("category"), DEFAULT_CATEGORY)
+    subcategory = normalize_group_name(
+        custom_properties.get("subcategory"),
+        DEFAULT_SUBCATEGORY,
+    )
+    return RepoEntry(
+        name=repository_name,
+        description=description or "(no description)",
+        category=category,
+        subcategory=subcategory,
+        default_branch=default_branch,
+        default_branch_sha=default_branch_sha,
+        content=DeepContentSignals(
+            is_bazel_repo=content_signals["is_bazel_repo"],
+            bazel_version=content_signals["bazel_version"],
+            codeowners=content_signals["codeowners"],
+            docs_as_code_version=content_signals["docs_as_code_version"],
+            referenced_by_reference_integration=bool(
+                content_signals.get("referenced_by_reference_integration", False)
+            ),
+            has_lint_config=content_signals["has_lint_config"],
+            has_gitlint_config=bool(content_signals.get("has_gitlint_config", False)),
+            has_pyproject_toml=bool(content_signals.get("has_pyproject_toml", False)),
+            has_pre_commit_config=bool(
+                content_signals.get("has_pre_commit_config", False)
+            ),
+            has_ci=content_signals["has_ci"],
+            uses_cicd_daily_workflow=content_signals["uses_cicd_daily_workflow"],
+            has_coverage_config=content_signals["has_coverage_config"],
+            top_languages=content_signals.get("top_languages", ()),
+            bazel_deps=content_signals.get("bazel_deps", ()),
+        ),
+        registry=registry_signals,
+        volatile=VolatileMetricsSnapshot(
+            last_push_date=volatile_metrics["last_push_date"],
+            merged_prs_30_days=volatile_metrics["merged_prs_30_days"],
+            open_issues=volatile_metrics["open_issues"],
+            open_prs=volatile_metrics["open_prs"],
+            open_ready_prs=volatile_metrics["open_ready_prs"],
+            open_draft_prs=volatile_metrics["open_draft_prs"],
+            latest_release_version=volatile_metrics["latest_release_version"],
+            latest_release_date=volatile_metrics["latest_release_date"],
+            commits_since_latest_release=volatile_metrics[
+                "commits_since_latest_release"
+            ],
+            release_bazel_version=volatile_metrics["release_bazel_version"],
+            release_bazel_deps=volatile_metrics["release_bazel_deps"],
+            volatile_metrics_fetched_at=volatile_metrics_fetched_at,
+        ),
+        stars=stars,
+        forks=forks,
+    )
+
+
+def should_reuse_cached_volatile_metrics(cached_entry: RepoEntry) -> bool:
+    fetched_at = parse_datetime_utc(cached_entry.volatile.volatile_metrics_fetched_at)
+    if fetched_at is None:
+        return False
+    ttl = resolve_volatile_metrics_ttl()
+    return datetime.now(UTC) - fetched_at <= ttl
+
+
+def build_registry_signals(
+    metadata: RegistrySignalsPayload | None,
+) -> RegistrySignals:
+    return RegistrySignals(
+        maintainers_in_bazel_registry=(
+            metadata.get("maintainers_in_bazel_registry")
+            if metadata is not None
+            else ()
+        ),
+        latest_bazel_registry_version=(
+            metadata.get("latest_bazel_registry_version")
+            if metadata is not None
+            else None
+        ),
+    )
+
+
+def resolve_volatile_metrics_ttl() -> timedelta:
+    raw_value = os.getenv(VOLATILE_METRICS_TTL_ENV, "").strip()
+    if not raw_value:
+        return timedelta(minutes=DEFAULT_VOLATILE_METRICS_TTL_MINUTES)
+
+    try:
+        parsed_minutes = int(raw_value)
+    except ValueError:
+        return timedelta(minutes=DEFAULT_VOLATILE_METRICS_TTL_MINUTES)
+
+    if parsed_minutes < 0:
+        return timedelta(minutes=DEFAULT_VOLATILE_METRICS_TTL_MINUTES)
+    return timedelta(minutes=parsed_minutes)
+
+
+def parse_datetime_utc(value: str | None) -> datetime | None:
+    if not value:
+        return None
+    try:
+        parsed = datetime.fromisoformat(value.replace("Z", "+00:00"))
+    except ValueError:
+        return None
+    if parsed.tzinfo is None:
+        return parsed.replace(tzinfo=UTC)
+    return parsed.astimezone(UTC)
+
+
+def normalize_group_name(value: str | list[str] | None, fallback: str) -> str:
+    if value is None:
+        return fallback
+    if isinstance(value, list):
+        cleaned = [item.strip() for item in value if item.strip()]
+        return ", ".join(cleaned) if cleaned else fallback
+    cleaned = value.strip()
+    return cleaned or fallback
+
+
+def get_default_branch_sha(repository: Any, default_branch: str | None) -> str | None:
+    if default_branch is None or not hasattr(repository, "get_branch"):
+        return None
+
+    try:
+        branch = repository.get_branch(default_branch)
+    except Exception:
+        return None
+    return cast("str | None", getattr(getattr(branch, "commit", None), "sha", None))
+
+
+def get_open_issue_count(repository: Any, *, open_pull_request_total: int) -> int:
+    count = getattr(repository, "open_issues_count", 0)
+    if not isinstance(count, int):
+        return 0
+    return max(count - open_pull_request_total, 0)
+
+
+def get_open_pull_request_counts(repository: Any) -> PullRequestCounts:
+    try:
+        pulls = repository.get_pulls(state="open")
+    except Exception:
+        return default_open_pull_request_counts()
+
+    try:
+        pull_requests = list(pulls)
+    except Exception:
+        return default_open_pull_request_counts()
+
+    draft_count = sum(
+        is_draft_pull_request(pull_request) for pull_request in pull_requests
+    )
+    total_count = len(pull_requests)
+    return {
+        "ready": total_count - draft_count,
+        "draft": draft_count,
+        "total": total_count,
+    }
+
+
+def get_merged_pull_request_count_last_30_days(
+    repository: Any,
+    *,
+    default_branch: str | None,
+) -> int:
+    if default_branch is None:
+        return 0
+
+    cutoff = datetime.now(UTC) - timedelta(days=MERGED_PULL_REQUEST_WINDOW_DAYS)
+    try:
+        pulls = repository.get_pulls(
+            state="closed",
+            sort="updated",
+            direction="desc",
+            base=default_branch,
+        )
+    except Exception:
+        return 0
+
+    count = 0
+    for pull_request in pulls:
+        updated_at = normalize_datetime_utc(getattr(pull_request, "updated_at", None))
+        # With descending `updated` ordering, once we pass the cutoff we can stop scanning.
+        if updated_at is not None and updated_at < cutoff:
+            break
+
+        base = getattr(pull_request, "base", None)
+        base_ref = getattr(base, "ref", None)
+        if isinstance(base_ref, str) and base_ref != default_branch:
+            continue
+
+        merged_at = normalize_datetime_utc(getattr(pull_request, "merged_at", None))
+        if merged_at is None or merged_at < cutoff:
+            continue
+        count += 1
+
+    return count
+
+
+def normalize_datetime_utc(value: object) -> datetime | None:
+    if not isinstance(value, datetime):
+        return None
+    # Treat naive timestamps as UTC so comparisons stay deterministic.
+    if value.tzinfo is None:
+        return value.replace(tzinfo=UTC)
+    return value.astimezone(UTC)
+
+
+def default_open_pull_request_counts() -> PullRequestCounts:
+    return {"ready": 0, "draft": 0, "total": 0}
+
+
+def is_draft_pull_request(pull_request: Any) -> bool:
+    draft: object
+    try:
+        draft = getattr(pull_request, "draft", None)
+    except Exception:
+        draft = None
+    if isinstance(draft, bool):
+        return draft
+
+    try:
+        raw_data = getattr(pull_request, "raw_data", None)
+    except Exception:
+        raw_data = None
+    if isinstance(raw_data, dict):
+        draft = cast("object", raw_data.get("draft"))
+        if isinstance(draft, bool):
+            return draft
+    return False
+
+
+def get_latest_release_details(
+    repository: Any,
+    *,
+    default_branch: str | None,
+    default_branch_sha: str | None,
+) -> LatestReleaseDetails:
+    if not hasattr(repository, "get_latest_release"):
+        return default_latest_release_details()
+    try:
+        release = repository.get_latest_release()
+    except Exception:
+        return default_latest_release_details()
+
+    release_tag = get_latest_release_version(release)
+    release_tree = fetch_repository_tree_paths(repository, ref=release_tag)
+    return {
+        "version": release_tag,
+        "date": get_release_date(release),
+        "commits_since_release": get_commits_since_release(
+            repository,
+            release=release,
+            default_branch=default_branch,
+            default_branch_sha=default_branch_sha,
+        ),
+        "release_bazel_version": detect_bazel_version(
+            repository,
+            tree_paths=release_tree,
+            ref=release_tag,
+        ),
+        "release_bazel_deps": detect_all_bazel_deps(
+            repository,
+            tree_paths=release_tree,
+            ref=release_tag,
+        ),
+    }
+
+
+def default_latest_release_details() -> LatestReleaseDetails:
+    return {
+        "version": None,
+        "date": None,
+        "commits_since_release": None,
+        "release_bazel_version": None,
+        "release_bazel_deps": (),
+    }
+
+
+def get_latest_release_version(release: object) -> str | None:
+    try:
+        raw_data = getattr(release, "raw_data", None)
+    except Exception:
+        raw_data = None
+    if isinstance(raw_data, dict):
+        raw_data = cast("dict[str, object]", raw_data)
+        for key in ("tag_name", "name"):
+            value = raw_data.get(key)
+            if isinstance(value, str):
+                cleaned = value.strip()
+                if cleaned:
+                    return cleaned
+
+    for attribute_name in ("name", "title"):
+        try:
+            value = getattr(release, attribute_name, None)
+        except Exception:
+            continue
+        if isinstance(value, str):
+            cleaned = value.strip()
+            if cleaned and cleaned.casefold() != "latest":
+                return cleaned
+    return None
+
+
+def get_release_date(release: object) -> str | None:
+    try:
+        return iso_date(getattr(release, "published_at", None))
+    except Exception:
+        return None
+
+
+def get_commits_since_release(
+    repository: Any,
+    *,
+    release: Any,
+    default_branch: str | None,
+    default_branch_sha: str | None,
+) -> int | None:
+    if not hasattr(repository, "compare"):
+        return None
+
+    release_tag = get_latest_release_version(release)
+    head_ref = default_branch_sha or default_branch
+    if release_tag is None or head_ref is None:
+        return None
+
+    try:
+        comparison = repository.compare(release_tag, head_ref)
+    except Exception:
+        return None
+
+    try:
+        total_commits = getattr(comparison, "total_commits", None)
+        if isinstance(total_commits, int):
+            return total_commits
+
+        total_commits = getattr(comparison, "totalCommits", None)
+        return total_commits if isinstance(total_commits, int) else None
+    except Exception:
+        return None
+
+
+def iso_date(value: object) -> str | None:
+    if isinstance(value, datetime):
+        return value.date().isoformat()
+    if isinstance(value, date):
+        return value.isoformat()
+    return None
diff --git a/src/generate_repo_overview/collector/signal_detection.py b/src/generate_repo_overview/collector/signal_detection.py
new file mode 100644
index 0000000..8d838e3
--- /dev/null
+++ b/src/generate_repo_overview/collector/signal_detection.py
@@ -0,0 +1,394 @@
+from __future__ import annotations
+
+import fnmatch
+import re
+from typing import Any, TypedDict
+
+
+class DeepContentPayload(TypedDict):
+    is_bazel_repo: bool
+    bazel_version: str | None
+    codeowners: tuple[str, ...]
+    docs_as_code_version: str | None
+    referenced_by_reference_integration: bool
+    has_gitlint_config: bool
+    has_pyproject_toml: bool
+    has_pre_commit_config: bool
+    has_lint_config: bool
+    has_ci: bool
+    uses_cicd_daily_workflow: bool
+    has_coverage_config: bool
+    top_languages: tuple[str, ...]
+    bazel_deps: tuple[tuple[str, str], ...]
+
+
+GITLINT_PATHS = (".gitlint",)
+PYPROJECT_PATHS = ("pyproject.toml",)
+PRE_COMMIT_PATHS = (".pre-commit-config.yaml",)
+LINT_CONFIG_PATHS = GITLINT_PATHS + PRE_COMMIT_PATHS
+CI_PATHS = (".github/workflows",)
+COVERAGE_PATHS = ("coverage.yml", "coverage.xml", "pytest.ini", ".coveragerc")
+BAZEL_VERSION_PATHS = (".bazelversion",)
+MODULE_PATHS = ("MODULE.bazel",)
+BAZEL_REPO_MARKER_PATHS = (
+    BAZEL_VERSION_PATHS
+    + MODULE_PATHS
+    + (
+        "WORKSPACE",
+        "WORKSPACE.bazel",
+    )
+)
+CODEOWNERS_PATH = ".github/CODEOWNERS"
+WORKFLOW_PATH_PREFIX = ".github/workflows/"
+WORKFLOW_FILE_SUFFIXES = (".yml", ".yaml")
+DAILY_WORKFLOW_REFERENCE = "cicd-workflows/.github/workflows/daily.yml@"
+BAZEL_DEP_PATTERN_TEMPLATE = (
+    r'\bbazel_dep\s*\(\s*name\s*=\s*"{module_name}"(?P<body>.*?)\)'
+)
+VERSION_PATTERN = re.compile(r'\bversion\s*=\s*"(?P<version>[^"]+)"')
+
+
+def inspect_repository_content_slow(
+    repository: Any,
+    *,
+    ref: str | None,
+) -> DeepContentPayload:
+    """Run slow deep content inspection using repository tree and file reads."""
+    tree_paths = fetch_repository_tree_paths(repository, ref=ref)
+    if not tree_paths:
+        return default_content_signals()
+
+    return {
+        "is_bazel_repo": detect_is_bazel_repo(tree_paths),
+        "bazel_version": detect_bazel_version(
+            repository,
+            tree_paths=tree_paths,
+            ref=ref,
+        ),
+        "codeowners": detect_codeowners(
+            repository,
+            tree_paths=tree_paths,
+            ref=ref,
+        ),
+        "docs_as_code_version": detect_dependency_version(
+            repository,
+            tree_paths=tree_paths,
+            ref=ref,
+            module_name="score_docs_as_code",
+        ),
+        "bazel_deps": detect_all_bazel_deps(
+            repository,
+            tree_paths=tree_paths,
+            ref=ref,
+        ),
+        "referenced_by_reference_integration": False,
+        "has_gitlint_config": any(
+            tree_contains_path(tree_paths, path) for path in GITLINT_PATHS
+        ),
+        "has_pyproject_toml": any(
+            tree_contains_path(tree_paths, path) for path in PYPROJECT_PATHS
+        ),
+        "has_pre_commit_config": any(
+            tree_contains_path(tree_paths, path) for path in PRE_COMMIT_PATHS
+        ),
+        "has_lint_config": any(
+            tree_contains_path(tree_paths, path) for path in LINT_CONFIG_PATHS
+        ),
+        "has_ci": any(tree_contains_path(tree_paths, path) for path in CI_PATHS),
+        "uses_cicd_daily_workflow": uses_cicd_daily_workflow(
+            repository,
+            tree_paths=tree_paths,
+            ref=ref,
+        ),
+        "has_coverage_config": any(
+            tree_contains_path(tree_paths, path) for path in COVERAGE_PATHS
+        ),
+        "top_languages": detect_top_languages(repository, n=3),
+    }
+
+
+def default_content_signals() -> DeepContentPayload:
+    return {
+        "is_bazel_repo": False,
+        "bazel_version": None,
+        "codeowners": (),
+        "docs_as_code_version": None,
+        "bazel_deps": (),
+        "referenced_by_reference_integration": False,
+        "has_gitlint_config": False,
+        "has_pyproject_toml": False,
+        "has_pre_commit_config": False,
+        "has_lint_config": False,
+        "has_ci": False,
+        "uses_cicd_daily_workflow": False,
+        "has_coverage_config": False,
+        "top_languages": (),
+    }
+
+
+def detect_top_languages(repository: Any, *, n: int = 3) -> tuple[str, ...]:
+    try:
+        langs: object = repository.get_languages()
+    except Exception:
+        return ()
+    if not isinstance(langs, dict):
+        return ()
+    sorted_langs = sorted(
+        ((lang, count) for lang, count in langs.items() if isinstance(count, int)),
+        key=lambda x: x[1],
+        reverse=True,
+    )
+    return tuple(lang for lang, _ in sorted_langs[:n] if isinstance(lang, str))
+
+
+def fetch_repository_tree_paths(repository: Any, *, ref: str | None) -> set[str]:
+    if ref is None or not hasattr(repository, "get_git_tree"):
+        return set()
+
+    try:
+        tree = repository.get_git_tree(ref, recursive=True)
+    except Exception:
+        return set()
+
+    return {
+        path
+        for item in getattr(tree, "tree", [])
+        if isinstance((path := getattr(item, "path", None)), str)
+    }
+
+
+def tree_contains_path(tree_paths: set[str], candidate: str) -> bool:
+    if candidate in tree_paths:
+        return True
+    prefix = f"{candidate}/"
+    return any(path.startswith(prefix) for path in tree_paths)
+
+
+def detect_bazel_version(
+    repository: Any,
+    *,
+    tree_paths: set[str],
+    ref: str | None,
+) -> str | None:
+    for candidate in BAZEL_VERSION_PATHS:
+        if not tree_contains_path(tree_paths, candidate):
+            continue
+        content = fetch_text_file(repository, candidate, ref=ref)
+        version = first_non_comment_line(content)
+        if version:
+            return version
+
+    return None
+
+
+def detect_is_bazel_repo(tree_paths: set[str]) -> bool:
+    return any(
+        tree_contains_path(tree_paths, candidate)
+        for candidate in BAZEL_REPO_MARKER_PATHS
+    )
+
+
+def detect_dependency_version(
+    repository: Any,
+    *,
+    tree_paths: set[str],
+    ref: str | None,
+    module_name: str,
+) -> str | None:
+    for candidate in MODULE_PATHS:
+        if not tree_contains_path(tree_paths, candidate):
+            continue
+        content = fetch_text_file(repository, candidate, ref=ref)
+        version = get_bazel_dep_version(content, module_name=module_name)
+        if version:
+            return version
+
+    return None
+
+
+def detect_all_bazel_deps(
+    repository: Any,
+    *,
+    tree_paths: set[str],
+    ref: str | None,
+) -> tuple[tuple[str, str], ...]:
+    for candidate in MODULE_PATHS:
+        if not tree_contains_path(tree_paths, candidate):
+            continue
+        content = fetch_text_file(repository, candidate, ref=ref)
+        return get_all_bazel_dep_versions(content)
+    return ()
+
+
+def detect_codeowners(
+    repository: Any,
+    *,
+    tree_paths: set[str],
+    ref: str | None,
+) -> tuple[str, ...]:
+    if not tree_contains_path(tree_paths, CODEOWNERS_PATH):
+        return ()
+
+    content = fetch_text_file(repository, CODEOWNERS_PATH, ref=ref)
+    return get_codeowners_for_path(content, target_path=CODEOWNERS_PATH)
+
+
+def get_codeowners_for_path(
+    text: str | None,
+    *,
+    target_path: str,
+) -> tuple[str, ...]:
+    if not text:
+        return ()
+
+    owners: tuple[str, ...] = ()
+    for raw_line in text.splitlines():
+        line = raw_line.split("#", maxsplit=1)[0].strip()
+        if not line:
+            continue
+
+        parts = line.split()
+        if len(parts) < 2:
+            continue
+
+        pattern, *candidate_owners = parts
+        if codeowners_pattern_matches(pattern, target_path=target_path):
+            owners = normalize_codeowners(candidate_owners)
+
+    return owners
+
+
+def codeowners_pattern_matches(pattern: str, *, target_path: str) -> bool:
+    normalized_pattern = pattern.lstrip("/")
+    normalized_target_path = target_path.lstrip("/")
+
+    if pattern == "/":
+        return True
+    if normalized_pattern in {"*", "**", "/*"}:
+        return True
+
+    if normalized_pattern.endswith("/"):
+        directory_pattern = normalized_pattern.rstrip("/")
+        return (
+            normalized_target_path == directory_pattern
+            or normalized_target_path.startswith(f"{directory_pattern}/")
+        )
+
+    if "/" not in normalized_pattern:
+        # Bare patterns can match either the basename or the full path, mirroring CODEOWNERS behavior.
+        return fnmatch.fnmatch(
+            normalized_target_path.rsplit("/", maxsplit=1)[-1],
+            normalized_pattern,
+        ) or fnmatch.fnmatch(normalized_target_path, normalized_pattern)
+
+    return fnmatch.fnmatch(normalized_target_path, normalized_pattern)
+
+
+def get_bazel_dep_version(text: str | None, *, module_name: str) -> str | None:
+    if not text:
+        return None
+
+    pattern = re.compile(
+        BAZEL_DEP_PATTERN_TEMPLATE.format(module_name=re.escape(module_name)),
+        re.DOTALL,
+    )
+    match = pattern.search(text)
+    if match is None:
+        return None
+
+    version_match = VERSION_PATTERN.search(match.group("body"))
+    if version_match is None:
+        return None
+
+    version = version_match.group("version").strip()
+    return version or None
+
+
+def get_all_bazel_dep_versions(text: str | None) -> tuple[tuple[str, str], ...]:
+    if not text:
+        return ()
+
+    name_pattern = re.compile(r'\bname\s*=\s*"(?P<name>[^"]+)"')
+    bazel_dep_re = re.compile(
+        r'\bbazel_dep\s*\((?P<body>.*?)\)',
+        re.DOTALL,
+    )
+    result: list[tuple[str, str]] = []
+    for match in bazel_dep_re.finditer(text):
+        body = match.group("body")
+        name_match = name_pattern.search(body)
+        version_match = VERSION_PATTERN.search(body)
+        if name_match is None or version_match is None:
+            continue
+        name = name_match.group("name").strip()
+        version = version_match.group("version").strip()
+        if name and version:
+            result.append((name, version))
+
+    return tuple(sorted(result, key=lambda x: x[0]))
+
+
+def uses_cicd_daily_workflow(
+    repository: Any,
+    *,
+    tree_paths: set[str],
+    ref: str | None,
+) -> bool:
+    workflow_paths = sorted(
+        path
+        for path in tree_paths
+        if path.startswith(WORKFLOW_PATH_PREFIX)
+        and path.endswith(WORKFLOW_FILE_SUFFIXES)
+    )
+    for workflow_path in workflow_paths:
+        content = fetch_text_file(repository, workflow_path, ref=ref)
+        if content is None:
+            continue
+        if DAILY_WORKFLOW_REFERENCE in content:
+            return True
+    return False
+
+
+def fetch_text_file(repository: Any, path: str, *, ref: str | None) -> str | None:
+    if not hasattr(repository, "get_contents"):
+        return None
+
+    try:
+        if ref is None:
+            content = repository.get_contents(path)
+        else:
+            content = repository.get_contents(path, ref=ref)
+    except Exception:
+        return None
+
+    raw_content = getattr(content, "decoded_content", None)
+    if not isinstance(raw_content, (bytes, bytearray)):
+        return None
+    return raw_content.decode("utf-8", errors="replace")
+
+
+def normalize_codeowners(values: list[str]) -> tuple[str, ...]:
+    return dedupe_preserving_order(" ".join(values).replace(",", " ").split())
+
+
+def dedupe_preserving_order(values: list[str]) -> tuple[str, ...]:
+    seen: set[str] = set()
+    deduped: list[str] = []
+    for value in values:
+        cleaned = value.strip()
+        if not cleaned or cleaned in seen:
+            continue
+        seen.add(cleaned)
+        deduped.append(cleaned)
+    return tuple(deduped)
+
+
+def first_non_comment_line(text: str | None) -> str | None:
+    if not text:
+        return None
+    for line in text.splitlines():
+        stripped = line.strip()
+        if not stripped or stripped.startswith("#"):
+            continue
+        return stripped
+    return None
diff --git a/src/generate_repo_overview/collector/snapshot_io.py b/src/generate_repo_overview/collector/snapshot_io.py
new file mode 100644
index 0000000..75500ea
--- /dev/null
+++ b/src/generate_repo_overview/collector/snapshot_io.py
@@ -0,0 +1,34 @@
+from __future__ import annotations
+
+import json
+from typing import TYPE_CHECKING
+
+from generate_repo_overview.models import RepoSnapshot
+
+if TYPE_CHECKING:
+    from pathlib import Path
+
+
+def load_snapshot(path: Path) -> RepoSnapshot:
+    raw = json.loads(path.read_text(encoding="utf-8"))
+    if not isinstance(raw, dict):
+        raise ValueError("Snapshot file must contain a JSON object.")
+    return RepoSnapshot.from_dict(raw)
+
+
+def load_snapshot_if_present(path: Path) -> RepoSnapshot | None:
+    if not path.exists():
+        return None
+    try:
+        return load_snapshot(path)
+    except (OSError, ValueError, json.JSONDecodeError):
+        return None
+
+
+def write_snapshot(snapshot: RepoSnapshot, path: Path) -> None:
+    path.parent.mkdir(parents=True, exist_ok=True)
+    payload = snapshot.to_dict()
+    path.write_text(
+        json.dumps(payload, indent=2, sort_keys=True) + "\n",
+        encoding="utf-8",
+    )
diff --git a/src/generate_repo_overview/console.py b/src/generate_repo_overview/console.py
new file mode 100644
index 0000000..62ed6fb
--- /dev/null
+++ b/src/generate_repo_overview/console.py
@@ -0,0 +1,7 @@
+from __future__ import annotations
+
+import sys
+
+
+def print_status(message: str, *, prefix: str = "repo-overview") -> None:
+    print(f"[{prefix}] {message}", file=sys.stderr)
diff --git a/src/generate_repo_overview/constants.py b/src/generate_repo_overview/constants.py
new file mode 100644
index 0000000..b3b3e34
--- /dev/null
+++ b/src/generate_repo_overview/constants.py
@@ -0,0 +1,9 @@
+from __future__ import annotations
+
+from pathlib import Path
+
+DEFAULT_ORG = "eclipse-score"
+DEFAULT_OUTPUT = Path("profile/README.md")
+DEFAULT_METRICS_HTML_OUTPUT = Path("_site")
+DEFAULT_CACHE = Path("profile/cache/repo_overview.json")
+DEFAULT_TOKEN_ENV = "GITHUB_TOKEN"
diff --git a/src/generate_repo_overview/metrics_html.py b/src/generate_repo_overview/metrics_html.py
new file mode 100644
index 0000000..96626c8
--- /dev/null
+++ b/src/generate_repo_overview/metrics_html.py
@@ -0,0 +1,25 @@
+from __future__ import annotations
+
+from typing import TYPE_CHECKING
+
+from ._html_detail import render_detail_page
+from ._html_index import render_index_page
+from .metrics_report import get_latest_docs_as_code_release, get_max_bazel_version
+
+if TYPE_CHECKING:
+    from .models import RepoSnapshot
+
+
+def render_all_pages(snapshot: RepoSnapshot) -> dict[str, str]:
+    repos = sorted(snapshot.repos, key=lambda r: r.name.casefold())
+    max_bazel = get_max_bazel_version(list(repos))
+    latest_dac = get_latest_docs_as_code_release(list(repos))
+
+    pages: dict[str, str] = {
+        "index.html": render_index_page(snapshot),
+    }
+    for entry in repos:
+        pages[f"{entry.name}/index.html"] = render_detail_page(
+            entry, snapshot.org_name, snapshot, max_bazel, latest_dac
+        )
+    return pages
diff --git a/src/generate_repo_overview/metrics_report.py b/src/generate_repo_overview/metrics_report.py
new file mode 100644
index 0000000..57256ff
--- /dev/null
+++ b/src/generate_repo_overview/metrics_report.py
@@ -0,0 +1,402 @@
+from __future__ import annotations
+
+import re
+from typing import TYPE_CHECKING
+
+from ._text_utils import escape_markdown_table_cell
+
+if TYPE_CHECKING:
+    from collections.abc import Callable
+
+    from .models import RepoEntry, RepoSnapshot
+
+
+HANDLE_PATTERN = re.compile(r"@[A-Za-z0-9_.-]+(?:/[A-Za-z0-9_.-]+)?")
+BAZEL_ICON_URL = "https://bazel.build/_pwa/bazel/icons/icon-72x72.png"
+
+
+def render_metrics_report(snapshot: RepoSnapshot) -> str:
+    repos = sorted(snapshot.repos, key=lambda repo: repo.name.casefold())
+    lines = [
+        "# Cross-Repo Metrics Report",
+        "",
+        f"Generated on {snapshot.generated_at}",
+        "",
+        *render_summary(repos),
+        "",
+        "## Table Of Contents",
+        "",
+        "- [Repository Overview](#repository-overview)",
+        "- [Versions](#versions)",
+        "- [Delivery And Automation](#delivery-and-automation)",
+        "",
+    ]
+    lines.extend(render_overview_section(repos, org_name=snapshot.org_name))
+    lines.extend(render_versions_section(repos, org_name=snapshot.org_name))
+    lines.extend(render_automation_section(repos, org_name=snapshot.org_name))
+    return "\n".join(lines).rstrip() + "\n"
+
+
+def render_summary(repos: list[RepoEntry]) -> list[str]:
+    return [
+        f"- Repositories: {len(repos)}",
+        f"- With GitHub Actions: {sum(repo.content.has_ci for repo in repos)}",
+        f"- Using daily workflow: {sum(repo.content.uses_cicd_daily_workflow for repo in repos)}",
+        f"- With lint/style config: {sum(repo.content.has_lint_config for repo in repos)}",
+        f"- With coverage config: {sum(repo.content.has_coverage_config for repo in repos)}",
+        f"- With releases: {sum(has_latest_release(repo) for repo in repos)}",
+    ]
+
+
+def render_overview_section(repos: list[RepoEntry], org_name: str) -> list[str]:
+    lines = [
+        "## Repository Overview",
+        "",
+        "- `Open Issues / PRs`: open issues only and open pull requests as `issues / ready+draft`.",
+        "- `Merged PRs (30d)`: pull requests merged into each repository's default branch within the last 30 days (`>= 10` is marked `🔥`).",
+        "- `Bazel`: icon shown next to the repository name when the repo contains `.bazelversion`, `MODULE.bazel`, `WORKSPACE`, or `WORKSPACE.bazel`.",
+        "- `Latest Release`: release tag name, falling back to the release name when needed.",
+        "- `Commits Since Release`: compare the latest release tag to current default branch head.",
+        "- Icons: `🟢` healthy, `🟡` caution, `🔴` alert.",
+        "- `Codeowners`: owners resolved for the `.github/CODEOWNERS` path from that repository's `.github/CODEOWNERS` file.",
+        "- `Maintainers In Bazel Registry`: shown only for bazel repos when handles are available.",
+        "",
+    ]
+    lines.extend(
+        render_category_tables(
+            repos,
+            org_name=org_name,
+            header="| Repository | Ownership | Merged PRs (30d) | Open Issues / PRs (ready+draft) | Latest Release + Commits Since Release | Stars / Forks |",
+            divider="|------------|-----------|------------------|-------------------------------|----------------------------------------|---------------|",
+            row_renderer=render_overview_row,
+        )
+    )
+    return lines
+
+
+def render_versions_section(repos: list[RepoEntry], org_name: str) -> list[str]:
+    latest_docs_as_code_release = get_latest_docs_as_code_release(repos)
+    max_bazel_version = get_max_bazel_version(repos)
+
+    def render_row(entry: RepoEntry, *, org_name: str) -> str:
+        return render_versions_row(
+            entry,
+            org_name=org_name,
+            max_bazel_version=max_bazel_version,
+            latest_docs_as_code_release=latest_docs_as_code_release,
+        )
+
+    lines = [
+        "## Versions",
+        "",
+        "- Generic view of repository version signals.",
+        '- `Docs-As-Code Version`: `version = "..."` for `bazel_dep(name = "score_docs_as_code", ...)` in the repository root `MODULE.bazel`.',
+        "- `Reference Integration`: `yes` when the repository is a direct `bazel_dep(...)` in `reference_integration`'s root `MODULE.bazel` or included module files.",
+        "- `Bazel Version`: highest version in the table is `🟢`; every other value is `🔴`.",
+        "- `Docs-As-Code Version`: `⚪` if missing, `🟢` if equal to latest docs-as-code release, `🟡` if same major.minor, else `🔴`.",
+        "",
+    ]
+    lines.extend(
+        render_category_tables(
+            repos,
+            org_name=org_name,
+            header=f"| Repository | {render_bazel_version_column_header()} | Docs-As-Code Version | Reference Integration |",
+            divider="|------------|---------------|----------------------|-----------------------|",
+            row_renderer=render_row,
+        )
+    )
+    return lines
+
+
+def render_automation_section(repos: list[RepoEntry], org_name: str) -> list[str]:
+    lines = [
+        "## Delivery And Automation",
+        "",
+        "- `🔍 Gitlint`: shown when `.gitlint` exists.",
+        "- `🐍 Pyproject`: shown when `pyproject.toml` exists.",
+        "- `🪝 Pre-commit`: shown when `.pre-commit-config.yaml` exists.",
+        "- `⚙ GitHub Actions`: shown when `.github/workflows` exists.",
+        "- `Daily Workflow`: `yes` if any workflow file references `cicd-workflows/.github/workflows/daily.yml@...`.",
+        "- `Coverage Config`: `yes` if `coverage.yml`, `coverage.xml`, `pytest.ini`, or `.coveragerc` exists.",
+        "",
+    ]
+    lines.extend(
+        render_category_tables(
+            repos,
+            org_name=org_name,
+            header="| Repository | 🔍 Gitlint | 🐍 Pyproject | 🪝 Pre-commit | ⚙ GitHub Actions | Daily Workflow | Coverage Config |",
+            divider="|------------|------------|-------------|---------------|------------------|----------------|-----------------|",
+            row_renderer=render_automation_row,
+        )
+    )
+    return lines
+
+
+def render_category_tables(
+    repos: list[RepoEntry],
+    *,
+    org_name: str,
+    header: str,
+    divider: str,
+    row_renderer: Callable[..., str],
+    heading_level: int = 3,
+) -> list[str]:
+    lines: list[str] = []
+    heading_prefix = "#" * heading_level
+    for category, category_repos in group_repos_by_category(repos):
+        lines.extend(
+            [
+                f"{heading_prefix} {category}",
+                "",
+                header,
+                divider,
+            ]
+        )
+        for repo in category_repos:
+            lines.append(row_renderer(repo, org_name=org_name))
+        lines.append("")
+    return lines
+
+
+def group_repos_by_category(
+    repos: list[RepoEntry],
+) -> list[tuple[str, list[RepoEntry]]]:
+    grouped: dict[str, list[RepoEntry]] = {}
+    for repo in repos:
+        grouped.setdefault(repo.category, []).append(repo)
+
+    return [
+        (category, sorted(category_repos, key=lambda repo: repo.name.casefold()))
+        for category, category_repos in sorted(
+            grouped.items(), key=lambda item: item[0].casefold()
+        )
+    ]
+
+
+def render_overview_row(entry: RepoEntry, *, org_name: str) -> str:
+    url = f"https://github.com/{org_name}/{entry.name}"
+    return (
+        f"| {render_repo_link_with_bazel_icon(entry, url)} | {render_ownership_cell(entry)} | "
+        f"{render_merged_pr_count(entry.volatile.merged_prs_30_days)} | "
+        f"{render_open_issues_and_prs(entry.volatile.open_issues, entry.volatile.open_ready_prs, entry.volatile.open_draft_prs)} | "
+        f"{render_release_and_commits(entry.volatile.latest_release_version, entry.volatile.commits_since_latest_release)} | "
+        f"{entry.stars} / {entry.forks} |"
+    )
+
+
+def render_repo_link_with_bazel_icon(entry: RepoEntry, url: str) -> str:
+    repo_link = f"[{entry.name}]({url})"
+    if entry.content.is_bazel_repo:
+        return f"{repo_link} {render_bazel_icon()}"
+    return repo_link
+
+
+def render_open_issues_and_prs(
+    open_issues: int, open_ready_prs: int, open_draft_prs: int
+) -> str:
+    return f"{open_issues} / {render_ready_pr_count(open_ready_prs)}+{open_draft_prs}"
+
+
+def render_release_and_commits(
+    latest_release_version: str | None, commits_since_release: int | None
+) -> str:
+    latest_release = render_plain_value(latest_release_version)
+    commits = render_commits_since_release(commits_since_release)
+    if latest_release == "-" and commits == "-":
+        return "-"
+    return f"{latest_release} + {commits}"
+
+
+def render_versions_row(
+    entry: RepoEntry,
+    *,
+    org_name: str,
+    max_bazel_version: tuple[int, ...] | None,
+    latest_docs_as_code_release: str | None,
+) -> str:
+    url = f"https://github.com/{org_name}/{entry.name}"
+    return (
+        f"| [{entry.name}]({url}) | {render_bazel_version_status(entry.content.bazel_version, max_bazel_version)} | "
+        f"{render_docs_as_code_version_status(entry.content.docs_as_code_version, latest_docs_as_code_release)} | "
+        f"{render_bool(entry.content.referenced_by_reference_integration)} |"
+    )
+
+
+def render_automation_row(entry: RepoEntry, *, org_name: str) -> str:
+    url = f"https://github.com/{org_name}/{entry.name}"
+    return (
+        f"| [{entry.name}]({url}) | {render_presence(entry.content.has_gitlint_config, icon='🔍')} | "
+        f"{render_presence(entry.content.has_pyproject_toml, icon='🐍')} | "
+        f"{render_presence(entry.content.has_pre_commit_config, icon='🪝')} | "
+        f"{render_presence(entry.content.has_ci, icon='⚙')} | "
+        f"{render_bool(entry.content.uses_cicd_daily_workflow)} | "
+        f"{render_bool(entry.content.has_coverage_config)} |"
+    )
+
+
+def render_bool(value: bool) -> str:
+    return "yes" if value else "no"
+
+
+def render_plain_value(value: str | None) -> str:
+    if value is None or not value.strip():
+        return "-"
+    return escape_markdown_table_cell(value.strip())
+
+
+def render_ready_pr_count(value: int) -> str:
+    if value > 5:
+        return f"🔴 {value}"
+    return str(value)
+
+
+def render_merged_pr_count(value: int) -> str:
+    if value >= 10:
+        return f"🔥 {value}"
+    return str(value)
+
+
+def render_commits_since_release(value: int | None) -> str:
+    if value is None:
+        return "-"
+    if value == 0:
+        return "🟢 0"
+    if value <= 20:
+        return f"🟡 {value}"
+    return f"🔴 {value}"
+
+
+def render_bazel_version_column_header() -> str:
+    return f"{render_bazel_icon()} Bazel Version"
+
+
+def render_bazel_icon() -> str:
+    return f'<img src="{BAZEL_ICON_URL}" alt="Bazel" width="16" height="16">'
+
+
+def render_presence(value: bool, *, icon: str) -> str:
+    return icon if value else "-"
+
+
+def render_ownership_cell(entry: RepoEntry) -> str:
+    codeowners = render_people_list(entry.content.codeowners, handles_only=True)
+    lines: list[str] = []
+    if codeowners != "-":
+        lines.append(f"Codeowners: {codeowners}")
+
+    if entry.content.is_bazel_repo:
+        maintainers = render_people_list(
+            entry.registry.maintainers_in_bazel_registry,
+            handles_only=True,
+        )
+        if maintainers != "-":
+            lines.append(f"Maintainers In Bazel Registry: {maintainers}")
+
+    if not lines:
+        return "-"
+
+    return f"<small><sub><small>{'<br><br>'.join(lines)}</small></sub></small>"
+
+
+def render_people_list(values: tuple[str, ...], *, handles_only: bool = False) -> str:
+    if not values:
+        return "-"
+
+    cleaned_values = values
+    if handles_only:
+        handles: list[str] = []
+        for value in values:
+            handles.extend(extract_handles(value))
+        cleaned_values = tuple(dict.fromkeys(handles))
+
+    if not cleaned_values:
+        return "-"
+
+    return escape_markdown_table_cell(", ".join(cleaned_values))
+
+
+def extract_handles(value: str) -> list[str]:
+    return HANDLE_PATTERN.findall(value)
+
+
+def parse_version_key(value: str | None) -> tuple[int, ...] | None:
+    if value is None:
+        return None
+    numeric_parts = re.findall(r"\d+", value)
+    if not numeric_parts:
+        return None
+    return tuple(int(part) for part in numeric_parts[:3])
+
+
+def get_max_bazel_version(repos: list[RepoEntry]) -> tuple[int, ...] | None:
+    keys = [
+        key
+        for repo in repos
+        if (key := parse_version_key(repo.content.bazel_version)) is not None
+    ]
+    return max(keys) if keys else None
+
+
+def get_latest_docs_as_code_release(repos: list[RepoEntry]) -> str | None:
+    for repo in repos:
+        if repo.name.casefold() != "docs-as-code":
+            continue
+        if repo.volatile.latest_release_version is None:
+            return None
+        return repo.volatile.latest_release_version.removeprefix("v").strip() or None
+    return None
+
+
+def render_bazel_version_status(
+    bazel_version: str | None,
+    max_bazel_version: tuple[int, ...] | None,
+) -> str:
+    if bazel_version is None or not bazel_version.strip():
+        return "⚪ -"
+
+    cleaned = bazel_version.strip()
+    parsed = parse_version_key(cleaned)
+    if (
+        parsed is not None
+        and max_bazel_version is not None
+        and parsed == max_bazel_version
+    ):
+        return f"🟢 {escape_markdown_table_cell(cleaned)}"
+    return f"🔴 {escape_markdown_table_cell(cleaned)}"
+
+
+def major_minor(version: str) -> tuple[int, int] | None:
+    parsed = parse_version_key(version)
+    if parsed is None or len(parsed) < 2:
+        return None
+    return (parsed[0], parsed[1])
+
+
+def render_docs_as_code_version_status(
+    docs_as_code_version: str | None,
+    latest_docs_as_code_release: str | None,
+) -> str:
+    if docs_as_code_version is None or not docs_as_code_version.strip():
+        return "⚪ -"
+
+    cleaned = docs_as_code_version.strip()
+    if latest_docs_as_code_release is None:
+        return f"⚪ {escape_markdown_table_cell(cleaned)}"
+
+    latest_cleaned = latest_docs_as_code_release.strip()
+    if cleaned == latest_cleaned:
+        return f"🟢 {escape_markdown_table_cell(cleaned)}"
+
+    cleaned_major_minor = major_minor(cleaned)
+    latest_major_minor = major_minor(latest_cleaned)
+    if cleaned_major_minor is not None and cleaned_major_minor == latest_major_minor:
+        return f"🟡 {escape_markdown_table_cell(cleaned)}"
+
+    return f"🔴 {escape_markdown_table_cell(cleaned)}"
+
+
+def has_latest_release(entry: RepoEntry) -> bool:
+    return (
+        entry.volatile.latest_release_version is not None
+        or entry.volatile.latest_release_date is not None
+    )
diff --git a/src/generate_repo_overview/models.py b/src/generate_repo_overview/models.py
new file mode 100644
index 0000000..f9e6513
--- /dev/null
+++ b/src/generate_repo_overview/models.py
@@ -0,0 +1,258 @@
+from __future__ import annotations
+
+from dataclasses import asdict, dataclass, field
+from typing import TYPE_CHECKING, Any, cast
+
+if TYPE_CHECKING:
+    from collections.abc import Mapping
+
+DEFAULT_CATEGORY = "Uncategorized"
+DEFAULT_SUBCATEGORY = "General"
+SNAPSHOT_SCHEMA_VERSION = 14
+
+
+@dataclass(frozen=True, slots=True)
+class DeepContentSignals:
+    """Deep, slow-to-collect content signals from default-branch tree inspection."""
+
+    is_bazel_repo: bool = False
+    bazel_version: str | None = None
+    codeowners: tuple[str, ...] = ()
+    docs_as_code_version: str | None = None
+    referenced_by_reference_integration: bool = False
+    has_lint_config: bool = False
+    has_gitlint_config: bool = False
+    has_pyproject_toml: bool = False
+    has_pre_commit_config: bool = False
+    has_ci: bool = False
+    uses_cicd_daily_workflow: bool = False
+    has_coverage_config: bool = False
+    top_languages: tuple[str, ...] = ()
+    bazel_deps: tuple[tuple[str, str], ...] = ()
+
+    @classmethod
+    def from_dict(cls, data: Mapping[str, Any]) -> DeepContentSignals:
+        return cls(
+            is_bazel_repo=bool(data.get("is_bazel_repo", False)),
+            bazel_version=cast("str | None", data.get("bazel_version")),
+            codeowners=normalize_string_tuple(data.get("codeowners")),
+            docs_as_code_version=cast("str | None", data.get("docs_as_code_version")),
+            referenced_by_reference_integration=bool(
+                data.get("referenced_by_reference_integration", False)
+            ),
+            has_lint_config=bool(data.get("has_lint_config", False)),
+            has_gitlint_config=bool(data.get("has_gitlint_config", False)),
+            has_pyproject_toml=bool(data.get("has_pyproject_toml", False)),
+            has_pre_commit_config=bool(data.get("has_pre_commit_config", False)),
+            has_ci=bool(data.get("has_ci", False)),
+            uses_cicd_daily_workflow=bool(data.get("uses_cicd_daily_workflow", False)),
+            has_coverage_config=bool(data.get("has_coverage_config", False)),
+            top_languages=normalize_string_tuple(data.get("top_languages")),
+            bazel_deps=normalize_string_pairs(data.get("bazel_deps")),
+        )
+
+
+@dataclass(frozen=True, slots=True)
+class RegistrySignals:
+    """Registry-sourced signals collected from shared bazel registry metadata."""
+
+    maintainers_in_bazel_registry: tuple[str, ...] = ()
+    latest_bazel_registry_version: str | None = None
+
+    @classmethod
+    def from_dict(cls, data: Mapping[str, Any]) -> RegistrySignals:
+        return cls(
+            maintainers_in_bazel_registry=normalize_string_tuple(
+                data.get("maintainers_in_bazel_registry")
+            ),
+            latest_bazel_registry_version=cast(
+                "str | None",
+                data.get("latest_bazel_registry_version"),
+            ),
+        )
+
+
+@dataclass(frozen=True, slots=True)
+class VolatileMetricsSnapshot:
+    """Fast-refresh volatile activity metrics with optional fetch timestamp."""
+
+    last_push_date: str | None = None
+    merged_prs_30_days: int = 0
+    open_issues: int = 0
+    open_prs: int = 0
+    open_ready_prs: int = 0
+    open_draft_prs: int = 0
+    latest_release_version: str | None = None
+    latest_release_date: str | None = None
+    commits_since_latest_release: int | None = None
+    release_bazel_version: str | None = None
+    release_bazel_deps: tuple[tuple[str, str], ...] = ()
+    volatile_metrics_fetched_at: str | None = None
+
+    @classmethod
+    def from_dict(cls, data: Mapping[str, Any]) -> VolatileMetricsSnapshot:
+        return cls(
+            last_push_date=cast("str | None", data.get("last_push_date")),
+            merged_prs_30_days=cast("int", data.get("merged_prs_30_days", 0)),
+            open_issues=cast("int", data.get("open_issues", 0)),
+            open_prs=cast("int", data.get("open_prs", 0)),
+            open_ready_prs=cast("int", data.get("open_ready_prs", 0)),
+            open_draft_prs=cast("int", data.get("open_draft_prs", 0)),
+            latest_release_version=cast(
+                "str | None", data.get("latest_release_version")
+            ),
+            latest_release_date=cast("str | None", data.get("latest_release_date")),
+            commits_since_latest_release=cast(
+                "int | None",
+                data.get("commits_since_latest_release"),
+            ),
+            release_bazel_version=cast(
+                "str | None",
+                data.get("release_bazel_version"),
+            ),
+            release_bazel_deps=normalize_string_pairs(data.get("release_bazel_deps")),
+            volatile_metrics_fetched_at=cast(
+                "str | None",
+                data.get("volatile_metrics_fetched_at"),
+            ),
+        )
+
+
+@dataclass(frozen=True, slots=True)
+class RepoEntry:
+    """Normalized repository record grouped by collection cadence and source."""
+
+    name: str
+    description: str
+    category: str
+    subcategory: str
+    default_branch: str | None = None
+    default_branch_sha: str | None = None
+    content: DeepContentSignals = field(default_factory=DeepContentSignals)
+    registry: RegistrySignals = field(default_factory=RegistrySignals)
+    volatile: VolatileMetricsSnapshot = field(default_factory=VolatileMetricsSnapshot)
+    stars: int = 0
+    forks: int = 0
+
+    @classmethod
+    def from_dict(cls, data: Mapping[str, Any]) -> RepoEntry:
+        content_payload = cast("Mapping[str, Any]", data.get("content", {}))
+        registry_payload = cast("Mapping[str, Any]", data.get("registry", {}))
+        volatile_payload = cast("Mapping[str, Any]", data.get("volatile", {}))
+
+        return cls(
+            name=cast("str", data.get("name", "")),
+            description=cast("str", data.get("description", "(no description)")),
+            category=cast("str", data.get("category", DEFAULT_CATEGORY)),
+            subcategory=cast("str", data.get("subcategory", DEFAULT_SUBCATEGORY)),
+            default_branch=cast("str | None", data.get("default_branch")),
+            default_branch_sha=cast("str | None", data.get("default_branch_sha")),
+            content=DeepContentSignals.from_dict(content_payload),
+            registry=RegistrySignals.from_dict(registry_payload),
+            volatile=VolatileMetricsSnapshot.from_dict(volatile_payload),
+            stars=cast("int", data.get("stars", 0)),
+            forks=cast("int", data.get("forks", 0)),
+        )
+
+    def to_dict(self) -> dict[str, Any]:
+        return cast("dict[str, Any]", asdict(self))
+
+
+@dataclass(frozen=True, slots=True)
+class SubcategoryConfig:
+    """Rendering configuration for a subcategory section in the profile README."""
+
+    name: str
+    description: str
+
+
+@dataclass(frozen=True, slots=True)
+class CategoryConfig:
+    """Rendering configuration for a category and its subcategory ordering."""
+
+    name: str
+    description: str
+    subcategories: tuple[SubcategoryConfig, ...] = ()
+
+
+@dataclass(frozen=True, slots=True)
+class ReadmeConfig:
+    """Top-level rendering configuration for grouping repositories in README output."""
+
+    categories: tuple[CategoryConfig, ...]
+
+
+@dataclass(frozen=True, slots=True)
+class RepoSnapshot:
+    """Versioned snapshot payload containing all normalized repository entries."""
+
+    schema_version: int
+    org_name: str
+    generated_at: str
+    repos: tuple[RepoEntry, ...]
+
+    @classmethod
+    def from_dict(cls, data: Mapping[str, Any]) -> RepoSnapshot:
+        repos_data = data.get("repos")
+        if not isinstance(repos_data, list):
+            raise ValueError("Snapshot payload must contain a 'repos' list.")
+
+        schema_version = data.get("schema_version", SNAPSHOT_SCHEMA_VERSION)
+        if schema_version != SNAPSHOT_SCHEMA_VERSION:
+            raise ValueError(
+                "Unsupported snapshot schema version "
+                f"{schema_version}; expected {SNAPSHOT_SCHEMA_VERSION}."
+            )
+
+        org_name = data.get("org_name")
+        generated_at = data.get("generated_at")
+        if not isinstance(org_name, str) or not org_name:
+            raise ValueError("Snapshot payload must contain a non-empty 'org_name'.")
+        if not isinstance(generated_at, str) or not generated_at:
+            raise ValueError(
+                "Snapshot payload must contain a non-empty 'generated_at'."
+            )
+
+        typed_repos_data = cast("list[Mapping[str, Any]]", repos_data)
+
+        return cls(
+            schema_version=cast("int", schema_version),
+            org_name=org_name,
+            generated_at=generated_at,
+            repos=tuple(RepoEntry.from_dict(repo) for repo in typed_repos_data),
+        )
+
+    def to_dict(self) -> dict[str, Any]:
+        return {
+            "schema_version": self.schema_version,
+            "org_name": self.org_name,
+            "generated_at": self.generated_at,
+            "repos": [repo.to_dict() for repo in self.repos],
+        }
+
+
+CustomPropertyValue = str | list[str] | None
+
+
+def normalize_string_pairs(value: object) -> tuple[tuple[str, str], ...]:
+    if not isinstance(value, (list, tuple)):
+        return ()
+    items = cast("list[object]", list(value))
+    result: list[tuple[str, str]] = []
+    for raw in items:
+        pair = cast("list[object]", list(raw)) if isinstance(raw, (list, tuple)) else None
+        if pair is None or len(pair) != 2:
+            continue
+        name, ver = pair[0], pair[1]
+        if isinstance(name, str) and isinstance(ver, str):
+            result.append((name, ver))
+    return tuple(result)
+
+
+def normalize_string_tuple(value: object) -> tuple[str, ...]:
+    if isinstance(value, tuple):
+        return tuple(item for item in value if isinstance(item, str))
+    if isinstance(value, list):
+        sequence_items = cast("list[object]", value)
+        return tuple(item for item in sequence_items if isinstance(item, str))
+    return ()
diff --git a/src/profile_readme_generator/generator.py b/src/generate_repo_overview/profile_readme.py
similarity index 58%
rename from src/profile_readme_generator/generator.py
rename to src/generate_repo_overview/profile_readme.py
index d1a5524..247d8c0 100644
--- a/src/profile_readme_generator/generator.py
+++ b/src/generate_repo_overview/profile_readme.py
@@ -1,50 +1,26 @@
 from __future__ import annotations
 
-import argparse
-import os
-import subprocess
-import sys
 import tomllib
 from collections import defaultdict
 from dataclasses import dataclass
 from importlib.resources import files
-from pathlib import Path
 from typing import TYPE_CHECKING, cast
 
-if TYPE_CHECKING:
-    from github import Auth, Github
-    from github.Organization import Organization
-
-DEFAULT_ORG = "eclipse-score"
-DEFAULT_OUTPUT = Path("profile/README.md")
-DEFAULT_CATEGORY = "Uncategorized"
-DEFAULT_SUBCATEGORY = "General"
-
-
-@dataclass(frozen=True, slots=True)
-class RepoEntry:
-    name: str
-    description: str
-    category: str
-    subcategory: str
-
-
-@dataclass(frozen=True, slots=True)
-class SubcategoryConfig:
-    name: str
-    description: str
-
-
-@dataclass(frozen=True, slots=True)
-class CategoryConfig:
-    name: str
-    description: str
-    subcategories: tuple[SubcategoryConfig, ...] = ()
+from ._text_utils import escape_markdown_table_cell
+from .constants import DEFAULT_ORG
+from .models import (
+    DEFAULT_SUBCATEGORY,
+    CategoryConfig,
+    ReadmeConfig,
+    RepoEntry,
+    SubcategoryConfig,
+)
 
+if TYPE_CHECKING:
+    from collections.abc import Mapping
+    from pathlib import Path
 
-@dataclass(frozen=True, slots=True)
-class ReadmeConfig:
-    categories: tuple[CategoryConfig, ...]
+GroupedRepos = dict[str, dict[str, list[RepoEntry]]]
 
 
 @dataclass(frozen=True, slots=True)
@@ -113,173 +89,11 @@ def subcategory_description(self, category: str, subcategory: str) -> str:
         )
 
 
-GroupedRepos = dict[str, dict[str, list[RepoEntry]]]
-CustomPropertyValue = str | list[str] | None
-
-
-def build_parser() -> argparse.ArgumentParser:
-    parser = argparse.ArgumentParser(description=__doc__)
-    parser.add_argument("--org", default=DEFAULT_ORG, help="GitHub organization name")
-    parser.add_argument(
-        "--output",
-        type=Path,
-        default=DEFAULT_OUTPUT,
-        help="Markdown file to write",
-    )
-    parser.add_argument(
-        "--template",
-        type=Path,
-        help="Optional markdown template file with a {{ repo_sections }} placeholder",
-    )
-    parser.add_argument(
-        "--config",
-        type=Path,
-        help="Optional category config file that defines order and descriptions",
-    )
-    parser.add_argument(
-        "--token-env",
-        default="GITHUB_TOKEN",
-        help="Environment variable that contains the GitHub token",
-    )
-    parser.add_argument(
-        "--dry-run",
-        action="store_true",
-        help="Print the generated markdown instead of writing the file",
-    )
-    return parser
-
-
-def main() -> int:
-    args = build_parser().parse_args()
-    try:
-        from github import Auth, Github
-    except ModuleNotFoundError as exc:
-        raise SystemExit(
-            "Missing PyGithub. Install project dependencies before running the generator."
-        ) from exc
-
-    print_status("Resolving GitHub token")
-    token = resolve_github_token(args.token_env)
-    if not token:
-        message = f"Missing GitHub token. Set {args.token_env} or authenticate with `gh auth login`."
-        raise SystemExit(message)
-
-    print_status(f"Connecting to GitHub organization {args.org}")
-    github = Github(auth=Auth.Token(token), lazy=True)
-    organization = github.get_organization(args.org)
-    print_status("Fetching repositories and custom properties")
-    repos = fetch_repositories(organization)
-    print_status(f"Loaded {len(repos)} repositories")
-    print_status(f"Loading README config from {describe_config_source(args.config)}")
-    config = load_config(args.config)
-    print_status("Loading README template")
-    template = load_template(args.template)
-    print_status("Rendering README")
-    markdown = render_readme(
-        repos,
-        template=template,
-        config=config,
-        org_name=args.org,
-    )
-
-    if args.dry_run:
-        print_status("Dry run complete")
-        print(markdown)
-        return 0
-
-    print_status(f"Writing {args.output}")
-    args.output.write_text(markdown, encoding="utf-8")
-    print_status("README generation complete")
-    return 0
-
-
-def resolve_github_token(token_env: str) -> str | None:
-    token = os.getenv(token_env)
-    if token:
-        return token
-    return get_gh_auth_token()
-
-
-def get_gh_auth_token() -> str | None:
-    try:
-        result = subprocess.run(
-            ["gh", "auth", "token"],
-            check=True,
-            capture_output=True,
-            text=True,
-        )
-    except (FileNotFoundError, subprocess.CalledProcessError):
-        return None
-
-    token = result.stdout.strip()
-    return token or None
-
-
-def fetch_repositories(organization: Organization) -> list[RepoEntry]:
-    print_status("Loading repository descriptions")
-    descriptions_by_name = fetch_repository_descriptions(organization)
-    print_status("Loading repository custom properties in bulk")
-    active_repository_names = set(descriptions_by_name)
-
-    repos_by_name: dict[str, RepoEntry] = {}
-    for repository_properties in organization.list_custom_property_values():
-        if repository_properties.repository_name not in active_repository_names:
-            continue
-        repo_entry = build_repo_entry(
-            repository_name=repository_properties.repository_name,
-            description=descriptions_by_name.get(repository_properties.repository_name),
-            custom_properties=cast(
-                "dict[str, CustomPropertyValue]",
-                repository_properties.properties,
-            ),
-        )
-        repos_by_name[repo_entry.name] = repo_entry
-
-    for repository_name, description in descriptions_by_name.items():
-        repos_by_name.setdefault(
-            repository_name,
-            build_repo_entry(
-                repository_name=repository_name,
-                description=description,
-                custom_properties={},
-            ),
-        )
-
-    return sorted(repos_by_name.values(), key=lambda repo: repo.name.casefold())
-
-
-def fetch_repository_descriptions(organization: Organization) -> dict[str, str | None]:
-    descriptions_by_name: dict[str, str | None] = {}
-    for repository in organization.get_repos():
-        if repository.archived:
-            continue
-        descriptions_by_name[repository.name] = repository.description
-    return descriptions_by_name
-
-
-def build_repo_entry(
-    repository_name: str,
-    description: str | None,
-    custom_properties: dict[str, CustomPropertyValue],
-) -> RepoEntry:
-    category = normalize_group_name(custom_properties.get("category"), DEFAULT_CATEGORY)
-    subcategory = normalize_group_name(
-        custom_properties.get("subcategory"),
-        DEFAULT_SUBCATEGORY,
-    )
-    return RepoEntry(
-        name=repository_name,
-        description=description or "(no description)",
-        category=category,
-        subcategory=subcategory,
-    )
-
-
 def load_template(template_path: Path | None) -> str:
     if template_path is not None:
         return template_path.read_text(encoding="utf-8")
     return (
-        files("profile_readme_generator")
+        files("generate_repo_overview")
         .joinpath("templates/profile_readme.md")
         .read_text(encoding="utf-8")
     )
@@ -289,21 +103,23 @@ def load_config(config_path: Path | None) -> ReadmeConfig:
     config_content = (
         config_path.read_text(encoding="utf-8")
         if config_path is not None
-        else files("profile_readme_generator")
+        else files("generate_repo_overview")
         .joinpath("profile_readme_config.toml")
         .read_text(encoding="utf-8")
     )
     config_source = describe_config_source(config_path)
-    raw_categories = tomllib.loads(config_content).get("categories", [])
+    raw_config = cast("dict[str, object]", tomllib.loads(config_content))
+    raw_categories = raw_config.get("categories", [])
     if not isinstance(raw_categories, list):
         message = (
             f"Invalid config in {config_source}: 'categories' must be a list of tables."
         )
         raise ValueError(message)
 
+    raw_category_entries = cast("list[object]", raw_categories)
     categories = tuple(
         parse_category_config(raw_category, config_source)
-        for raw_category in raw_categories
+        for raw_category in raw_category_entries
     )
     return ReadmeConfig(categories=categories)
 
@@ -315,27 +131,28 @@ def parse_category_config(raw_category: object, config_source: str) -> CategoryC
         )
         raise ValueError(message)
 
+    category = cast("Mapping[str, object]", raw_category)
+
     name = require_non_empty_string(
-        raw_category.get("name"),
+        category.get("name"),
         config_source=config_source,
         field_name="each category needs a non-empty name",
     )
     description = require_string(
-        raw_category.get("description", ""),
+        category.get("description", ""),
         config_source=config_source,
         field_name="category descriptions must be strings",
     ).strip()
 
-    raw_subcategories = raw_category.get("subcategories", [])
+    raw_subcategories = category.get("subcategories", [])
     if not isinstance(raw_subcategories, list):
-        message = (
-            f"Invalid config in {config_source}: category subcategories must be a list of tables."
-        )
+        message = f"Invalid config in {config_source}: category subcategories must be a list of tables."
         raise ValueError(message)
 
+    raw_subcategory_entries = cast("list[object]", raw_subcategories)
     subcategories = tuple(
         parse_subcategory_config(raw_subcategory, config_source)
-        for raw_subcategory in raw_subcategories
+        for raw_subcategory in raw_subcategory_entries
     )
     return CategoryConfig(
         name=name,
@@ -349,19 +166,19 @@ def parse_subcategory_config(
     config_source: str,
 ) -> SubcategoryConfig:
     if not isinstance(raw_subcategory, dict):
-        message = (
-            f"Invalid config in {config_source}: each subcategory entry must be a table."
-        )
+        message = f"Invalid config in {config_source}: each subcategory entry must be a table."
         raise ValueError(message)
 
+    subcategory = cast("Mapping[str, object]", raw_subcategory)
+
     return SubcategoryConfig(
         name=require_non_empty_string(
-            raw_subcategory.get("name"),
+            subcategory.get("name"),
             config_source=config_source,
             field_name="each subcategory needs a non-empty name",
         ),
         description=require_string(
-            raw_subcategory.get("description", ""),
+            subcategory.get("description", ""),
             config_source=config_source,
             field_name="subcategory descriptions must be strings",
         ).strip(),
@@ -394,16 +211,6 @@ def describe_config_source(config_path: Path | None) -> str:
     return str(config_path) if config_path is not None else "package default config"
 
 
-def normalize_group_name(value: str | list[str] | None, fallback: str) -> str:
-    if value is None:
-        return fallback
-    if isinstance(value, list):
-        cleaned = [item.strip() for item in value if item.strip()]
-        return ", ".join(cleaned) if cleaned else fallback
-    cleaned = value.strip()
-    return cleaned or fallback
-
-
 def group_repositories(
     repos: list[RepoEntry],
     config: ReadmeConfig | None = None,
@@ -554,10 +361,3 @@ def render_repo_row(entry: RepoEntry, org_name: str = DEFAULT_ORG) -> str:
     return f"| [{entry.name}]({url}) | {safe_description} |"
 
 
-def escape_markdown_table_cell(text: str) -> str:
-    normalized = text.replace("\r\n", " ").replace("\n", " ").replace("\r", " ")
-    return normalized.replace("|", r"\|")
-
-
-def print_status(message: str) -> None:
-    print(f"[generate-profile-readme] {message}", file=sys.stderr)
diff --git a/src/profile_readme_generator/profile_readme_config.toml b/src/generate_repo_overview/profile_readme_config.toml
similarity index 100%
rename from src/profile_readme_generator/profile_readme_config.toml
rename to src/generate_repo_overview/profile_readme_config.toml
diff --git a/src/generate_repo_overview/templates/index.js b/src/generate_repo_overview/templates/index.js
new file mode 100644
index 0000000..a698d1f
--- /dev/null
+++ b/src/generate_repo_overview/templates/index.js
@@ -0,0 +1,73 @@
+// Tab switching with URL hash
+const TAB_IDS = ['overview', 'versions', 'tech-stack', 'timeline'];
+
+function getHashTab() {
+  const h = location.hash.slice(1);
+  return TAB_IDS.includes(h) ? h : 'overview';
+}
+
+function applyVisibility() {
+  document.querySelectorAll('.section').forEach(s => {
+    const matchTab = s.dataset.tab === activeTab;
+    const matchCat = !s.dataset.category || activeCategory === 'all' || s.dataset.category === activeCategory;
+    s.classList.toggle('hidden', !(matchTab && matchCat));
+  });
+}
+
+function activateTab(tab) {
+  activeTab = tab;
+  document.querySelectorAll('.tab-btn').forEach(b => b.classList.toggle('active', b.dataset.tab === tab));
+  applyVisibility();
+}
+
+let activeTab = getHashTab();
+let activeCategory = 'all';
+activateTab(activeTab);
+
+document.querySelectorAll('.tab-btn').forEach(btn => {
+  btn.addEventListener('click', () => {
+    location.hash = btn.dataset.tab;
+  });
+});
+
+window.addEventListener('hashchange', () => {
+  activateTab(getHashTab());
+});
+
+// Category filtering
+// `categories` is injected by the preceding <script> block
+const filtersEl = document.getElementById('filters');
+function renderFilters() {
+  filtersEl.innerHTML = categories.map(c =>
+    `<button class="filter-btn ${c === activeCategory ? 'active' : ''}" data-cat="${c}">`
+    + `${c === 'all' ? 'All groups' : c}</button>`
+  ).join('');
+  filtersEl.querySelectorAll('.filter-btn').forEach(btn => {
+    btn.addEventListener('click', () => {
+      activeCategory = btn.dataset.cat;
+      renderFilters();
+      applyVisibility();
+    });
+  });
+}
+renderFilters();
+
+// Column sorting
+document.querySelectorAll('th[data-sort]').forEach(th => {
+  th.addEventListener('click', () => {
+    const table = th.closest('table');
+    const tbody = table.querySelector('tbody');
+    const idx = Array.from(th.parentNode.children).indexOf(th);
+    const rows = Array.from(tbody.querySelectorAll('tr'));
+    const asc = th.classList.toggle('sort-asc');
+    th.parentNode.querySelectorAll('th').forEach(h => { if (h !== th) h.classList.remove('sort-asc'); });
+    rows.sort((a, b) => {
+      const av = a.children[idx]?.textContent.trim() || '';
+      const bv = b.children[idx]?.textContent.trim() || '';
+      const an = parseFloat(av), bn = parseFloat(bv);
+      if (!isNaN(an) && !isNaN(bn)) return asc ? an - bn : bn - an;
+      return asc ? av.localeCompare(bv) : bv.localeCompare(av);
+    });
+    rows.forEach(r => tbody.appendChild(r));
+  });
+});
diff --git a/src/profile_readme_generator/templates/profile_readme.md b/src/generate_repo_overview/templates/profile_readme.md
similarity index 83%
rename from src/profile_readme_generator/templates/profile_readme.md
rename to src/generate_repo_overview/templates/profile_readme.md
index 884ff2f..837981c 100644
--- a/src/profile_readme_generator/templates/profile_readme.md
+++ b/src/generate_repo_overview/templates/profile_readme.md
@@ -1,5 +1,7 @@
 # Welcome to eclipse-score
 
+**[Metrics, Status, etc](https://eclipse-score.github.io/.github/)** — for all repositories in this organization.
+
 This Github organization contains artifacts developed by the [Eclipse S-CORE Project](https://projects.eclipse.org/projects/automotive.score).
 
 ## Introduction to Eclipse S-CORE Project
diff --git a/src/generate_repo_overview/templates/styles.css b/src/generate_repo_overview/templates/styles.css
new file mode 100644
index 0000000..e30730f
--- /dev/null
+++ b/src/generate_repo_overview/templates/styles.css
@@ -0,0 +1,348 @@
+*, *::before, *::after { box-sizing: border-box; margin: 0; padding: 0; }
+
+:root {
+  --bg:        #0d1117;
+  --surface:   #161b22;
+  --border:    #30363d;
+  --text:      #c9d1d9;
+  --muted:     #8b949e;
+  --accent:    #58a6ff;
+  --green:     #3fb950;
+  --yellow:    #d29922;
+  --orange:    #e3702d;
+  --red:       #f85149;
+  --radius:    8px;
+  --mono:      "SFMono-Regular", Consolas, "Liberation Mono", Menlo, monospace;
+}
+
+body {
+  background: var(--bg);
+  color: var(--text);
+  font-family: -apple-system, BlinkMacSystemFont, "Segoe UI", Roboto, sans-serif;
+  min-height: 100vh;
+  padding: 2rem 1.5rem;
+}
+
+header {
+  max-width: 1400px;
+  margin: 0 auto 2rem;
+}
+h1 { font-size: 1.6rem; font-weight: 600; color: #e6edf3; }
+.subtitle { color: var(--muted); font-size: 0.85rem; margin-top: 0.3rem; }
+
+#summary {
+  display: flex;
+  gap: 1.2rem;
+  flex-wrap: wrap;
+  font-size: 0.82rem;
+  color: var(--muted);
+  margin-top: 1.2rem;
+}
+.summary-chip {
+  display: flex;
+  align-items: center;
+  gap: 0.4rem;
+}
+.dot {
+  width: 8px; height: 8px;
+  border-radius: 50%;
+  flex-shrink: 0;
+}
+
+#lang-summary {
+  display: flex;
+  align-items: center;
+  gap: 1rem;
+  flex-wrap: wrap;
+  font-size: 0.82rem;
+  color: var(--muted);
+  margin-top: 0.7rem;
+}
+.lang-count {
+  color: var(--text);
+  font-weight: 500;
+}
+
+#filters {
+  max-width: 1400px;
+  margin: 0 auto 0.8rem;
+  display: flex;
+  gap: 0.5rem;
+  flex-wrap: wrap;
+}
+button {
+  background: var(--surface);
+  border: 1px solid var(--border);
+  border-radius: var(--radius);
+  color: var(--text);
+  cursor: pointer;
+  font-size: 0.82rem;
+  padding: 0.38rem 0.85rem;
+  transition: border-color .15s, color .15s;
+  white-space: nowrap;
+}
+button:hover { border-color: var(--accent); color: var(--accent); }
+.filter-btn { font-size: 0.78rem; padding: 0.28rem 0.7rem; }
+.filter-btn.active { border-color: var(--accent); color: var(--accent); }
+
+#sections {
+  max-width: 1400px;
+  margin: 0 auto;
+  display: flex;
+  flex-direction: column;
+  gap: 1.5rem;
+}
+
+.tab-bar {
+  max-width: 1400px;
+  margin: 0 auto 1.2rem;
+  display: flex;
+  gap: 0;
+  border-bottom: 1px solid var(--border);
+}
+.tab-btn {
+  font-size: 0.85rem;
+  padding: 0.6rem 1.1rem;
+  background: transparent;
+  border: none;
+  border-bottom: 2px solid transparent;
+  border-radius: 0;
+  margin-bottom: -1px;
+  color: var(--muted);
+  transition: color .15s, background .15s;
+}
+.tab-btn:hover {
+  background: #ffffff08;
+  border-color: transparent;
+  border-bottom-color: var(--border);
+  color: var(--text);
+}
+.tab-btn.active {
+  color: var(--text);
+  background: transparent;
+  border-color: transparent;
+  border-bottom-color: var(--accent);
+}
+
+.section {
+  background: var(--surface);
+  border: 1px solid var(--border);
+  border-radius: var(--radius);
+  overflow: hidden;
+}
+.section.hidden { display: none; }
+.section-header {
+  padding: 0.8rem 1.1rem;
+  border-bottom: 1px solid var(--border);
+  display: flex;
+  align-items: center;
+  justify-content: space-between;
+  gap: 0.5rem;
+}
+.section-title {
+  font-size: 0.95rem;
+  font-weight: 600;
+  color: #e6edf3;
+}
+.section-count {
+  font-size: 0.72rem;
+  color: var(--muted);
+  background: #21262d;
+  border-radius: 20px;
+  padding: 0.15rem 0.55rem;
+}
+.section-subtitle {
+  font-size: 0.78rem;
+}
+tr.tier-header td {
+  background: #161b22;
+  color: var(--muted);
+  font-size: 0.72rem;
+  font-weight: 600;
+  text-transform: uppercase;
+  letter-spacing: 0.04em;
+  padding: 0.4rem 1rem;
+  border-top: 1px solid var(--border);
+}
+
+table {
+  width: 100%;
+  border-collapse: separate;
+  border-spacing: 0;
+  font-size: 0.82rem;
+}
+th {
+  text-align: left;
+  padding: 0.55rem 0.8rem;
+  color: var(--muted);
+  font-weight: 500;
+  font-size: 0.75rem;
+  text-transform: uppercase;
+  letter-spacing: 0.04em;
+  border-bottom: 1px solid var(--border);
+  white-space: nowrap;
+  cursor: pointer;
+  user-select: none;
+  position: relative;
+}
+th:hover { color: var(--accent); }
+th .sort-arrow { margin-left: 0.3rem; font-size: 0.65rem; }
+td {
+  padding: 0.5rem 0.8rem;
+  border-bottom: 1px solid #21262d;
+  vertical-align: middle;
+  position: relative;
+}
+tr:last-child td { border-bottom: none; }
+tr:hover td { background: #1c2129; }
+
+a {
+  color: var(--accent);
+  text-decoration: none;
+}
+a:hover { text-decoration: underline; }
+
+.badge {
+  display: inline-flex;
+  align-items: center;
+  gap: 0.3rem;
+  font-size: 0.75rem;
+  font-weight: 500;
+  border-radius: 20px;
+  padding: 0.18rem 0.55rem;
+  border: 1px solid;
+  white-space: nowrap;
+}
+.badge.green  { color: var(--green);  border-color: #3fb95055; background: #3fb95011; }
+.badge.yellow { color: var(--yellow); border-color: #d2992255; background: #d2992211; }
+.badge.orange { color: var(--orange); border-color: #e3702d55; background: #e3702d11; }
+.badge.red    { color: var(--red);    border-color: #f8514955; background: #f8514911; }
+.badge.muted  { color: var(--muted);  border-color: var(--border); }
+.badge.fire   { color: var(--orange); border-color: #e3702d55; background: #e3702d11; }
+
+.lang-badge {
+  display: inline-flex;
+  align-items: center;
+  gap: 0.35rem;
+  font-size: 0.75rem;
+  font-weight: 500;
+  white-space: nowrap;
+}
+.lang-badge::before {
+  content: "";
+  display: inline-block;
+  width: 10px;
+  height: 10px;
+  border-radius: 50%;
+  background: var(--lang-color, #888);
+  flex-shrink: 0;
+}
+
+.icon-bazel {
+  width: 14px;
+  height: 14px;
+  vertical-align: text-bottom;
+}
+
+.mono { font-family: var(--mono); font-size: 0.78rem; }
+.text-muted { color: var(--muted); }
+.text-right { text-align: right; }
+.text-center { text-align: center; }
+
+.presence { text-align: center; }
+
+footer {
+  max-width: 1400px;
+  margin: 2.5rem auto 0;
+  font-size: 0.75rem;
+  color: var(--muted);
+  border-top: 1px solid var(--border);
+  padding-top: 1rem;
+}
+
+.gh-link { color: var(--muted); margin-left: 0.3rem; vertical-align: middle; display: inline-flex; cursor: alias; }
+.gh-link:hover { color: var(--accent); text-decoration: none; }
+.gh-link svg { width: 13px; height: 13px; }
+
+.breadcrumb { font-size: 0.82rem; color: var(--muted); margin-bottom: 0.8rem; }
+.breadcrumb a { color: var(--accent); }
+
+.meta-chips { display: flex; gap: 0.5rem; margin-top: 0.6rem; flex-wrap: wrap; }
+
+.stat-grid {
+  display: grid;
+  grid-template-columns: repeat(auto-fill, minmax(150px, 1fr));
+  gap: 1rem;
+  margin: 1.5rem auto;
+  max-width: 1400px;
+}
+.stat-card {
+  background: var(--surface);
+  border: 1px solid var(--border);
+  border-radius: var(--radius);
+  padding: 1rem 1.1rem;
+}
+.stat-value { font-size: 1.5rem; font-weight: 600; color: #e6edf3; }
+.stat-label { font-size: 0.75rem; color: var(--muted); margin-top: 0.25rem; }
+
+.detail-section {
+  background: var(--surface);
+  border: 1px solid var(--border);
+  border-radius: var(--radius);
+  max-width: 1400px;
+  margin: 0 auto 1.2rem;
+  overflow: hidden;
+}
+.detail-body { padding: 1rem 1.1rem; }
+
+.signal-grid {
+  display: grid;
+  grid-template-columns: repeat(auto-fill, minmax(220px, 1fr));
+  gap: 0.5rem 1.5rem;
+}
+.signal-item {
+  display: flex;
+  align-items: center;
+  gap: 0.5rem;
+  font-size: 0.85rem;
+  padding: 0.3rem 0;
+}
+.signal-yes { color: var(--green); }
+.signal-no { color: var(--muted); }
+
+.info-grid {
+  display: grid;
+  grid-template-columns: repeat(auto-fill, minmax(260px, 1fr));
+  gap: 0.6rem 2rem;
+}
+.info-item { font-size: 0.85rem; }
+.info-label { color: var(--muted); font-size: 0.75rem; margin-bottom: 0.15rem; }
+
+.gh-count { text-decoration: none; }
+.gh-count:hover { text-decoration: none; opacity: 0.8; }
+
+th[data-tooltip], td[data-tooltip] { cursor: help; }
+th[data-tooltip]::after, td[data-tooltip]::after {
+  content: attr(data-tooltip);
+  position: absolute;
+  left: 50%;
+  transform: translateX(-50%);
+  background: #1c2129;
+  border: 1px solid var(--border);
+  border-radius: 10px;
+  color: var(--text);
+  font-size: 0.72rem;
+  font-weight: 400;
+  text-transform: none;
+  letter-spacing: 0;
+  padding: 0.5rem 0.85rem;
+  white-space: nowrap;
+  z-index: 100;
+  pointer-events: none;
+  box-shadow: 0 6px 20px rgba(0,0,0,0.55);
+  opacity: 0;
+  transition: opacity .15s;
+}
+th[data-tooltip]::after { top: calc(100% + 6px); }
+td[data-tooltip]::after { bottom: calc(100% + 6px); }
+th[data-tooltip]:hover::after, td[data-tooltip]:hover::after { opacity: 1; }
diff --git a/src/profile_readme_generator/__init__.py b/src/profile_readme_generator/__init__.py
deleted file mode 100644
index eae41f1..0000000
--- a/src/profile_readme_generator/__init__.py
+++ /dev/null
@@ -1 +0,0 @@
-"""Tools for generating the organization profile README."""
diff --git a/tests/test_cli.py b/tests/test_cli.py
new file mode 100644
index 0000000..1433c09
--- /dev/null
+++ b/tests/test_cli.py
@@ -0,0 +1,65 @@
+import pytest
+
+import generate_repo_overview.cli as cli
+
+
+def test_main_without_command_prints_help_and_succeeds(
+    capsys: pytest.CaptureFixture[str],
+) -> None:
+    exit_code = cli.main([])
+
+    captured = capsys.readouterr()
+
+    assert exit_code == 0
+    assert "Quick start:" in captured.out
+    assert "collect" in captured.out
+    assert "render-overview" in captured.out
+    assert "render-details" in captured.out
+    assert "generate-profile-readme" not in captured.out
+    assert "generate-metrics" not in captured.out
+    assert captured.err == ""
+
+
+def test_collect_help_does_not_expose_refresh_flag(
+    capsys: pytest.CaptureFixture[str],
+) -> None:
+    with pytest.raises(SystemExit) as exc_info:
+        cli.main(["collect", "--help"])
+
+    captured = capsys.readouterr()
+
+    assert exc_info.value.code == 0
+    assert "--refresh" not in captured.out
+    assert "--deep" in captured.out
+
+
+def test_render_overview_help_shows_expected_args(
+    capsys: pytest.CaptureFixture[str],
+) -> None:
+    with pytest.raises(SystemExit) as exc_info:
+        cli.main(["render-overview", "--help"])
+
+    captured = capsys.readouterr()
+
+    assert exc_info.value.code == 0
+    assert "--input" in captured.out
+    assert "--output" in captured.out
+    assert "--template" in captured.out
+    assert "--config" in captured.out
+    assert "--dry-run" not in captured.out
+    assert "--refresh" not in captured.out
+
+
+def test_render_details_help_shows_expected_args(
+    capsys: pytest.CaptureFixture[str],
+) -> None:
+    with pytest.raises(SystemExit) as exc_info:
+        cli.main(["render-details", "--help"])
+
+    captured = capsys.readouterr()
+
+    assert exc_info.value.code == 0
+    assert "--input" in captured.out
+    assert "--output" in captured.out
+    assert "--dry-run" not in captured.out
+    assert "--refresh" not in captured.out
diff --git a/tests/test_cli_render.py b/tests/test_cli_render.py
new file mode 100644
index 0000000..31273e7
--- /dev/null
+++ b/tests/test_cli_render.py
@@ -0,0 +1,129 @@
+from pathlib import Path
+
+import generate_repo_overview.cli as cli
+from generate_repo_overview.collector import write_snapshot
+from generate_repo_overview.models import (
+    SNAPSHOT_SCHEMA_VERSION,
+    DeepContentSignals,
+    RepoEntry,
+    RepoSnapshot,
+    VolatileMetricsSnapshot,
+)
+
+
+def _make_snapshot() -> RepoSnapshot:
+    return RepoSnapshot(
+        schema_version=SNAPSHOT_SCHEMA_VERSION,
+        org_name="eclipse-score",
+        generated_at="2026-04-13T12:00:00+00:00",
+        repos=(
+            RepoEntry(
+                name="tools",
+                description="Tooling",
+                category="Infrastructure",
+                subcategory="Tooling",
+                content=DeepContentSignals(
+                    is_bazel_repo=True,
+                    bazel_version="8.4.2",
+                    has_lint_config=True,
+                    has_ci=True,
+                    has_coverage_config=False,
+                ),
+                volatile=VolatileMetricsSnapshot(
+                    last_push_date="2026-04-12",
+                    open_issues=2,
+                    open_prs=1,
+                    open_ready_prs=1,
+                    open_draft_prs=0,
+                    latest_release_date="2026-04-01",
+                ),
+                stars=3,
+                forks=4,
+            ),
+        ),
+    )
+
+
+def test_render_overview_writes_readme(tmp_path: Path) -> None:
+    snapshot_path = tmp_path / "repo_overview.json"
+    readme_output = tmp_path / "README.md"
+    write_snapshot(_make_snapshot(), snapshot_path)
+
+    exit_code = cli.main(
+        [
+            "render-overview",
+            "--input",
+            str(snapshot_path),
+            "--output",
+            str(readme_output),
+        ]
+    )
+
+    assert exit_code == 0
+    assert readme_output.exists()
+    assert "### Infrastructure" in readme_output.read_text(encoding="utf-8")
+
+
+def test_render_details_writes_html(tmp_path: Path) -> None:
+    snapshot_path = tmp_path / "repo_overview.json"
+    output_dir = tmp_path / "_site"
+    write_snapshot(_make_snapshot(), snapshot_path)
+
+    exit_code = cli.main(
+        [
+            "render-details",
+            "--input",
+            str(snapshot_path),
+            "--output",
+            str(output_dir),
+        ]
+    )
+
+    assert exit_code == 0
+    index = output_dir / "index.html"
+    assert index.exists()
+    content = index.read_text(encoding="utf-8")
+    assert "Cross-Repo Metrics" in content
+    assert "<!DOCTYPE html>" in content
+
+
+def test_render_details_writes_repo_detail_pages(tmp_path: Path) -> None:
+    snapshot_path = tmp_path / "repo_overview.json"
+    output_dir = tmp_path / "_site"
+    write_snapshot(_make_snapshot(), snapshot_path)
+
+    cli.main(
+        [
+            "render-details",
+            "--input",
+            str(snapshot_path),
+            "--output",
+            str(output_dir),
+        ]
+    )
+
+    detail = output_dir / "tools" / "index.html"
+    assert detail.exists()
+    detail_content = detail.read_text(encoding="utf-8")
+    assert "tools" in detail_content
+    assert "../" in detail_content
+    assert "<!DOCTYPE html>" in detail_content
+
+
+def test_render_details_index_links_to_detail_pages(tmp_path: Path) -> None:
+    snapshot_path = tmp_path / "repo_overview.json"
+    output_dir = tmp_path / "_site"
+    write_snapshot(_make_snapshot(), snapshot_path)
+
+    cli.main(
+        [
+            "render-details",
+            "--input",
+            str(snapshot_path),
+            "--output",
+            str(output_dir),
+        ]
+    )
+
+    index_content = (output_dir / "index.html").read_text(encoding="utf-8")
+    assert 'href="tools/"' in index_content
diff --git a/tests/test_generator.py b/tests/test_generator.py
index 23d73a6..7348f4e 100644
--- a/tests/test_generator.py
+++ b/tests/test_generator.py
@@ -1,24 +1,36 @@
 from pathlib import Path
 from types import SimpleNamespace
+from typing import Any, cast
 
 import pytest
 
-import profile_readme_generator.generator as generator
-from profile_readme_generator.generator import (
-    CategoryConfig,
-    RepoEntry,
-    ReadmeConfig,
-    SubcategoryConfig,
-    build_repo_entry,
+import generate_repo_overview.collector as collector
+import generate_repo_overview.collector.repo_entry as repo_entry
+import generate_repo_overview.collector.signal_detection as signal_detection
+import generate_repo_overview.profile_readme as profile_readme
+from generate_repo_overview.collector import (
     fetch_repositories,
     fetch_repository_descriptions,
     get_gh_auth_token,
+    resolve_github_token,
+)
+from generate_repo_overview.collector.repo_entry import (
+    build_repo_entry,
+    normalize_group_name,
+)
+from generate_repo_overview.console import print_status
+from generate_repo_overview.models import (
+    CategoryConfig,
+    ReadmeConfig,
+    RegistrySignals,
+    RepoEntry,
+    SubcategoryConfig,
+)
+from generate_repo_overview.profile_readme import (
+    describe_config_source,
     group_repositories,
     load_config,
-    normalize_group_name,
-    print_status,
     render_readme,
-    resolve_github_token,
 )
 
 
@@ -70,7 +82,9 @@ def test_group_repositories_prefers_configured_category_order() -> None:
     assert list(grouped) == ["Modules", "Infrastructure", "Website", "Uncategorized"]
 
 
-def test_group_repositories_matches_configured_category_order_case_insensitively() -> None:
+def test_group_repositories_matches_configured_category_order_case_insensitively() -> (
+    None
+):
     repos = [
         RepoEntry("website", "desc", "website", "General"),
         RepoEntry("tools", "desc", "infrastructure", "General"),
@@ -96,6 +110,21 @@ def test_build_repo_entry_uses_custom_properties_and_description_fallback() -> N
         repository_name="tools",
         description=None,
         custom_properties={"category": "Infrastructure", "subcategory": None},
+        content_signals=signal_detection.default_content_signals(),
+        registry_signals=RegistrySignals(),
+        volatile_metrics={
+            "last_push_date": None,
+            "merged_prs_30_days": 0,
+            "open_issues": 0,
+            "open_prs": 0,
+            "open_ready_prs": 0,
+            "open_draft_prs": 0,
+            "latest_release_version": None,
+            "latest_release_date": None,
+            "commits_since_latest_release": None,
+            "release_bazel_version": None,
+            "release_bazel_deps": (),
+        },
     )
 
     assert entry == RepoEntry(
@@ -106,38 +135,91 @@ def test_build_repo_entry_uses_custom_properties_and_description_fallback() -> N
     )
 
 
-def test_fetch_repository_descriptions_skips_archived_repositories() -> None:
-    organization = SimpleNamespace(
-        get_repos=lambda: [
-            SimpleNamespace(name="active-repo", description="Active", archived=False),
-            SimpleNamespace(name="archived-repo", description="Archived", archived=True),
-        ]
+def test_fetch_repository_descriptions_skips_archived_repositories(
+    monkeypatch: pytest.MonkeyPatch,
+) -> None:
+    active_repo = SimpleNamespace(name="active-repo", description="Active")
+
+    monkeypatch.setattr(
+        collector,
+        "fetch_active_repositories",
+        lambda organization: {
+            "active-repo": collector.ActiveRepositoryData(
+                repository=active_repo,
+                custom_properties={},
+            )
+        },
     )
+    assert fetch_repository_descriptions(cast("Any", object())) == {
+        "active-repo": "Active"
+    }
 
-    assert fetch_repository_descriptions(organization) == {"active-repo": "Active"}
 
+def test_fetch_repositories_does_not_reintroduce_archived_repositories(
+    monkeypatch: pytest.MonkeyPatch,
+) -> None:
+    class FakeRequester:
+        is_not_lazy = False
+
+        def requestJsonAndCheck(  # noqa: N802
+            self,
+            verb: str,
+            url: str,
+            parameters: dict[str, Any] | None = None,
+            headers: dict[str, str] | None = None,
+        ) -> tuple[dict[str, str], Any]:
+            assert verb == "GET"
+            assert url == "/orgs/eclipse-score/repos"
+            assert parameters is not None
+            assert parameters.get("page") == 1
+            return (
+                {},
+                [
+                    {
+                        "name": "active-repo",
+                        "archived": False,
+                        "description": "Active",
+                        "default_branch": "main",
+                        "custom_properties": {
+                            "category": "Infrastructure",
+                            "subcategory": "General",
+                        },
+                    },
+                    {
+                        "name": "archived-repo",
+                        "archived": True,
+                        "description": "Archived",
+                        "default_branch": "main",
+                        "custom_properties": {
+                            "category": "Infrastructure",
+                            "subcategory": "General",
+                        },
+                    },
+                ],
+            )
 
-def test_fetch_repositories_does_not_reintroduce_archived_repositories() -> None:
     organization = SimpleNamespace(
-        get_repos=lambda: [
-            SimpleNamespace(name="active-repo", description="Active", archived=False),
-            SimpleNamespace(name="archived-repo", description="Archived", archived=True),
-        ],
-        list_custom_property_values=lambda: [
-            SimpleNamespace(
-                repository_name="active-repo",
-                properties={"category": "Infrastructure", "subcategory": "General"},
-            ),
-            SimpleNamespace(
-                repository_name="archived-repo",
-                properties={"category": "Infrastructure", "subcategory": "General"},
-            ),
-        ],
+        login="eclipse-score",
+        requester=FakeRequester(),
     )
 
-    assert fetch_repositories(organization) == [
-        RepoEntry("active-repo", "Active", "Infrastructure", "General")
-    ]
+    monkeypatch.setattr(
+        repo_entry,
+        "collect_repository_entry",
+        lambda **kwargs: RepoEntry(
+            name=kwargs["repository_name"],
+            description=kwargs["repository"].description,
+            category=kwargs["custom_properties"].get("category", "Uncategorized"),
+            subcategory=kwargs["custom_properties"].get("subcategory", "General"),
+        ),
+    )
+    repos = fetch_repositories(cast("Any", organization))
+
+    assert len(repos) == 1
+    assert repos[0].name == "active-repo"
+    assert repos[0].description == "Active"
+    assert repos[0].category == "Infrastructure"
+    assert repos[0].subcategory == "General"
 
 
 def test_render_readme_uses_simple_markdown_sections() -> None:
@@ -165,7 +247,7 @@ def test_render_readme_uses_simple_markdown_sections() -> None:
 
 
 def test_render_repo_row_escapes_markdown_table_metacharacters() -> None:
-    row = generator.render_repo_row(
+    row = profile_readme.render_repo_row(
         RepoEntry("tools", "Line 1 | Line 2\nLine 3", "Infrastructure", "General")
     )
 
@@ -189,7 +271,9 @@ def test_render_readme_omits_general_subheading_for_single_subcategory() -> None
     assert "### Infrastructure" in markdown
     assert "#### General" not in markdown
     assert "| Repository | Description |" in markdown
-    assert "| [infra](https://github.com/eclipse-score/infra) | Infra repo |" in markdown
+    assert (
+        "| [infra](https://github.com/eclipse-score/infra) | Infra repo |" in markdown
+    )
 
 
 def test_render_readme_uses_category_descriptions_from_config() -> None:
@@ -403,13 +487,15 @@ def test_load_config_reads_categories_in_file_order(tmp_path: Path) -> None:
 
 
 def test_describe_config_source_uses_package_default_label() -> None:
-    assert generator.describe_config_source(None) == "package default config"
-    assert generator.describe_config_source(Path("config.toml")) == "config.toml"
+    assert describe_config_source(None) == "package default config"
+    assert describe_config_source(Path("config.toml")) == "config.toml"
 
 
-def test_resolve_github_token_prefers_environment(monkeypatch: pytest.MonkeyPatch) -> None:
+def test_resolve_github_token_prefers_environment(
+    monkeypatch: pytest.MonkeyPatch,
+) -> None:
     monkeypatch.setenv("TEST_GITHUB_TOKEN", "env-token")
-    monkeypatch.setattr(generator, "get_gh_auth_token", lambda: "gh-token")
+    monkeypatch.setattr(collector, "get_gh_auth_token", lambda: "gh-token")
 
     assert resolve_github_token("TEST_GITHUB_TOKEN") == "env-token"
 
@@ -418,7 +504,7 @@ def test_get_gh_auth_token_returns_trimmed_stdout(
     monkeypatch: pytest.MonkeyPatch,
 ) -> None:
     monkeypatch.setattr(
-        generator.subprocess,
+        collector.subprocess,
         "run",
         lambda *args, **kwargs: SimpleNamespace(stdout="gh-token\n"),
     )
@@ -430,9 +516,9 @@ def test_get_gh_auth_token_returns_none_on_failure(
     monkeypatch: pytest.MonkeyPatch,
 ) -> None:
     def raise_called_process_error(*args: object, **kwargs: object) -> None:
-        raise generator.subprocess.CalledProcessError(1, ["gh", "auth", "token"])
+        raise collector.subprocess.CalledProcessError(1, ["gh", "auth", "token"])
 
-    monkeypatch.setattr(generator.subprocess, "run", raise_called_process_error)
+    monkeypatch.setattr(collector.subprocess, "run", raise_called_process_error)
 
     assert get_gh_auth_token() is None
 
@@ -443,4 +529,4 @@ def test_print_status_writes_to_stderr(capsys: pytest.CaptureFixture[str]) -> No
     captured = capsys.readouterr()
 
     assert captured.out == ""
-    assert captured.err == "[generate-profile-readme] Loading repos\n"
+    assert captured.err == "[repo-overview] Loading repos\n"
diff --git a/tests/test_repo_overview.py b/tests/test_repo_overview.py
new file mode 100644
index 0000000..7cafa35
--- /dev/null
+++ b/tests/test_repo_overview.py
@@ -0,0 +1,1337 @@
+import sys
+import time
+from datetime import UTC, datetime
+from pathlib import Path
+from types import ModuleType, SimpleNamespace
+from typing import Any, cast
+
+import pytest
+
+import generate_repo_overview.collector as collector
+import generate_repo_overview.collector.reference_integration as reference_integration
+import generate_repo_overview.collector.registry_metadata as registry_metadata
+import generate_repo_overview.collector.repo_entry as repo_entry
+import generate_repo_overview.collector.signal_detection as signal_detection
+import generate_repo_overview.collector.snapshot_io as snapshot_io
+from generate_repo_overview.metrics_report import render_metrics_report
+from generate_repo_overview.models import (
+    SNAPSHOT_SCHEMA_VERSION,
+    DeepContentSignals,
+    RegistrySignals,
+    RepoEntry,
+    RepoSnapshot,
+    VolatileMetricsSnapshot,
+)
+
+
+def test_snapshot_round_trip_preserves_repository_overview(tmp_path: Path) -> None:
+    snapshot = RepoSnapshot(
+        schema_version=SNAPSHOT_SCHEMA_VERSION,
+        org_name="eclipse-score",
+        generated_at="2026-04-13T12:00:00+00:00",
+        repos=(
+            RepoEntry(
+                name="tools",
+                description="Tooling",
+                category="Infrastructure",
+                subcategory="Tooling",
+                default_branch="main",
+                default_branch_sha="abc123",
+                content=DeepContentSignals(
+                    is_bazel_repo=True,
+                    bazel_version="8.4.2",
+                    codeowners=("@infra-team",),
+                    referenced_by_reference_integration=True,
+                    has_lint_config=True,
+                    has_gitlint_config=True,
+                    has_pyproject_toml=True,
+                    has_pre_commit_config=True,
+                    has_ci=True,
+                    uses_cicd_daily_workflow=True,
+                    has_coverage_config=False,
+                ),
+                registry=RegistrySignals(
+                    maintainers_in_bazel_registry=("Andrey Babanin (@4og)",),
+                    latest_bazel_registry_version="0.2.5",
+                ),
+                volatile=VolatileMetricsSnapshot(
+                    last_push_date="2026-04-12",
+                    open_issues=2,
+                    open_prs=1,
+                    open_ready_prs=1,
+                    open_draft_prs=0,
+                    latest_release_version="v1.2.3",
+                    latest_release_date="2026-04-01",
+                    commits_since_latest_release=7,
+                ),
+                stars=3,
+                forks=4,
+            ),
+        ),
+    )
+    snapshot_path = tmp_path / "repo_overview.json"
+
+    snapshot_io.write_snapshot(snapshot, snapshot_path)
+
+    assert snapshot_io.load_snapshot(snapshot_path) == snapshot
+
+
+def test_ensure_snapshot_prefers_existing_cache(tmp_path: Path) -> None:
+    snapshot = RepoSnapshot(
+        schema_version=SNAPSHOT_SCHEMA_VERSION,
+        org_name="eclipse-score",
+        generated_at="2026-04-13T12:00:00+00:00",
+        repos=(RepoEntry("tools", "Tooling", "Infrastructure", "Tooling"),),
+    )
+    snapshot_path = tmp_path / "repo_overview.json"
+    snapshot_io.write_snapshot(snapshot, snapshot_path)
+
+    loaded_snapshot = collector.ensure_snapshot(cache_path=snapshot_path)
+
+    assert loaded_snapshot == snapshot
+
+
+def test_fetch_repositories_reuses_cached_content_signals() -> None:
+    pushed_at = datetime(2026, 4, 13, 10, 0, tzinfo=UTC)
+    release_at = datetime(2026, 4, 1, 8, 0, tzinfo=UTC)
+
+    class FakeRepo:
+        archived = False
+        name = "tools"
+        description = "Tooling"
+        default_branch = "main"
+
+        def __init__(self) -> None:
+            self.tree_calls = 0
+            self.pushed_at = pushed_at
+            self.open_issues_count = 3
+            self.stargazers_count = 3
+            self.forks_count = 4
+
+        def get_branch(self, branch_name: str) -> SimpleNamespace:
+            assert branch_name == "main"
+            return SimpleNamespace(commit=SimpleNamespace(sha="abc123"))
+
+        def get_git_tree(self, ref: str, recursive: bool = True) -> SimpleNamespace:
+            self.tree_calls += 1
+            return SimpleNamespace(tree=[])
+
+        def get_pulls(
+            self,
+            state: str = "open",
+            **_: Any,
+        ) -> list[SimpleNamespace]:
+            if state == "open":
+                return [SimpleNamespace(draft=False)]
+            if state == "closed":
+                return []
+            raise AssertionError(f"Unexpected pull state: {state}")
+
+        def get_latest_release(self) -> SimpleNamespace:
+            return SimpleNamespace(
+                raw_data={"tag_name": "v1.2.3"},
+                tag_name="latest",
+                published_at=release_at,
+            )
+
+        def compare(self, base: str, head: str) -> SimpleNamespace:
+            assert base == "v1.2.3"
+            assert head == "abc123"
+            return SimpleNamespace(total_commits=7)
+
+    fake_repo = FakeRepo()
+    organization = SimpleNamespace()
+    cached_snapshot = RepoSnapshot(
+        schema_version=SNAPSHOT_SCHEMA_VERSION,
+        org_name="eclipse-score",
+        generated_at="2026-04-13T12:00:00+00:00",
+        repos=(
+            RepoEntry(
+                name="tools",
+                description="Tooling",
+                category="Infrastructure",
+                subcategory="Tooling",
+                default_branch="main",
+                default_branch_sha="abc123",
+                content=DeepContentSignals(
+                    is_bazel_repo=True,
+                    bazel_version="8.4.2",
+                    codeowners=("@infra-team",),
+                    has_lint_config=True,
+                    has_ci=True,
+                    uses_cicd_daily_workflow=True,
+                    has_coverage_config=False,
+                ),
+                volatile=VolatileMetricsSnapshot(
+                    volatile_metrics_fetched_at="2026-04-13T11:30:00+00:00",
+                ),
+            ),
+        ),
+    )
+
+    original_fetch_active_repositories = collector.fetch_active_repositories
+    try:
+        collector.fetch_active_repositories = lambda organization: {
+            "tools": collector.ActiveRepositoryData(
+                repository=fake_repo,
+                custom_properties={},
+            )
+        }
+        repos = collector.fetch_repositories(
+            cast("Any", organization),
+            existing_snapshot=cached_snapshot,
+        )
+    finally:
+        collector.fetch_active_repositories = original_fetch_active_repositories
+
+    assert fake_repo.tree_calls == 1
+    assert len(repos) == 1
+    entry = repos[0]
+    assert entry.name == "tools"
+    assert entry.default_branch_sha == "abc123"
+    assert entry.content.is_bazel_repo is True
+    assert entry.content.bazel_version == "8.4.2"
+    assert entry.volatile.last_push_date == "2026-04-13"
+    assert entry.volatile.open_issues == 2
+    assert entry.volatile.open_prs == 1
+    assert entry.volatile.open_ready_prs == 1
+    assert entry.volatile.open_draft_prs == 0
+    assert entry.volatile.latest_release_version == "v1.2.3"
+    assert entry.volatile.latest_release_date == "2026-04-01"
+    assert entry.volatile.commits_since_latest_release == 7
+    assert entry.volatile.volatile_metrics_fetched_at is not None
+    assert entry.stars == 3
+    assert entry.forks == 4
+
+
+def test_collect_repository_entry_reuses_cached_details_when_unchanged() -> None:
+    class FakeRepo:
+        default_branch = "main"
+        description = "Tooling (updated)"
+        stargazers_count = 12
+        forks_count = 3
+
+        def get_branch(self, branch_name: str) -> SimpleNamespace:
+            assert branch_name == "main"
+            return SimpleNamespace(commit=SimpleNamespace(sha="abc123"))
+
+        def get_git_tree(self, ref: str, recursive: bool = True) -> SimpleNamespace:
+            raise AssertionError(
+                "get_git_tree should not be called in cache-aware fast mode"
+            )
+
+        def get_pulls(self, *args: Any, **kwargs: Any) -> list[SimpleNamespace]:
+            raise AssertionError(
+                "get_pulls should not be called in cache-aware fast mode"
+            )
+
+        def get_latest_release(self) -> SimpleNamespace:
+            raise AssertionError(
+                "get_latest_release should not be called in cache-aware fast mode"
+            )
+
+    repo = FakeRepo()
+    cached_entry = RepoEntry(
+        name="tools",
+        description="Tooling",
+        category="Infrastructure",
+        subcategory="Tooling",
+        default_branch="main",
+        default_branch_sha="abc123",
+        content=DeepContentSignals(
+            is_bazel_repo=True,
+            bazel_version="8.4.2",
+            codeowners=("@infra-team",),
+            docs_as_code_version="1.2.3",
+            referenced_by_reference_integration=False,
+            has_lint_config=True,
+            has_gitlint_config=True,
+            has_pyproject_toml=True,
+            has_pre_commit_config=True,
+            has_ci=True,
+            uses_cicd_daily_workflow=True,
+            has_coverage_config=True,
+        ),
+        registry=RegistrySignals(
+            maintainers_in_bazel_registry=("Old Maintainer",),
+            latest_bazel_registry_version="0.1.0",
+        ),
+        volatile=VolatileMetricsSnapshot(
+            last_push_date="2026-04-10",
+            merged_prs_30_days=8,
+            open_issues=7,
+            open_prs=4,
+            open_ready_prs=3,
+            open_draft_prs=1,
+            latest_release_version="v1.2.3",
+            latest_release_date="2026-04-01",
+            commits_since_latest_release=5,
+            volatile_metrics_fetched_at="2099-01-01T00:00:00+00:00",
+        ),
+        stars=1,
+        forks=1,
+    )
+
+    entry = repo_entry.collect_repository_entry(
+        repository_name="tools",
+        repository=repo,
+        custom_properties={"category": "Engineering", "subcategory": "Platform"},
+        bazel_registry_metadata={
+            "maintainers_in_bazel_registry": ("New Maintainer",),
+            "latest_bazel_registry_version": "0.2.0",
+        },
+        cached_entry=cached_entry,
+        referenced_by_reference_integration=True,
+        reuse_cached_entry_when_unchanged=True,
+    )
+
+    assert entry == RepoEntry(
+        name="tools",
+        description="Tooling (updated)",
+        category="Engineering",
+        subcategory="Platform",
+        default_branch="main",
+        default_branch_sha="abc123",
+        content=DeepContentSignals(
+            is_bazel_repo=True,
+            bazel_version="8.4.2",
+            codeowners=("@infra-team",),
+            docs_as_code_version="1.2.3",
+            referenced_by_reference_integration=True,
+            has_lint_config=True,
+            has_gitlint_config=True,
+            has_pyproject_toml=True,
+            has_pre_commit_config=True,
+            has_ci=True,
+            uses_cicd_daily_workflow=True,
+            has_coverage_config=True,
+        ),
+        registry=RegistrySignals(
+            maintainers_in_bazel_registry=("New Maintainer",),
+            latest_bazel_registry_version="0.2.0",
+        ),
+        volatile=VolatileMetricsSnapshot(
+            last_push_date="2026-04-10",
+            merged_prs_30_days=8,
+            open_issues=7,
+            open_prs=4,
+            open_ready_prs=3,
+            open_draft_prs=1,
+            latest_release_version="v1.2.3",
+            latest_release_date="2026-04-01",
+            commits_since_latest_release=5,
+            volatile_metrics_fetched_at="2099-01-01T00:00:00+00:00",
+        ),
+        stars=12,
+        forks=3,
+    )
+
+
+def test_collect_repository_entry_does_not_reuse_cached_registry_when_metadata_missing() -> (
+    None
+):
+    class FakeRepo:
+        default_branch = "main"
+        description = "Tooling"
+        stargazers_count = 5
+        forks_count = 2
+
+        def get_branch(self, branch_name: str) -> SimpleNamespace:
+            assert branch_name == "main"
+            return SimpleNamespace(commit=SimpleNamespace(sha="abc123"))
+
+        def get_git_tree(self, ref: str, recursive: bool = True) -> SimpleNamespace:
+            raise AssertionError(
+                "get_git_tree should not be called in cache-aware fast mode"
+            )
+
+        def get_pulls(self, *args: Any, **kwargs: Any) -> list[SimpleNamespace]:
+            raise AssertionError(
+                "get_pulls should not be called in cache-aware fast mode"
+            )
+
+        def get_latest_release(self) -> SimpleNamespace:
+            raise AssertionError(
+                "get_latest_release should not be called in cache-aware fast mode"
+            )
+
+    cached_entry = RepoEntry(
+        name="tools",
+        description="Tooling",
+        category="Infrastructure",
+        subcategory="Tooling",
+        default_branch="main",
+        default_branch_sha="abc123",
+        content=DeepContentSignals(is_bazel_repo=True),
+        registry=RegistrySignals(
+            maintainers_in_bazel_registry=("Stale Maintainer",),
+            latest_bazel_registry_version="9.9.9",
+        ),
+        volatile=VolatileMetricsSnapshot(
+            volatile_metrics_fetched_at="2099-01-01T00:00:00+00:00",
+        ),
+    )
+
+    entry = repo_entry.collect_repository_entry(
+        repository_name="tools",
+        repository=FakeRepo(),
+        custom_properties={},
+        bazel_registry_metadata=None,
+        cached_entry=cached_entry,
+        reuse_cached_entry_when_unchanged=True,
+    )
+
+    assert entry.registry == RegistrySignals()
+
+
+def test_collect_repository_entry_refreshes_stale_volatile_metrics_without_tree_fetch(
+    monkeypatch: pytest.MonkeyPatch,
+) -> None:
+    class FixedDatetime(datetime):
+        @classmethod
+        def now(cls, tz: Any = None) -> datetime:
+            current = cls(2026, 4, 17, 12, 0, tzinfo=UTC)
+            return current if tz is not None else current.replace(tzinfo=None)
+
+    monkeypatch.setattr(repo_entry, "datetime", FixedDatetime)
+
+    class FakeRepo:
+        default_branch = "main"
+        description = "Tooling"
+        stargazers_count = 2
+        forks_count = 3
+        pushed_at = datetime(2026, 4, 16, 12, 0, tzinfo=UTC)
+        open_issues_count = 6
+
+        def __init__(self) -> None:
+            self.tree_calls = 0
+
+        def get_branch(self, branch_name: str) -> SimpleNamespace:
+            assert branch_name == "main"
+            return SimpleNamespace(
+                commit=SimpleNamespace(
+                    sha="abc123",
+                    commit=SimpleNamespace(
+                        committer=SimpleNamespace(date=self.pushed_at)
+                    ),
+                )
+            )
+
+        def get_git_tree(self, ref: str, recursive: bool = True) -> SimpleNamespace:
+            self.tree_calls += 1
+            return SimpleNamespace(tree=[])
+
+        def get_pulls(self, state: str = "open", **_: Any) -> list[SimpleNamespace]:
+            if state == "open":
+                return [SimpleNamespace(draft=False), SimpleNamespace(draft=True)]
+            return []
+
+        def get_latest_release(self) -> SimpleNamespace:
+            return SimpleNamespace(
+                raw_data={"tag_name": "v1.0.0"}, published_at=self.pushed_at
+            )
+
+        def compare(self, base: str, head: str) -> SimpleNamespace:
+            assert base == "v1.0.0"
+            assert head == "abc123"
+            return SimpleNamespace(total_commits=4)
+
+    repo = FakeRepo()
+    cached_entry = RepoEntry(
+        name="tools",
+        description="Tooling",
+        category="Infrastructure",
+        subcategory="Tooling",
+        default_branch="main",
+        default_branch_sha="abc123",
+        content=DeepContentSignals(
+            is_bazel_repo=True,
+            bazel_version="8.4.2",
+            codeowners=("@infra-team",),
+            has_lint_config=True,
+            has_ci=True,
+            uses_cicd_daily_workflow=True,
+            has_coverage_config=False,
+        ),
+        volatile=VolatileMetricsSnapshot(
+            open_issues=1,
+            open_prs=1,
+            open_ready_prs=1,
+            merged_prs_30_days=1,
+            latest_release_version="v0.9.0",
+            latest_release_date="2026-04-01",
+            commits_since_latest_release=1,
+            volatile_metrics_fetched_at="2026-04-17T09:00:00+00:00",
+        ),
+    )
+
+    entry = repo_entry.collect_repository_entry(
+        repository_name="tools",
+        repository=repo,
+        custom_properties={},
+        bazel_registry_metadata=None,
+        cached_entry=cached_entry,
+        reuse_cached_entry_when_unchanged=True,
+    )
+
+    assert repo.tree_calls == 1
+    assert entry.content.is_bazel_repo is True
+    assert entry.volatile.open_prs == 2
+    assert entry.volatile.open_ready_prs == 1
+    assert entry.volatile.open_draft_prs == 1
+    assert entry.volatile.open_issues == 4
+    assert entry.volatile.latest_release_version == "v1.0.0"
+    assert entry.volatile.commits_since_latest_release == 4
+    assert entry.volatile.volatile_metrics_fetched_at == "2026-04-17T12:00:00+00:00"
+
+
+def test_get_open_pull_request_counts_splits_ready_and_draft() -> None:
+    repository = SimpleNamespace(
+        get_pulls=lambda state="open": [
+            SimpleNamespace(draft=False),
+            SimpleNamespace(raw_data={"draft": True}),
+            SimpleNamespace(draft=False),
+        ]
+    )
+
+    assert repo_entry.get_open_pull_request_counts(repository) == {
+        "ready": 2,
+        "draft": 1,
+        "total": 3,
+    }
+    assert (
+        repo_entry.get_open_issue_count(
+            SimpleNamespace(open_issues_count=5),
+            open_pull_request_total=3,
+        )
+        == 2
+    )
+
+
+def test_get_merged_pull_request_count_last_30_days_filters_by_branch_and_window(
+    monkeypatch: pytest.MonkeyPatch,
+) -> None:
+    class FixedDatetime(datetime):
+        @classmethod
+        def now(cls, tz: Any = None) -> datetime:
+            return now if tz is not None else now.replace(tzinfo=None)
+
+    now = FixedDatetime(2026, 4, 17, 12, 0, tzinfo=UTC)
+    cutoff = now - repo_entry.timedelta(days=repo_entry.MERGED_PULL_REQUEST_WINDOW_DAYS)
+
+    monkeypatch.setattr(repo_entry, "datetime", FixedDatetime)
+
+    def get_pulls(
+        *, state: str, sort: str, direction: str, base: str
+    ) -> list[SimpleNamespace]:
+        assert state == "closed"
+        assert sort == "updated"
+        assert direction == "desc"
+        assert base == "main"
+        return [
+            SimpleNamespace(
+                merged_at=now - repo_entry.timedelta(days=5),
+                updated_at=now - repo_entry.timedelta(days=4),
+                base=SimpleNamespace(ref="main"),
+            ),
+            SimpleNamespace(
+                merged_at=now - repo_entry.timedelta(days=2),
+                updated_at=now - repo_entry.timedelta(days=1),
+                base=SimpleNamespace(ref="release"),
+            ),
+            SimpleNamespace(
+                merged_at=None,
+                updated_at=now - repo_entry.timedelta(days=1),
+                base=SimpleNamespace(ref="main"),
+            ),
+            SimpleNamespace(
+                merged_at=cutoff - repo_entry.timedelta(days=1),
+                updated_at=cutoff - repo_entry.timedelta(days=1),
+                base=SimpleNamespace(ref="main"),
+            ),
+        ]
+
+    repository = SimpleNamespace(get_pulls=get_pulls)
+
+    assert (
+        repo_entry.get_merged_pull_request_count_last_30_days(
+            repository,
+            default_branch="main",
+        )
+        == 1
+    )
+
+
+def test_get_merged_pull_request_count_last_30_days_returns_zero_without_default_branch() -> (
+    None
+):
+    repository = SimpleNamespace(get_pulls=lambda **kwargs: [])
+
+    assert (
+        repo_entry.get_merged_pull_request_count_last_30_days(
+            repository,
+            default_branch=None,
+        )
+        == 0
+    )
+
+
+def test_get_latest_release_details_returns_none_when_release_lookup_is_lazy() -> None:
+    class LazyFailingRelease:
+        @property
+        def tag_name(self) -> str:
+            raise RuntimeError("Not Found")
+
+    repository = SimpleNamespace(get_latest_release=lambda: LazyFailingRelease())
+
+    assert repo_entry.get_latest_release_details(
+        repository,
+        default_branch="main",
+        default_branch_sha="abc123",
+    ) == {
+        "version": None,
+        "date": None,
+        "commits_since_release": None,
+        "release_bazel_version": None,
+        "release_bazel_deps": (),
+    }
+
+
+def test_get_latest_release_version_prefers_raw_tag_name() -> None:
+    release = SimpleNamespace(
+        raw_data={"tag_name": "v0.2.5", "name": "Release 0.2.5"},
+        name="Release 0.2.5",
+        tag_name="latest",
+    )
+
+    assert repo_entry.get_latest_release_version(release) == "v0.2.5"
+
+
+def test_get_latest_release_version_ignores_latest_sentinel_without_raw_data() -> None:
+    release = SimpleNamespace(name="latest", title="latest")
+
+    assert repo_entry.get_latest_release_version(release) is None
+
+
+def test_detect_bazel_version_ignores_module_version_without_dot_bazelversion() -> None:
+    assert (
+        signal_detection.detect_bazel_version(
+            SimpleNamespace(),
+            tree_paths={"MODULE.bazel"},
+            ref="abc123",
+        )
+        is None
+    )
+
+
+def test_get_bazel_dep_version_extracts_docs_as_code_dependency_version() -> None:
+    assert (
+        signal_detection.get_bazel_dep_version(
+            'bazel_dep(name = "score_docs_as_code", version = "4.0.0")\n',
+            module_name="score_docs_as_code",
+        )
+        == "4.0.0"
+    )
+
+
+def test_get_bazel_dep_version_ignores_other_dependencies() -> None:
+    assert (
+        signal_detection.get_bazel_dep_version(
+            'bazel_dep(name = "score_process", version = "1.2.3")\n',
+            module_name="score_docs_as_code",
+        )
+        is None
+    )
+
+
+def test_reference_integration_reads_recursive_included_module_files(
+    tmp_path: Path,
+) -> None:
+    (tmp_path / "MODULE.bazel").write_text(
+        """
+bazel_dep(name = "score_root")
+include("//bazel_common:deps.MODULE.bazel")
+""".strip(),
+        encoding="utf-8",
+    )
+    bazel_common = tmp_path / "bazel_common"
+    bazel_common.mkdir()
+    (bazel_common / "deps.MODULE.bazel").write_text(
+        """
+bazel_dep(name = "score_tooling")
+include(":nested.MODULE.bazel")
+""".strip(),
+        encoding="utf-8",
+    )
+    (bazel_common / "nested.MODULE.bazel").write_text(
+        'bazel_dep(name = "score_logging")\n',
+        encoding="utf-8",
+    )
+
+    contents = reference_integration.read_included_module_files(tmp_path)
+
+    assert set(contents) == {
+        Path("MODULE.bazel"),
+        Path("bazel_common/deps.MODULE.bazel"),
+        Path("bazel_common/nested.MODULE.bazel"),
+    }
+    assert reference_integration.get_bazel_dep_names_from_contents(
+        contents.values()
+    ) == ("score_root", "score_tooling", "score_logging")
+
+
+def test_reference_integration_maps_git_overrides_to_active_repositories() -> None:
+    assert reference_integration.get_git_override_repositories_from_text(
+        """
+git_override(
+    module_name = "score_tooling",
+    commit = "abc123",
+    remote = "https://github.com/eclipse-score/tooling.git",
+)
+git_override(
+    module_name = "external",
+    remote = "https://github.com/example/external.git",
+)
+""".strip(),
+        active_repository_names={"tooling"},
+    ) == {"score_tooling": "tooling"}
+
+
+def test_reference_integration_maps_bazel_registry_modules_to_repositories(
+    tmp_path: Path,
+    monkeypatch: pytest.MonkeyPatch,
+) -> None:
+    registry_root = tmp_path / "bazel_registry_checkout"
+    metadata_dir = registry_root / "modules" / "score_process"
+    metadata_dir.mkdir(parents=True)
+    (metadata_dir / "metadata.json").write_text(
+        """
+{
+  "repository": ["github:eclipse-score/process_description"],
+  "versions": ["1.0.0"]
+}
+""".strip(),
+        encoding="utf-8",
+    )
+    monkeypatch.setattr(
+        reference_integration,
+        "BAZEL_REGISTRY_LOCAL_CHECKOUT",
+        registry_root,
+    )
+
+    assert reference_integration.get_bazel_registry_repositories_by_module(
+        active_repository_names={"process_description"}
+    ) == {"score_process": "process_description"}
+
+
+def test_get_codeowners_for_path_prefers_specific_codeowners_rule() -> None:
+    assert signal_detection.get_codeowners_for_path(
+        """
+* @infra-team
+.github/CODEOWNERS @docs-team @platform-team
+""".strip(),
+        target_path=".github/CODEOWNERS",
+    ) == ("@docs-team", "@platform-team")
+
+
+def test_get_codeowners_for_path_normalizes_comma_separated_owners() -> None:
+    assert signal_detection.get_codeowners_for_path(
+        """
+* @armin-acn, @johannes-esr, @masc2023
+""".strip(),
+        target_path=".github/CODEOWNERS",
+    ) == ("@armin-acn", "@johannes-esr", "@masc2023")
+
+
+def test_parse_bazel_registry_metadata_maps_active_repository_and_latest_version() -> (
+    None
+):
+    metadata = registry_metadata.parse_bazel_registry_metadata(
+        """
+{
+  "maintainers": [
+    {
+      "name": "Andrey Babanin",
+      "github": "4og"
+    }
+  ],
+  "repository": [
+    "github:eclipse-score/baselibs",
+    "github:someone-else/ignored"
+  ],
+  "versions": ["0.2.5", "0.2.4"]
+}
+""".strip(),
+        active_repository_names={"baselibs"},
+    )
+
+    assert metadata == {
+        "baselibs": {
+            "maintainers_in_bazel_registry": ("Andrey Babanin (@4og)",),
+            "latest_bazel_registry_version": "0.2.5",
+        }
+    }
+
+
+def test_merge_bazel_registry_metadata_combines_owners_and_keeps_latest_version() -> (
+    None
+):
+    assert registry_metadata.merge_bazel_registry_metadata(
+        {
+            "maintainers_in_bazel_registry": ("Andrey Babanin (@4og)",),
+            "latest_bazel_registry_version": "0.2.5",
+        },
+        {
+            "maintainers_in_bazel_registry": (
+                "Andrey Babanin (@4og)",
+                "Nikola Radakovic (@nradakovic)",
+            ),
+            "latest_bazel_registry_version": "0.2.4",
+        },
+    ) == {
+        "maintainers_in_bazel_registry": (
+            "Andrey Babanin (@4og)",
+            "Nikola Radakovic (@nradakovic)",
+        ),
+        "latest_bazel_registry_version": "0.2.5",
+    }
+
+
+def test_uses_cicd_daily_workflow_detects_shared_daily_workflow_reference() -> None:
+    class FakeRepo:
+        def get_contents(self, path: str, ref: str) -> SimpleNamespace:
+            assert path == ".github/workflows/nightly.yml"
+            assert ref == "abc123"
+            return SimpleNamespace(
+                decoded_content=(
+                    b"jobs:\n"
+                    b"  daily:\n"
+                    b"    uses: eclipse-score/cicd-workflows/.github/workflows/daily.yml@main\n"
+                )
+            )
+
+    assert signal_detection.uses_cicd_daily_workflow(
+        FakeRepo(),
+        tree_paths={".github/workflows/nightly.yml"},
+        ref="abc123",
+    )
+
+
+def test_get_commits_since_release_returns_none_when_compare_is_lazy() -> None:
+    class LazyComparison:
+        @property
+        def total_commits(self) -> int:
+            raise RuntimeError("Not Found")
+
+    repository = SimpleNamespace(compare=lambda base, head: LazyComparison())
+    release = SimpleNamespace(tag_name="v1.2.3")
+
+    assert (
+        repo_entry.get_commits_since_release(
+            repository,
+            release=release,
+            default_branch="main",
+            default_branch_sha="abc123",
+        )
+        is None
+    )
+
+
+def test_collect_snapshot_reports_rest_api_limits_before_and_after(
+    monkeypatch: pytest.MonkeyPatch,
+    capsys: pytest.CaptureFixture[str],
+) -> None:
+    fake_github_module = ModuleType("github")
+
+    class FakeToken:
+        def __init__(self, token: str) -> None:
+            self.token = token
+
+    class FakeAuth:
+        Token = FakeToken
+
+    class FakeGithub:
+        def __init__(self, *, auth: FakeToken, lazy: bool) -> None:
+            self.auth = auth
+            self.lazy = lazy
+            self.rate_limit_calls = 0
+
+        def get_rate_limit(self) -> SimpleNamespace:
+            self.rate_limit_calls += 1
+            return SimpleNamespace(
+                core=SimpleNamespace(
+                    limit=5000,
+                    remaining=5000 - self.rate_limit_calls,
+                    used=self.rate_limit_calls,
+                    reset=datetime(2026, 4, 14, 12, 0, tzinfo=UTC),
+                )
+            )
+
+        def get_organization(self, org_name: str) -> SimpleNamespace:
+            return SimpleNamespace(name=org_name)
+
+    fake_github_module_any = cast("Any", fake_github_module)
+    fake_github_module_any.Auth = FakeAuth
+    fake_github_module_any.Github = FakeGithub
+
+    monkeypatch.setitem(sys.modules, "github", fake_github_module)
+    monkeypatch.setattr(collector, "resolve_github_token", lambda token_env: "token")
+    monkeypatch.setattr(collector, "fetch_repositories", lambda *args, **kwargs: [])
+
+    snapshot = collector.collect_snapshot(cache_path=None)
+
+    captured = capsys.readouterr()
+
+    assert snapshot.org_name == "eclipse-score"
+    assert snapshot.repos == ()
+    assert (
+        "GitHub REST API rate limit before collection: remaining 4999/5000, "
+        "used 1, resets at 2026-04-14T12:00:00+00:00" in captured.err
+    )
+    assert (
+        "GitHub REST API rate limit after collection: remaining 4998/5000, "
+        "used 2, resets at 2026-04-14T12:00:00+00:00" in captured.err
+    )
+
+
+def test_fetch_repositories_reports_per_repository_progress(
+    capsys: pytest.CaptureFixture[str],
+) -> None:
+    tools_repo = SimpleNamespace(archived=False, name="tools")
+    alpha_repo = SimpleNamespace(archived=False, name="alpha")
+    organization = SimpleNamespace()
+    cached_snapshot = RepoSnapshot(
+        schema_version=SNAPSHOT_SCHEMA_VERSION,
+        org_name="eclipse-score",
+        generated_at="2026-04-13T12:00:00+00:00",
+        repos=(
+            RepoEntry(
+                name="alpha",
+                description="Alpha",
+                category="Infrastructure",
+                subcategory="Tooling",
+            ),
+        ),
+    )
+
+    original_collect_repository_entry = repo_entry.collect_repository_entry
+    original_fetch_active_repositories = collector.fetch_active_repositories
+
+    def fake_collect_repository_entry(**kwargs: Any) -> RepoEntry:
+        return RepoEntry(
+            name=kwargs["repository_name"],
+            description="placeholder",
+            category="Infrastructure",
+            subcategory="Tooling",
+        )
+
+    try:
+        collector.fetch_active_repositories = lambda organization: {
+            "tools": collector.ActiveRepositoryData(
+                repository=tools_repo,
+                custom_properties={},
+            ),
+            "alpha": collector.ActiveRepositoryData(
+                repository=alpha_repo,
+                custom_properties={},
+            ),
+        }
+        repo_entry.collect_repository_entry = fake_collect_repository_entry
+        collector.fetch_repositories(
+            cast("Any", organization),
+            existing_snapshot=cached_snapshot,
+        )
+    finally:
+        repo_entry.collect_repository_entry = original_collect_repository_entry
+        collector.fetch_active_repositories = original_fetch_active_repositories
+
+    captured = capsys.readouterr()
+
+    assert "Found 2 active repositories" in captured.err
+    assert "Extracted custom properties for 0 repositories" in captured.err
+    assert "Collecting repository details with up to 2 parallel workers" in captured.err
+
+
+def test_fetch_repositories_preserves_sorted_output_with_parallel_collection() -> None:
+    alpha_repo = SimpleNamespace(archived=False, name="alpha")
+    tools_repo = SimpleNamespace(archived=False, name="tools")
+    organization = SimpleNamespace()
+
+    original_collect_repository_entry = repo_entry.collect_repository_entry
+    original_fetch_active_repositories = collector.fetch_active_repositories
+    try:
+        collector.fetch_active_repositories = lambda organization: {
+            "tools": collector.ActiveRepositoryData(
+                repository=tools_repo,
+                custom_properties={},
+            ),
+            "alpha": collector.ActiveRepositoryData(
+                repository=alpha_repo,
+                custom_properties={},
+            ),
+        }
+
+        def fake_collect_repository_entry(**kwargs: Any) -> RepoEntry:
+            if kwargs["repository_name"] == "alpha":
+                time.sleep(0.03)
+            return RepoEntry(
+                name=kwargs["repository_name"],
+                description="placeholder",
+                category="Infrastructure",
+                subcategory="Tooling",
+            )
+
+        repo_entry.collect_repository_entry = fake_collect_repository_entry
+        repos = collector.fetch_repositories(cast("Any", organization))
+    finally:
+        repo_entry.collect_repository_entry = original_collect_repository_entry
+        collector.fetch_active_repositories = original_fetch_active_repositories
+
+    assert [repo.name for repo in repos] == ["alpha", "tools"]
+
+
+def test_resolve_max_collection_workers_prefers_positive_env_override(
+    monkeypatch: pytest.MonkeyPatch,
+) -> None:
+    monkeypatch.setenv("REPO_OVERVIEW_MAX_WORKERS", "12")
+
+    assert collector.resolve_max_collection_workers() == 12
+
+
+def test_resolve_max_collection_workers_ignores_invalid_env_override(
+    monkeypatch: pytest.MonkeyPatch,
+) -> None:
+    monkeypatch.setenv("REPO_OVERVIEW_MAX_WORKERS", "nope")
+
+    assert (
+        collector.resolve_max_collection_workers()
+        == collector.DEFAULT_MAX_COLLECTION_WORKERS
+    )
+
+
+def test_metrics_report_renders_summary_and_table() -> None:
+    snapshot = RepoSnapshot(
+        schema_version=SNAPSHOT_SCHEMA_VERSION,
+        org_name="eclipse-score",
+        generated_at="2026-04-13T12:00:00+00:00",
+        repos=(
+            RepoEntry(
+                name="tools",
+                description="Tooling",
+                category="Infrastructure",
+                subcategory="Tooling",
+                content=DeepContentSignals(
+                    is_bazel_repo=True,
+                    bazel_version="8.4.2",
+                    codeowners=(
+                        "@docs-team",
+                        "@platform-team",
+                        "@infra-team",
+                        "@qa-team",
+                    ),
+                    referenced_by_reference_integration=True,
+                    has_lint_config=True,
+                    has_ci=True,
+                    uses_cicd_daily_workflow=True,
+                    has_coverage_config=False,
+                ),
+                registry=RegistrySignals(
+                    maintainers_in_bazel_registry=(
+                        "Andrey Babanin (@4og)",
+                        "Nikola Radakovic (@nradakovic)",
+                        "Pawel Rutka (@pawelrutkaq)",
+                    ),
+                    latest_bazel_registry_version="0.2.5",
+                ),
+                volatile=VolatileMetricsSnapshot(
+                    merged_prs_30_days=11,
+                    open_issues=2,
+                    open_prs=2,
+                    open_ready_prs=1,
+                    open_draft_prs=1,
+                    latest_release_version="v1.2.3",
+                    latest_release_date="2026-04-01",
+                    commits_since_latest_release=7,
+                ),
+                stars=3,
+                forks=4,
+            ),
+        ),
+    )
+
+    markdown = render_metrics_report(snapshot)
+
+    assert "# Cross-Repo Metrics Report" in markdown
+    assert "- Repositories: 1" in markdown
+    assert "- With GitHub Actions: 1" in markdown
+    assert "- Using daily workflow: 1" in markdown
+    assert "## Table Of Contents" in markdown
+    assert "- [Repository Overview](#repository-overview)" in markdown
+    assert "- [Versions](#versions)" in markdown
+    assert "- [Ownership](#ownership)" not in markdown
+    assert "- [Ownership With Versions](#ownership-with-versions)" not in markdown
+    assert "`⚙ GitHub Actions`: shown when `.github/workflows` exists." in markdown
+    assert "## Repository Overview" in markdown
+    assert "## Versions" in markdown
+    assert (
+        "| Repository | Ownership | Merged PRs (30d) | Open Issues / PRs (ready+draft) | Latest Release + Commits Since Release | Stars / Forks |"
+        in markdown
+    )
+    assert "## Ownership" not in markdown
+    assert "## Ownership With Versions" not in markdown
+    assert "## Delivery And Automation" in markdown
+    assert "### Infrastructure" in markdown
+    assert (
+        "| [tools](https://github.com/eclipse-score/tools) "
+        '<img src="https://bazel.build/_pwa/bazel/icons/icon-72x72.png" alt="Bazel" width="16" height="16"> | '
+        "<small><sub><small>Codeowners: @docs-team, @platform-team, @infra-team, @qa-team<br><br>"
+        "Maintainers In Bazel Registry: @4og, @nradakovic, @pawelrutkaq</small></sub></small> | "
+        "🔥 11 | 2 / 1+1 | v1.2.3 + 🟡 7 | 3 / 4 |" in markdown
+    )
+    assert (
+        "| [tools](https://github.com/eclipse-score/tools) | "
+        "🟢 8.4.2 | ⚪ - | yes |" in markdown
+    )
+    assert (
+        "| [tools](https://github.com/eclipse-score/tools) | - | - | - | ⚙ | yes | no |"
+        in markdown
+    )
+
+
+def test_metrics_report_uses_no_for_non_bazel_repo_in_overview() -> None:
+    snapshot = RepoSnapshot(
+        schema_version=SNAPSHOT_SCHEMA_VERSION,
+        org_name="eclipse-score",
+        generated_at="2026-04-13T12:00:00+00:00",
+        repos=(
+            RepoEntry(
+                name="tools",
+                description="Tooling",
+                category="Infrastructure",
+                subcategory="Tooling",
+            ),
+        ),
+    )
+
+    markdown = render_metrics_report(snapshot)
+
+    assert (
+        "| [tools](https://github.com/eclipse-score/tools) | - "
+        "| 0 | 0 / 0+0 | - | 0 / 0 |" in markdown
+    )
+
+
+def test_metrics_report_shows_fire_icon_for_high_merged_pr_activity() -> None:
+    snapshot = RepoSnapshot(
+        schema_version=SNAPSHOT_SCHEMA_VERSION,
+        org_name="eclipse-score",
+        generated_at="2026-04-13T12:00:00+00:00",
+        repos=(
+            RepoEntry(
+                name="tools",
+                description="Tooling",
+                category="Infrastructure",
+                subcategory="Tooling",
+                volatile=VolatileMetricsSnapshot(merged_prs_30_days=10),
+            ),
+        ),
+    )
+
+    markdown = render_metrics_report(snapshot)
+
+    assert "| [tools](https://github.com/eclipse-score/tools) | - | 🔥 10 |" in markdown
+
+
+def test_metrics_report_ownership_cell_skips_maintainers_for_non_bazel_repo() -> None:
+    snapshot = RepoSnapshot(
+        schema_version=SNAPSHOT_SCHEMA_VERSION,
+        org_name="eclipse-score",
+        generated_at="2026-04-13T12:00:00+00:00",
+        repos=(
+            RepoEntry(
+                name="tools",
+                description="Tooling",
+                category="Infrastructure",
+                subcategory="Tooling",
+                content=DeepContentSignals(
+                    is_bazel_repo=False,
+                    codeowners=("@docs-team",),
+                ),
+                registry=RegistrySignals(
+                    maintainers_in_bazel_registry=("Andrey Babanin (@4og)",),
+                ),
+            ),
+        ),
+    )
+
+    markdown = render_metrics_report(snapshot)
+
+    assert "<small><sub><small>Codeowners: @docs-team</small></sub></small>" in markdown
+    assert "Maintainers In Bazel Registry:" not in markdown
+
+
+def test_metrics_report_ownership_cell_marks_missing_maintainers_for_bazel_repo() -> (
+    None
+):
+    snapshot = RepoSnapshot(
+        schema_version=SNAPSHOT_SCHEMA_VERSION,
+        org_name="eclipse-score",
+        generated_at="2026-04-13T12:00:00+00:00",
+        repos=(
+            RepoEntry(
+                name="tools",
+                description="Tooling",
+                category="Infrastructure",
+                subcategory="Tooling",
+                content=DeepContentSignals(
+                    is_bazel_repo=True,
+                    codeowners=("@docs-team",),
+                ),
+                registry=RegistrySignals(
+                    maintainers_in_bazel_registry=(),
+                ),
+            ),
+        ),
+    )
+
+    markdown = render_metrics_report(snapshot)
+
+    assert "Maintainers In Bazel Registry:" not in markdown
+
+
+def test_metrics_report_renders_versions_table() -> None:
+    snapshot = RepoSnapshot(
+        schema_version=SNAPSHOT_SCHEMA_VERSION,
+        org_name="eclipse-score",
+        generated_at="2026-04-13T12:00:00+00:00",
+        repos=(
+            RepoEntry(
+                name="process_description",
+                description="Process docs",
+                category="Infrastructure",
+                subcategory="tooling",
+                content=DeepContentSignals(
+                    is_bazel_repo=True,
+                    bazel_version="8.4.2",
+                    docs_as_code_version="4.0.0",
+                    referenced_by_reference_integration=True,
+                    has_ci=True,
+                    uses_cicd_daily_workflow=True,
+                ),
+                volatile=VolatileMetricsSnapshot(
+                    last_push_date="2026-04-12",
+                    open_issues=35,
+                    open_prs=8,
+                    open_ready_prs=6,
+                    open_draft_prs=2,
+                ),
+            ),
+        ),
+    )
+
+    markdown = render_metrics_report(snapshot)
+
+    assert "## Versions" in markdown
+    assert "🔴 6" in markdown
+    assert (
+        "| [process_description](https://github.com/eclipse-score/process_description) | "
+        "🟢 8.4.2 | ⚪ 4.0.0 | yes |" in markdown
+    )
+
+
+def test_versions_table_docs_as_code_color_rules() -> None:
+    snapshot = RepoSnapshot(
+        schema_version=SNAPSHOT_SCHEMA_VERSION,
+        org_name="eclipse-score",
+        generated_at="2026-04-13T12:00:00+00:00",
+        repos=(
+            RepoEntry(
+                name="docs-as-code",
+                description="Docs",
+                category="Infrastructure",
+                subcategory="Tooling",
+                volatile=VolatileMetricsSnapshot(latest_release_version="v4.1.3"),
+                content=DeepContentSignals(bazel_version="8.6.0"),
+            ),
+            RepoEntry(
+                name="same-release",
+                description="Same",
+                category="Infrastructure",
+                subcategory="Tooling",
+                content=DeepContentSignals(
+                    docs_as_code_version="4.1.3",
+                    bazel_version="8.5.0",
+                ),
+            ),
+            RepoEntry(
+                name="same-minor",
+                description="Minor",
+                category="Infrastructure",
+                subcategory="Tooling",
+                content=DeepContentSignals(
+                    docs_as_code_version="4.1.1",
+                    bazel_version="8.4.0",
+                ),
+            ),
+            RepoEntry(
+                name="older",
+                description="Older",
+                category="Infrastructure",
+                subcategory="Tooling",
+                content=DeepContentSignals(
+                    docs_as_code_version="3.9.9",
+                    bazel_version="8.3.0",
+                ),
+            ),
+            RepoEntry(
+                name="none",
+                description="None",
+                category="Infrastructure",
+                subcategory="Tooling",
+                content=DeepContentSignals(
+                    docs_as_code_version=None,
+                    bazel_version=None,
+                ),
+            ),
+        ),
+    )
+
+    markdown = render_metrics_report(snapshot)
+
+    assert (
+        "| [docs-as-code](https://github.com/eclipse-score/docs-as-code) | 🟢 8.6.0 | ⚪ - | no |"
+        in markdown
+    )
+    assert (
+        "| [same-release](https://github.com/eclipse-score/same-release) | 🔴 8.5.0 | 🟢 4.1.3 | no |"
+        in markdown
+    )
+    assert (
+        "| [same-minor](https://github.com/eclipse-score/same-minor) | 🔴 8.4.0 | 🟡 4.1.1 | no |"
+        in markdown
+    )
+    assert (
+        "| [older](https://github.com/eclipse-score/older) | 🔴 8.3.0 | 🔴 3.9.9 | no |"
+        in markdown
+    )
+    assert (
+        "| [none](https://github.com/eclipse-score/none) | ⚪ - | ⚪ - | no |"
+        in markdown
+    )
+
+
+def test_load_snapshot_if_present_ignores_mismatched_schema(tmp_path: Path) -> None:
+    cache_path = tmp_path / "repo_overview.json"
+    cache_path.write_text(
+        (
+            "{\n"
+            '  "schema_version": 2,\n'
+            '  "org_name": "eclipse-score",\n'
+            '  "generated_at": "2026-04-13T12:00:00+00:00",\n'
+            '  "repos": []\n'
+            "}\n"
+        ),
+        encoding="utf-8",
+    )
+
+    assert snapshot_io.load_snapshot_if_present(cache_path) is None
diff --git a/uv.lock b/uv.lock
index 2a6eddf..dc98d61 100644
--- a/uv.lock
+++ b/uv.lock
@@ -242,6 +242,37 @@ wheels = [
     { url = "https://files.pythonhosted.org/packages/a4/a5/842ae8f0c08b61d6484b52f99a03510a3a72d23141942d216ebe81fefbce/filelock-3.25.2-py3-none-any.whl", hash = "sha256:ca8afb0da15f229774c9ad1b455ed96e85a81373065fb10446672f64444ddf70", size = 26759, upload-time = "2026-03-11T20:45:37.437Z" },
 ]
 
+[[package]]
+name = "generate-repo-overview"
+version = "0.0.0"
+source = { editable = "." }
+dependencies = [
+    { name = "pygithub" },
+    { name = "tqdm" },
+]
+
+[package.dev-dependencies]
+dev = [
+    { name = "basedpyright" },
+    { name = "pre-commit" },
+    { name = "pytest" },
+    { name = "ruff" },
+]
+
+[package.metadata]
+requires-dist = [
+    { name = "pygithub" },
+    { name = "tqdm" },
+]
+
+[package.metadata.requires-dev]
+dev = [
+    { name = "basedpyright" },
+    { name = "pre-commit" },
+    { name = "pytest" },
+    { name = "ruff" },
+]
+
 [[package]]
 name = "identify"
 version = "2.6.18"
@@ -337,33 +368,6 @@ wheels = [
     { url = "https://files.pythonhosted.org/packages/5d/19/fd3ef348460c80af7bb4669ea7926651d1f95c23ff2df18b9d24bab4f3fa/pre_commit-4.5.1-py2.py3-none-any.whl", hash = "sha256:3b3afd891e97337708c1674210f8eba659b52a38ea5f822ff142d10786221f77", size = 226437, upload-time = "2025-12-16T21:14:32.409Z" },
 ]
 
-[[package]]
-name = "profile-readme-generator"
-version = "0.0.0"
-source = { editable = "." }
-dependencies = [
-    { name = "pygithub" },
-]
-
-[package.dev-dependencies]
-dev = [
-    { name = "basedpyright" },
-    { name = "pre-commit" },
-    { name = "pytest" },
-    { name = "ruff" },
-]
-
-[package.metadata]
-requires-dist = [{ name = "pygithub" }]
-
-[package.metadata.requires-dev]
-dev = [
-    { name = "basedpyright" },
-    { name = "pre-commit" },
-    { name = "pytest" },
-    { name = "ruff" },
-]
-
 [[package]]
 name = "pycparser"
 version = "3.0"
@@ -562,6 +566,18 @@ wheels = [
     { url = "https://files.pythonhosted.org/packages/15/e2/77be4fff062fa78d9b2a4dea85d14785dac5f1d0c1fb58ed52331f0ebe28/ruff-0.15.8-py3-none-win_arm64.whl", hash = "sha256:cf891fa8e3bb430c0e7fac93851a5978fc99c8fa2c053b57b118972866f8e5f2", size = 11048175, upload-time = "2026-03-26T18:40:01.06Z" },
 ]
 
+[[package]]
+name = "tqdm"
+version = "4.67.3"
+source = { registry = "https://pypi.org/simple" }
+dependencies = [
+    { name = "colorama", marker = "sys_platform == 'win32'" },
+]
+sdist = { url = "https://files.pythonhosted.org/packages/09/a9/6ba95a270c6f1fbcd8dac228323f2777d886cb206987444e4bce66338dd4/tqdm-4.67.3.tar.gz", hash = "sha256:7d825f03f89244ef73f1d4ce193cb1774a8179fd96f31d7e1dcde62092b960bb", size = 169598, upload-time = "2026-02-03T17:35:53.048Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/16/e1/3079a9ff9b8e11b846c6ac5c8b5bfb7ff225eee721825310c91b3b50304f/tqdm-4.67.3-py3-none-any.whl", hash = "sha256:ee1e4c0e59148062281c49d80b25b67771a127c85fc9676d3be5f243206826bf", size = 78374, upload-time = "2026-02-03T17:35:50.982Z" },
+]
+
 [[package]]
 name = "typing-extensions"
 version = "4.15.0"