TensorComparativeVis

TensorComparativeVis は、高階テンソルとして表現された多変量時系列データの探索的比較分析を支援する、Human-in-the-Loop 型ビジュアルアナリティクスフレームワークです。事前定義されたグループラベルに依存せず、非線形パターンの発見と解釈を可能にします。

主な機能

探索的比較分析: 2D 散布図上で任意のクラスタをインタラクティブに選択し、局所的な時間的異常や予期しないパターンを発見
テンソルベース分析: TULCA（Tensor Unified Linear Comparative Analysis）による柔軟なコアテンソル抽出と PaCMAP による非線形次元削減を組み合わせ、潜在構造を保持した可視化を実現
定量的解釈: Random Forest による特徴量重要度分析と逆投影を通じて、時間・空間・変数の影響度の高い組み合わせを特定。統計的検証（Welch の t 検定、Mann-Whitney U 検定、Cohen's d 効果量、Benjamini-Hochberg FDR 補正）付き
LLM による自然言語解釈: Google Gemini API を活用し、定量的結果とドメイン知識を統合した自然言語での解釈を自動生成
連動可視化 UI: 散布図・時系列・ランキング・ヒートマップ（または地図）・AI解釈が同一状態で連動
ドメイン非依存アーキテクチャ: YAML 設定ファイルとドメイン戦略パターンにより、異なるデータドメイン（HPC、大気データ等）に柔軟に対応
時系列詳細モーダルとPNG出力: AI解釈のマーカークリックで時系列詳細を表示し、各パネルをスクリーンショット保存可能

ワークフロー

本フレームワークは以下の2つの反復的フェーズで動作します：

潜在パターン抽出と可視化: ラベル付きテンソルデータに対し、TULCA によるコアテンソル抽出 → PaCMAP による非線形次元削減 → 2D 散布図への可視化を実行
探索的比較と解釈: 散布図上でクラスタを対話的に選択 → Random Forest による特徴量重要度の算出 → 元データ空間への逆投影 → 統計的検定による差異の検証 → LLM による自然言語解釈の生成

技術スタック

レイヤー	技術
フロントエンド	React 19 + TypeScript, Chakra UI, D3.js, Zustand
バックエンド	FastAPI + Python 3.9+
AI 解釈	Google Gemini API（未設定時はフォールバック解釈）
分析	TULCA, PaCMAP, Random Forest, SciPy (統計検定)

クイックスタート

前提条件

Node.js 18+ および npm
Python 3.9+
Google Gemini API キー（LLM 機能を使用する場合）

データの配置

ドメインごとに data/processed/ 配下へ配置します（APP_CONFIG で切り替え）：

data/processed/
├── HPC/
│   ├── HPC_tensor_X.npy
│   ├── HPC_tensor_y.npy
│   ├── HPC_time_axis.npy
│   └── HPC_time_original.npy
└── AirData/
    ├── tensor_data_X_air.npy
    ├── tensor_data_y_air.npy
    ├── time_axis.npy
    └── coordinates.npy

バックエンドのセットアップ

cd backend

# 仮想環境の作成（推奨）
python -m venv venv
.\venv\Scripts\activate  # Windows
# source venv/bin/activate  # macOS/Linux

# 依存パッケージのインストール
pip install -r requirements.txt

# Gemini API キーの設定（LLM 機能を使用する場合）
# .env ファイルを作成し、以下を記載: GEMINI_API_KEY=your_key_here

# ドメイン設定の指定（環境変数で切り替え可能、デフォルト: hpc_default）
# set APP_CONFIG=air_data  # Windows
# export APP_CONFIG=air_data  # macOS/Linux

# サーバーの起動
uvicorn main:app --reload --port 8000

API: http://localhost:8000
Swagger UI ドキュメント: http://localhost:8000/docs

フロントエンドのセットアップ

cd frontend
npm install
npm run dev

アプリケーション: http://localhost:5173

まとめて起動（Windows）

プロジェクトルートで以下を実行すると、バックエンドとフロントエンドを同時起動できます。

start-dev.bat

環境変数

変数名	用途	例
`APP_CONFIG`	利用ドメイン設定の切り替え	`hpc_default` / `air_data`
`GEMINI_API_KEY`	AI解釈（Gemini）を有効化	`your_key_here`

GEMINI_API_KEY が未設定でもアプリは動作しますが、AI解釈は簡易フォールバックになります。

主要 API エンドポイント

GET /api/config: フロント表示用設定（変数名、クラス数、色、可視化タイプ）
GET /api/coordinates: 地理可視化用座標（AirData ドメイン）
POST /api/compute-embedding: TULCA + PaCMAP による埋め込み計算
POST /api/analyze-clusters: クラスタ差分分析（寄与度、統計検定）
POST /api/interpret-clusters: AI解釈テキスト生成
POST /api/timeseries: 指定地点の全変数時系列取得
GET /api/health: ヘルスチェック

プロジェクト構成

TensorComparativeVis/
├── configs/                        # ドメイン別 YAML 設定ファイル
│   ├── hpc_default.yaml            #   HPC スーパーコンピュータデータ用
│   └── air_data.yaml               #   米国大気質データ用
│
├── backend/
│   ├── main.py                     # FastAPI エントリーポイント
│   ├── models.py                   # Pydantic スキーマ定義
│   └── app/
│       ├── config_loader.py        # YAML 設定読み込み・ドメイン生成
│       ├── routes.py               # 全 API エンドポイント
│       ├── core/                   # コアロジック
│       │   ├── tulca.py            #   TULCA アルゴリズム
│       │   ├── analysis.py         #   特徴量重要度・統計分析
│       │   ├── interpreter.py      #   Gemini API 連携 LLM 解釈
│       │   └── data_loader.py      #   テンソルデータ読み込み
│       └── domains/                # ドメイン戦略パターン
│           ├── base_domain.py      #   基底クラス（抽象インターフェース）
│           ├── hpc_domain.py       #   HPC ドメイン実装
│           └── air_data_domain.py  #   大気データドメイン実装
│
├── frontend/src/
│   ├── App.tsx                     # メインダッシュボードレイアウト
│   ├── theme.ts                    # Chakra UI テーマ設定
│   ├── components/
│   │   ├── ScatterPlot.tsx         #   2D 埋め込み＋投げ縄選択
│   │   ├── FeatureRanking.tsx      #   特徴量重要度ランキング
│   │   ├── Heatmap.tsx             #   寄与度ヒートマップ
│   │   ├── TimeSeriesPlot.tsx      #   時系列比較プロット
│   │   ├── TimeSeriesModal.tsx     #   時系列詳細モーダル
│   │   ├── AIInterpretation.tsx    #   LLM 解釈パネル
│   │   ├── Sidebar.tsx             #   パラメータ設定サイドバー
│   │   ├── GeoMapVis.tsx           #   地理的可視化
│   │   ├── SpatialVisualization.tsx#   空間可視化ラッパー
│   │   └── ScreenshotButton.tsx    #   スクリーンショット機能
│   ├── store/                      # Zustand 状態管理
│   ├── api/                        # API クライアント
│   └── types/                      # TypeScript 型定義
│
└── data/                           # テンソルデータ（gitignore 対象）

使い方

パラメータの設定: サイドバーで TULCA の重みパラメータ（w_tg, w_bw, w_bg）を調整
分析の実行: 「Execute」ボタンをクリックして埋め込みを計算
クラスタの選択: 投げ縄ツールで散布図上の Red（クラスタ1）と Blue（クラスタ2）領域を選択
結果の確認: 両クラスタが選択されると自動的に分析が実行され、特徴量ランキング・ヒートマップ・時系列比較・AI 解釈が表示
時系列詳細の確認: AI解釈内の <<rack-variable>> マーカーをクリックして詳細モーダルを表示
結果の保存（画像）: 各パネルのカメラアイコンから PNG を出力

ドメインの追加方法

新しいデータドメインを追加するには：

backend/app/domains/ に BaseDomain を継承した新しいドメインクラスを作成
configs/ に対応する YAML 設定ファイルを作成
環境変数 APP_CONFIG でドメインを切り替え

# 例: 大気データドメインで起動
set APP_CONFIG=air_data  # Windows
uvicorn main:app --reload --port 8000

ライセンス

BSD-3-Clause

Name		Name	Last commit message	Last commit date
Latest commit History 27 Commits
.claude		.claude
backend		backend
configs		configs
frontend		frontend
.gitignore		.gitignore
CLAUDE.md		CLAUDE.md
LICENSE		LICENSE
README.md		README.md
start-dev.bat		start-dev.bat

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

TensorComparativeVis

主な機能

ワークフロー

技術スタック

クイックスタート

前提条件

データの配置

バックエンドのセットアップ

フロントエンドのセットアップ

まとめて起動（Windows）

環境変数

主要 API エンドポイント

プロジェクト構成

使い方

ドメインの追加方法

ライセンス

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

TensorComparativeVis

主な機能

ワークフロー

技術スタック

クイックスタート

前提条件

データの配置

バックエンドのセットアップ

フロントエンドのセットアップ

まとめて起動（Windows）

環境変数

主要 API エンドポイント

プロジェクト構成

使い方

ドメインの追加方法

ライセンス

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages