caput

trajectory collection + analysis pipeline.

Goal:

collect 10k-50k finished token trajectories
↓
find historical edges
↓
build live LONG/SHORT signal engine

SIMPLE MENTAL MODEL

There are only 3 important stages.

1. COLLECT

Collect live tokens + finished trajectories.

Files:

official_api_collector.py
fast_finished_collector.py

Result:

token_snapshots
official_api_token_state
finished_tokens

2. ANALYZE

Convert trajectories into features + historical strategies.

Files:

analyze.py
paper_sim.py
sweep.py
clusters.py
auto_run.py

Result:

trajectory_features
paper_trades
strategy_sweep
trajectory_clusters

3. LIVE SIGNALS (later)

Use historical edges on new live tokens.

Files:

live_features.py
live_signals.py
telegram_bot.py

Result:

LONG / SHORT / SKIP
risk
suggested leverage
historical setup match

CURRENT STAGE

Right now the ONLY important thing is:

collect as many finished trajectories as possible

Target:

10k minimum
50k ideal

Do NOT focus on real trading yet.

PROJECT STRUCTURE

CORE FILES

official_api_collector.py

Uses official public GraphQL API.

Collects:

live token state
price
volume
buys/sells
start/end dates
speed mode

Writes:

token_snapshots
official_api_token_state

Runs 24/7.

fast_finished_collector.py

Browser collector using logged-in browser profile.

Purpose:

collect finished trajectories

Only scans:

expired + ready tokens

Writes:

finished_tokens

Runs 24/7.

auto_run.py

Runs:

analyze.py
paper_sim.py
sweep.py

Use periodically.

clusters.py

Groups token trajectories into similar behavior clusters.

Used later for:

pattern matching

telegram_bot.py

Monitoring only for now.

Later:

live trading signals

DATABASE TABLES

token_snapshots

Live snapshots over time.

One token can create many rows.

90k snapshots != 90k tokens

official_api_token_state

Current latest state of each token.

One row per token.

finished_tokens

Final completed trajectories.

This is the MOST IMPORTANT dataset.

trajectory_features

Calculated statistics/features for trajectories.

strategy_sweep

Historical strategy backtests.

LOCAL VS RAILWAY

RUN LOCALLY

These require browser session / Cloudflare bypass.

local only

fast_finished_collector.py

Reason:

needs persistent logged-in browser profile

RUN ON RAILWAY

Safe/stateless services.

railway services

official_api_collector.py
telegram_bot.py

Possible later:

auto_run.py scheduler

REQUIRED ENV

Copy:

.env.example
→
.env

Important variables:

required

DATABASE_URL=
CATAPULT_API_KEY=

browser collector

LOCAL_PROFILE_DIR=browser_profile_fast2
FAST_FINISHED_READY_DELAY_SECONDS=90
FAST_FINISHED_USE_OFFICIAL_READY_QUEUE=true
FAST_FINISHED_ALLOW_SNAPSHOT_FALLBACK=false

NORMAL OPERATION

TERMINAL 1

python official_api_collector.py

TERMINAL 2

python fast_finished_collector.py

PERIODICALLY

python auto_run.py
python clusters.py

HOW TO READ STATUS

GOOD

saved >> not_ready

Example:

saved: 500
not_ready: 20

BAD

not_ready >> saved

Usually means:

ready delay too low

Increase:

FAST_FINISHED_READY_DELAY_SECONDS=120

CURRENT SUCCESS CRITERIA

GOOD DATASET

10k finished trajectories

VERY GOOD DATASET

25k+

PRODUCTION GRADE

50k+

FUTURE

Later the pipeline becomes:

token appears
↓
live features
↓
historical pattern matching
↓
LONG / SHORT / SKIP
↓
risk + leverage suggestion
↓
telegram alert

Name		Name	Last commit message	Last commit date
Latest commit History 92 Commits
.dockerignore		.dockerignore
.env.example		.env.example
.gitignore		.gitignore
Dockerfile		Dockerfile
LOCAL.md		LOCAL.md
README.md		README.md
analyze.py		analyze.py
api_probe.py		api_probe.py
app.py		app.py
auto_run.py		auto_run.py
clusters.py		clusters.py
collector.py		collector.py
data_health.py		data_health.py
direct_collector.py		direct_collector.py
expired_only_collector.py		expired_only_collector.py
fast_finished_collector.py		fast_finished_collector.py
finished_collector.py		finished_collector.py
live_features.py		live_features.py
live_loop.py		live_loop.py
live_performance.py		live_performance.py
live_signals.py		live_signals.py
live_signals_v2.py		live_signals_v2.py
local_backup.ps1		local_backup.ps1
local_restore.ps1		local_restore.ps1
local_start.ps1		local_start.ps1
local_stop.ps1		local_stop.ps1
official_api_collector.py		official_api_collector.py
paper_sim.py		paper_sim.py
railway.json		railway.json
requirements.txt		requirements.txt
signal_broadcaster.py		signal_broadcaster.py
sweep.py		sweep.py
telegram_bot.py		telegram_bot.py

Folders and files

Latest commit

History

Repository files navigation

caput

SIMPLE MENTAL MODEL

1. COLLECT

2. ANALYZE

3. LIVE SIGNALS (later)

CURRENT STAGE

PROJECT STRUCTURE

CORE FILES

official_api_collector.py

fast_finished_collector.py

auto_run.py

clusters.py

telegram_bot.py

DATABASE TABLES

token_snapshots

official_api_token_state

finished_tokens

trajectory_features

strategy_sweep

LOCAL VS RAILWAY

RUN LOCALLY

local only

RUN ON RAILWAY

railway services

REQUIRED ENV

required

browser collector

NORMAL OPERATION

TERMINAL 1

TERMINAL 2

PERIODICALLY

HOW TO READ STATUS

GOOD

BAD

CURRENT SUCCESS CRITERIA

GOOD DATASET

VERY GOOD DATASET

PRODUCTION GRADE

FUTURE

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages