Skip to content

ussleo/openjane

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

12 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

OpenJane · by Claude

"Jane Street no gana prediciendo el futuro. Gana optimizando fricción, liquidez y ejecución a escala masiva con una cultura técnica obsesiva."

License: Apache 2.0 Built with Claude Data: Massive.com Data: EODHD Inspired by


🌎 Léeme en tu idioma / Read in your language / Leia no seu idioma


🇪🇸 Español

De dónde viene esto

OpenJane nació de una investigación profunda sobre uno de los actores más secretos y escurridizos del mercado financiero global: Jane Street.

Jane Street Capital es una firma de trading cuantitativo con sede en Nueva York que en 2024 generó aproximadamente $39 mil millones en ingresos de trading — más que Goldman Sachs en ese mismo concepto. No cotiza en bolsa. No hace publicidad. No tiene CEO público. No concede entrevistas. Y sin embargo, es posiblemente la firma más influyente en la microestructura de los mercados financieros modernos.

La investigación que dio origen a este repo exploró durante semanas sus conexiones ocultas: las universidades que forman a su talento, los competidores que compiten en su ecosistema, los algoritmos de machine learning que impulsan sus estrategias, y los tickers públicos que actúan como "fantasmas" o proxies de su comportamiento interno.

Esa investigación fue pública, honesta y sin agenda oculta. Y sus conclusiones fueron claras: la lógica detrás de esos $39 mil millones no es magia. Es matemática, datos y cultura técnica obsesiva. Y esa lógica puede documentarse, explicarse y ponerse al alcance de cualquier persona en el planeta.

El problema que resuelve OpenJane

El conocimiento financiero cuantitativo está concentrado en muy pocas manos:

  • Las firmas como Jane Street contratan a los mejores matemáticos y programadores del mundo y los mantienen en silencio con NDA y salarios de siete cifras.
  • Los datos de mercado institucionales cuestan decenas de miles de dólares por año.
  • Los papers académicos relevantes están dispersos en repositorios universitarios que nadie sabe que existen.
  • La jerga técnica crea una barrera artificial que hace que el conocimiento parezca inaccesible para quien no estudió en MIT o Princeton.

El resultado: el 99% de los inversores toma decisiones sin acceder a los marcos conceptuales que usa el 1% más sofisticado del mercado.

OpenJane existe para cambiar eso.

Qué es OpenJane

OpenJane es un conjunto de skills, comandos y un agente de análisis cuantitativo construido sobre el ecosistema de Claude (Anthropic), que traduce los principios operativos de las firmas cuantitativas más exitosas del mundo a análisis accesible para cualquier persona con conocimiento básico de inversión.

No requiere saber programar. No requiere suscripciones de cientos de dólares. No requiere un PhD en matemáticas. Solo requiere curiosidad y ganas de entender.

El usuario le hace una pregunta al agente en lenguaje natural — en español, inglés o portugués — y recibe un análisis que aplica los mismos marcos conceptuales que usan Jane Street, Citadel Securities y Hudson River Trading. Sin código. Sin barreras.

La investigación detrás

Jane Street: lo que la investigación encontró

Escala: Jane Street generó ~$39 mil millones en 2024. Para contexto: eso es más que el PIB de muchos países. Todo eso lo produce una firma que casi nadie conoce, que no cotiza en bolsa y que opera en el silencio absoluto.

El modelo de negocio: Jane Street no apuesta a que los mercados suban o bajen. Opera como market maker: compra y vende simultáneamente, capturando el spread entre el precio de compra y venta, optimizando la ejecución a escala masiva, y explotando ineficiencias estadísticas en la relación entre activos. Es una máquina de extracción de fricciones, no de predicción del futuro.

El ecosistema de competidores y aliados:

Firma Rol Relación con Jane Street
Susquehanna International Group (SIG) Cantera fundacional Origen del talento que fundó Jane Street
Citadel Securities Market making global Rival directo, espejo funcional
Hudson River Trading Quant trading puro Competidor técnico directo
Jump Trading Quant + crypto Competidor en mercados electrónicos
Virtu Financial (VIRT) Market making público Único comparable cotizado en bolsa
Millennium Management Hedge fund rival Conflicto documentado por estrategias y talento
Two Sigma Data science aplicado Competidor por perfil similar
Tower Research Capital Quant trading privado Actor del mismo universo

Ghost tickers — los proxies públicos de Jane Street: Jane Street no cotiza. Pero estos tickers se comportan de forma estadísticamente similar porque responden a las mismas variables de mercado: volatilidad, spreads, liquidez y estructura. Son las "sombras visibles" de una firma invisible.

Ticker Empresa Por qué es un ghost ticker Nivel de evidencia
CBOE Cboe Global Markets Proxy más cercano al núcleo: opciones, vol, microestructura Alto
ICE Intercontinental Exchange Proxy sistémico e infraestructural Alto
NDAQ Nasdaq Market structure, comparable de infraestructura Medio
MKTX MarketAxess Liquidez electrónica en renta fija institucional Medio
VIRT Virtu Financial Market making público, comparable directo Alto
SCHW Charles Schwab Flujo minorista, adjacencia de ejecución Medio
HOOD Robinhood Retail order flow, adjacencia de flujo Medio

Las universidades que forman el talento de Jane Street

La investigación trazó el linaje académico del ecosistema. Jane Street no surge de la nada: su talento proviene de un pipeline académico muy específico, con Susquehanna International Group (SIG) como puente entre academia y firma.

Conexiones verificadas:

Drexel University → SIG → ecosistema Jane Street

  • Partnership corporativo directo y documentado entre Drexel y SIG
  • Co-ops verificados en equipos de FPGA y software engineering de SIG
  • Enfoque académico: ingeniería aplicada de ML, IA confiable, sistemas robustos
  • Programas: AI and Machine Learning, Machine Learning Engineering, AI/ML/Robotics Research

Trinity College Dublin → SIG → ecosistema Jane Street

  • Programa de internships documentado con SIG desde su School of CS & Statistics
  • Reclutamiento directo verificado en oferta pública de SIG en Trinity
  • Enfoque académico: algoritmos clásicos de ML, deep learning, razonamiento en IA
  • Módulos relevantes: CSP7000, CSU44061, CSP7001 (Machine Learning)

Personas verificadas activas en el ecosistema (SIG · NeurIPS 2025):

Persona Rol Vínculo verificado
Jake Katznelson Systems Engineering Ponente SIG en NeurIPS 2025
Ali Nazari Head of Deep Learning Ponente SIG en NeurIPS 2025
Tony Yang Machine Learning Researcher Ponente SIG en NeurIPS 2025
Rob Rhoades Quantitative Researcher Ponente SIG en NeurIPS 2025
Nick Petaccio Trading Platforms Specialist Alumni Drexel, full-time SIG (2024)

Los modelos de machine learning del ecosistema

La investigación mapeó los modelos de ML más relevantes para trading cuantitativo, con fuentes académicas públicas verificadas. Estos son los modelos que emergen de la investigación pública asociada al ecosistema de las universidades de Jane Street.

Prioridad 1 — Fundamentos aplicados al trading

1. Random Forest y árboles de decisión El modelo más usado en quant trading por su balance entre performance e interpretabilidad. Evalúa múltiples variables de mercado simultáneamente sin asumir linealidad.

2. LSTM (Long Short-Term Memory) / Deep Learning para series temporales Redes neuronales recurrentes diseñadas para capturar dependencias temporales largas. Especialmente útiles para forecasting de volatilidad y patrones de microestructura.

3. SVR + PCA (Support Vector Regression + Análisis de Componentes Principales) PCA elimina ruido y correlación entre variables. SVR predice sin asumir linealidad. Combinados, producen forecasting robusto con alta dimensionalidad.

Prioridad 2 — Detección de régimen y clasificación de mercado

4. Hidden Markov Models (HMM) Clasifica el mercado en estados ocultos (bull, bear, lateral, crisis) y estima la probabilidad actual de cada uno. Base matemática de la detección de régimen.

  • 📚 Referencia académica: Hamilton (1989), Ang & Bekaert (2002)
  • 🎯 Aplicación: clasificar el estado de mercado antes de aplicar cualquier estrategia

5. Clustering no supervisado (K-Means, DBSCAN) Agrupa períodos históricos por similitud de comportamiento sin etiquetas previas. Identifica regímenes que el análisis tradicional no ve.

  • 📄 Fuente: ML en Finanzas — UDLAP
  • 🎯 Aplicación: identificación de períodos históricos similares al momento actual

6. SVM para clasificación de estados Support Vector Machines para clasificar el estado del mercado en tendencia, reversión o estrés. Robusto con datasets bien definidos.

Prioridad 3 — Arbitraje estadístico y microestructura

7. Modelos de cointegración (Engle-Granger, Johansen) La base matemática del arbitraje estadístico. Identifica pares cuya relación es estacionaria y explotable. Sin cointegración, no hay stat-arb válido.

  • 📚 Referencias: Engle & Granger (1987), Gatev et al. (2006), Avellaneda & Lee (2010)
  • 📄 También: ML and the Stock Market — SSRN
  • 🎯 Aplicación: identificación y validación de pares para stat-arb

8. Proceso de Ornstein-Uhlenbeck Modelo estocástico de reversión a la media. Calcula el half-life de reversión de un par y optimiza puntos de entrada y salida.

  • 📚 Referencia: Vasicek (1977), aplicado a trading por Avellaneda & Lee (2010)
  • 🎯 Aplicación: calibración de estrategias de stat-arb, timing de entrada/salida

9. VPIN (Volume-Synchronized Probability of Informed Trading) Detecta si el flujo de órdenes proviene de inversores informados o de ruido. Mide la "toxicidad" del flujo — una de las señales más valiosas en microestructura.

  • 📚 Referencia: Easley, López de Prado & O'Hara (2012)
  • 🎯 Aplicación: microestructura, detección de flujo informado antes de movimientos

Prioridad 4 — Ejecución óptima y control de riesgo

10. Modelo de Almgren-Chriss Framework matemático para la ejecución óptima de órdenes grandes, minimizando el impacto de mercado y el riesgo de precio adverso. Base de TWAP y VWAP algorítmico.

  • 📚 Referencia: Almgren & Chriss (2000) — "Optimal Execution of Portfolio Transactions"
  • 🎯 Aplicación: optimal execution, diseño de algoritmos TWAP/VWAP

11. Walk-forward validation y backtesting robusto Control de overfitting mediante validación en datos futuros no usados en el diseño. La diferencia entre una estrategia real y una que solo funciona en el papel.

12. Reinforcement Learning adaptativo Ajuste dinámico de estrategias según condiciones cambiantes de mercado. El nivel más avanzado — más cercano a como operan los sistemas modernos de HFT.

El catalizador: Anthropic y el repo de financial-services

En 2025, Anthropic publicó anthropics/financial-services: agentes de referencia para workflows financieros institucionales — investment banking, equity research, private equity, wealth management. Con 18,000 estrellas y 2,300 forks, fue lo que algunos llamaron una "cachetada a Wall Street": la misma infraestructura que usan los grandes bancos, disponible para cualquier persona con una API key.

Pero ese repo tenía una brecha: fue diseñado para analistas institucionales. Cubría DCF, LBO, pitch decks, KYC — el mundo del banking tradicional. Lo que no tenía era la lógica de las firmas cuantitativas puras: microestructura, arbitraje estadístico, detección de régimen, ejecución óptima.

OpenJane es exactamente esa extensión que faltaba.

Alcance y honestidad

Lo que OpenJane puede hacer

  • Analizar la microestructura de cualquier activo: spread, liquidez, flujo de órdenes
  • Identificar pares estadísticamente relacionados y medir su divergencia actual
  • Clasificar el régimen de mercado con datos reales en tiempo real (15min delay en free tier)
  • Explicar en lenguaje claro por qué el mercado se comporta como se comporta
  • Enseñar los marcos conceptuales que usan las firmas cuantitativas líderes
  • Producir análisis educativo de alta calidad sin costo adicional alguno

Lo que OpenJane no puede hacer (y no pretende)

  • Replicar la latencia de microsegundos de Jane Street — eso requiere infraestructura de colocation que cuesta millones de dólares
  • Acceder a datos de flujo de órdenes propietarios que las firmas compran exclusivamente
  • Garantizar resultados de inversión — ningún sistema honesto puede hacerlo
  • Reemplazar el juicio humano y la responsabilidad personal sobre las decisiones propias

El porcentaje real

Dimensión Alcance
Comprensión conceptual de los mecanismos 85-90%
Implementación funcional de las estrategias 60-70%
Performance en mercado real vs Jane Street 20-35%

La diferencia de 20-35% no está en la comprensión — está en capital, latencia y datos propietarios. Entender el 85% de cómo funciona el mercado cuantitativo coloca a cualquier persona en una posición radicalmente diferente al inversor promedio que opera sin ninguno de estos marcos.

Datos de mercado — completamente gratuitos

Proveedor Qué aporta Free tier Tarjeta
Massive.com Precios, opciones, tick data USA, forex, crypto EOD + 2 años histórico ❌ No
EODHD Fundamentales, global, 150,000+ tickers 20 llamadas/día, 1 año ❌ No

Ambos tienen servidores MCP oficiales para Claude. El usuario solo escribe su pregunta. El agente busca los datos, los procesa y entrega el análisis.

Estructura del repositorio

plugins/
  vertical-plugins/
    market-microstructure/     ← spreads, liquidez, flujo de órdenes
      skills/microstructure-analysis.md
      commands/spread-analysis.md
      .mcp.json
    stat-arb/                  ← arbitraje estadístico entre pares
      skills/statistical-arbitrage.md
    regime-detection/          ← estado actual del mercado
      skills/regime-classification.md
    volatility/                ← superficie de volatilidad implícita
  agent-plugins/
    quant-analyst/             ← agente principal integrado
      agents/quant-analyst.md

docs/
  glossary.md                  ← 28 términos explicados en 3 idiomas

scripts/
  setup.sh                     ← instalación en un comando

Instalación

git clone https://github.com/ussleo/openjane
cd openjane
cp .env.example .env
# Añade tus API keys gratuitas de massive.com y eodhd.com

# Claude Code
claude plugin install quant-analyst@openjane

Comandos disponibles

Comando Qué hace
/spread-analysis [TICKER] Microestructura: spread, liquidez, flujo, costo de transacción
/stat-arb [TICKER_A] [TICKER_B] Par estadístico: correlación, Z-score, half-life
/regime Régimen actual del mercado con score y estrategias recomendadas
/liquidity-map [TICKER] Mapa de liquidez: ADV, días para liquidar, impacto
/vol-surface [TICKER] Volatilidad implícita vs histórica

Glosario

docs/glossary.md — 28 términos explicados en lenguaje claro, en español, inglés y portugués. Cada uno con definición, cómo se mide, qué implica y un ejemplo real del mercado.

Contribuir

Todo es markdown. Sin compiladores. Sin dependencias.

  • Nueva skill: plugins/vertical-plugins/<vertical>/skills/
  • Nuevo paper o universidad: docs/research/
  • Traducción a otro idioma: el glosario y el README te esperan
  • Issue o corrección: directamente en GitHub

Todos los aportes son bienvenidos, especialmente los que vienen de personas que no se consideran "técnicas" — porque ese es exactamente el usuario para quien fue construido este proyecto.


🇺🇸 English

Where this comes from

OpenJane was born from a deep investigation into one of the most secretive and elusive actors in global financial markets: Jane Street.

Jane Street Capital is a quantitative trading firm based in New York that generated approximately $39 billion in trading revenue in 2024 — more than Goldman Sachs in that same category. It doesn't trade publicly. It doesn't advertise. It has no public CEO. It doesn't give interviews. And yet it is arguably the most influential firm in the microstructure of modern financial markets.

The research explored for weeks its hidden connections: the universities that train its talent, the competitors in the same ecosystem, the ML algorithms powering its strategies, and the public tickers that act as behavioral proxies — "ghost tickers" — for its internal performance.

The conclusion was clear: the logic behind those $39 billion is not magic. It's math, data, and obsessive technical culture. And that logic can be documented, explained, and made accessible to anyone on the planet.

What OpenJane is

OpenJane is a set of skills, commands, and a quantitative analysis agent built on the Claude (Anthropic) ecosystem, translating the operational principles of the world's most successful quantitative firms into analysis accessible to anyone with basic investment knowledge. No coding required. No expensive subscriptions. No PhD.

The universities and ML models

Research identified verified connections between Jane Street's talent pipeline and specific academic programs via Susquehanna International Group (SIG) — the firm where several Jane Street founders learned quantitative market making.

Verified academic connections:

  • Drexel University → direct corporate partnership with SIG, active co-ops in FPGA and software engineering
  • Trinity College Dublin → documented SIG internship program, direct recruitment verified

ML models from the ecosystem's public academic research:

Model Priority Academic Source
Random Forest / Decision Trees ⭐⭐⭐ FGV Brazil
LSTM for time series ⭐⭐⭐ Mackenzie University
SVR + PCA ⭐⭐⭐ USP Brazil
Hidden Markov Models ⭐⭐⭐ Hamilton (1989)
K-Means / DBSCAN clustering ⭐⭐ UDLAP
SVM classification ⭐⭐ Trinity College Dublin
Engle-Granger cointegration ⭐⭐⭐ Gatev et al. (2006)
Ornstein-Uhlenbeck process ⭐⭐ Avellaneda & Lee (2010)
VPIN ⭐⭐ Easley, López de Prado & O'Hara (2012)
Almgren-Chriss execution model ⭐⭐ Almgren & Chriss (2000)
Walk-forward backtesting ⭐⭐⭐ RePEC/OSF
Reinforcement Learning Applied research

Free market data

  • Massive.com — US equities, options, forex, crypto. Free. No credit card.
  • EODHD — Fundamentals, global, 150,000+ tickers. Free. No credit card.

Both have official MCP servers for Claude. The user just types their question.


🇧🇷 Português (Brasil)

De onde vem isso

OpenJane nasceu de uma investigação profunda sobre um dos atores mais secretos e escorregadios dos mercados financeiros globais: a Jane Street.

A Jane Street Capital gerou aproximadamente US$ 39 bilhões em receita de trading em 2024 — mais do que o Goldman Sachs na mesma categoria. Não tem ações em bolsa. Não faz publicidade. Não tem CEO público. E ainda assim é possivelmente a firma mais influente na microestrutura dos mercados financeiros modernos.

A conclusão foi clara: a lógica por trás desses US$ 39 bilhões não é mágica. É matemática, dados e cultura técnica obsessiva. E essa lógica pode ser documentada, explicada e colocada ao alcance de qualquer pessoa no planeta.

O que é o OpenJane

OpenJane é um conjunto de skills, comandos e um agente de análise quantitativa construído sobre o ecossistema Claude (Anthropic), que traduz os princípios operacionais das firmas quantitativas mais bem-sucedidas do mundo em análises acessíveis para qualquer pessoa com conhecimento básico de investimento. Sem programação. Sem assinaturas caras.

Universidades e modelos de ML do ecossistema

A pesquisa identificou conexões verificadas entre o pipeline de talentos da Jane Street e programas acadêmicos específicos, via Susquehanna International Group (SIG):

  • Drexel University → parceria corporativa direta e verificada com SIG
  • Trinity College Dublin → programa de estágios documentado com SIG

Modelos de ML com fonte acadêmica pública verificada:

Modelo Prioridade Fonte
Random Forest ⭐⭐⭐ FGV Brasil
LSTM para séries temporais ⭐⭐⭐ Universidade Mackenzie
SVR + PCA ⭐⭐⭐ USP Brasil
Hidden Markov Models ⭐⭐⭐ Hamilton (1989)
Clustering K-Means / DBSCAN ⭐⭐ UDLAP
SVM para classificação ⭐⭐ Trinity College Dublin
Cointegração Engle-Granger ⭐⭐⭐ Gatev et al. (2006)
Processo de Ornstein-Uhlenbeck ⭐⭐ Avellaneda & Lee (2010)
VPIN ⭐⭐ Easley, López de Prado & O'Hara (2012)
Modelo Almgren-Chriss ⭐⭐ Almgren & Chriss (2000)
Backtesting walk-forward ⭐⭐⭐ RePEC/OSF

Dados de mercado — completamente gratuitos

  • Massive.com — Ações EUA, opções, forex, crypto. Gratuito. Sem cartão.
  • EODHD — Fundamentais, global, 150.000+ tickers. Gratuito. Sem cartão.

Créditos / Credits / Créditos

Investigação original ussleo
Motor de análise Claude (Anthropic)
Arquitetura de referência anthropics/financial-services
Dados de mercado Massive.com · EODHD
Pesquisa acadêmica FGV · USP · Mackenzie · Trinity College Dublin · Drexel · UDLAP · SSRN · RePEC

Licença / License / Licença

Apache License 2.0 — igual ao repositório da Anthropic que inspirou este projeto.


OpenJane · by Claude · 2025

"Todos tenemos derecho a una parte del pastel." "Everyone deserves a piece of the pie." "Todos merecem um pedaço do bolo."

github.com/ussleo/openjane


⚠️ Aviso legal / Disclaimer / Aviso legal: Nada en este repositorio constituye asesoramiento financiero, legal o de inversión. Nothing in this repository constitutes financial, legal, or investment advice. Nada neste repositório constitui assessoria financeira, jurídica ou de investimento. OpenJane produce análisis educativo para revisión humana. No ejecuta transacciones. Tú decides siempre. You always decide. Você sempre decide.

About

"Para usar este agente necesitas una cuenta gratuita en Claude.ai — sin tarjeta de crédito para el plan básico.". Democratizing the logic of the world's largest quant trading firms · by Claude

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors