Hola, soy Richard. En este blog comparto mis pensamientos, no consejos de inversión. Esto no es una recomendación para comprar o vender valores.
Construyendo un sistema de IA que predice la bolsa y se evalúa a sí mismo
Construyendo un predictor del S&P 500 con IA — y escribiendo sobre ello mientras lo construyo
En julio de 2024 escribí sobre los cambios de ánimo del mercado bursátil. Describí el seguimiento de las ratios de valoración junto con las narrativas mediáticas como un termómetro de ánimo. Aquel artículo terminaba con una frase a la que vuelvo a menudo: el mercado bursátil es un reflejo de las emociones y comportamientos humanos colectivos.
Dos años después, ese termómetro sigue viviendo principalmente en una hoja de cálculo de Google — ratios de valoración en columnas, mis propios comentarios sobre lo que decía la prensa financiera al lado. Funciona para mí. No funciona para nadie más. Y, lo que es más importante, no se puede comprobar. No puedo señalar un registro calibrado de cuántas veces mis lecturas fueron acertadas, cuántas estuvieron equivocadas, ni si soy mejor que lanzar una moneda al aire cuando afirmo ver una valoración elevada.
Así que construí algo. Llevo trabajando en ello desde las cinco de la mañana. Estoy escribiendo esto a las ocho. La primera versión ya corre en mi propia máquina. El pipeline funciona de principio a fin. Aún no tiene suficientes predicciones evaluadas dentro como para decirme algo significativo — esa parte está justo empezando. Este artículo es el primero de una serie que documenta la construcción en sí, y lo que el sistema me dice una vez que el registro empiece a llenarse.
¿SOBRE QUÉ SE CONSTRUYE UN SISTEMA DE PREDICCIÓN CALIBRADO?
Tres artículos anteriores convergen en el diseño de lo que he construido. Cada uno es una idea separada. Juntos forman la columna vertebral.
El primero es la asimetría riesgo-recompensa. Cada predicción que el sistema emite viene con probabilidades explícitas y un número de confianza. Tiene que responder a la pregunta que me sigo haciendo a mí mismo en voz alta. Si me equivoco, ¿cuánto pierdo? Si acierto, ¿cuánto gano? ¿Y está esa proporción a mi favor?
El segundo es la calidad de la decisión por encima del resultado de la decisión. Atraviesa tanto La toma de decisiones en marketing y publicidad bajo incertidumbre como Cometo error tras error. La métrica principal no es la tasa de acierto. Es el error de calibración. Cuando el sistema dice 70 por ciento, ¿el mundo entrega 70 por ciento? Un predictor que dice 95 por ciento y acierta el 80 por ciento de las veces es más peligroso que uno que dice 70 por ciento y acierta el 70 por ciento de las veces. La construcción impone esto en su propia interfaz. La tasa de acierto nunca se reporta sin el error de calibración al lado. Los números solo cobrarán sentido cuando el registro tenga suficientes predicciones evaluadas. Un artículo posterior de esta serie entrará en cómo se calcula la comparación.
El tercero es el termómetro de ánimo. Lo describí como mi forma de leer el mercado — en parte a través de lo caro que estaba frente a su propia historia, y en parte a través de cómo hablaba de él la prensa financiera. Volví a las dos mitades más adelante, en El mercado bursátil zumba de esperanza y ¿Sabes qué es el CAPE?. En la primera fase de la construcción, el sistema formaliza solo la mitad de la valoración. Calcula el percentil CAPE frente a la distribución completa desde 1871. Clasifica el mercado en uno de cinco regímenes. Cada predicción inteligente se condiciona al régimen en el que se hizo. La mitad narrativa se queda en la hoja de cálculo, por ahora.
¿QUÉ HACE REALMENTE LA PRIMERA VERSIÓN?
A diario, en mi propia máquina, la construcción ingiere datos OHLCV del S&P 500, indicadores macro de FRED y la serie CAPE de Shiller. También extrae fundamentales de valoración de yfinance.
Después calcula características de valoración. P/E pasado y proyectado. Precio sobre valor en libros. Rentabilidad por dividendo. Percentil CAPE frente a la larga distribución histórica. A partir de esas características etiqueta el régimen de hoy, eligiendo uno de cinco: tendencia alcista de baja volatilidad, corrección de alta volatilidad, lateral, valoración elevada o suelo cíclico.
Después emite predicciones para el S&P 500 a través de seis horizontes, desde un día hasta doce meses. Cada predicción es una distribución de probabilidad con un número de confianza calibrado adjunto. No es un solo número.
Cada predicción se evalúa en su fecha de revisión. El registro nunca se edita. El sistema se juzga a sí mismo por agregados, no por aciertos individuales. Se requiere una muestra mínima de treinta predicciones por métrica antes de que cualquier número se considere significativo. El registro empezó hoy. La parte interesante de esta serie comienza una vez que deje de ser pequeño.
Acceso completo a mis pensamientos, historias personales, hallazgos y lo que me cuentan las personas con las que me encuentro.
Únete a la BibliotecaAviso legal
Resumen
Fuentes
Preguntas frecuentes sobre el tema del artículo
¿Puede la IA predecir el mercado bursátil?
¿Qué significa calibrar un sistema de predicción?
¿Por qué la tasa de acierto es una métrica engañosa para los pronósticos bursátiles?
¿Qué es el ratio CAPE y por qué importa para predecir el S&P 500?
¿Puede un sistema de pronóstico bursátil correr localmente sin servicios en la nube?
¿Cómo mantienes honesto un registro de pronósticos?
Si tienes pensamientos, preguntas o comentarios, no dudes en escribirme a mail@richardgolian.com.