Artículo
Construyendo un sistema de IA que predice la bolsa y se evalúa a sí mismo
En julio de 2024 escribí sobre los cambios de ánimo del mercado bursátil. Describí el seguimiento de las ratios de valoración junto con las narrativas mediáticas como un termómetro de ánimo. Aquel artículo terminaba con una frase a la que vuelvo a menudo: el mercado bursátil es un reflejo de las emociones y comportamientos humanos colectivos.
Dos años después, ese termómetro sigue viviendo en una hoja de cálculo de Google — ratios de valoración en columnas, mis propios comentarios sobre lo que decía la prensa financiera al lado. Funciona para mí. No funciona para nadie más. Y, lo que es más importante, no se puede comprobar. No puedo señalar un registro calibrado de cuántas veces mis lecturas fueron acertadas, cuántas estuvieron equivocadas, ni si soy mejor que lanzar una moneda al aire cuando afirmo ver una valoración elevada.
Así que decidí construir algo. Llevo trabajando en ello desde las cinco de la mañana. Estoy escribiendo esto a las ocho. La primera versión ya corre en mi propia máquina. El pipeline funciona de principio a fin. Aún no tiene suficientes predicciones evaluadas dentro como para decirme algo significativo — esa parte está justo empezando. Este artículo es el primero de una serie que documenta la construcción en sí, y lo que el sistema me dice una vez que el registro empiece a llenarse.
¿SOBRE QUÉ SE CONSTRUYE UN SISTEMA DE PREDICCIÓN CALIBRADO?
Tres artículos anteriores convergen en el diseño de lo que he construido. Cada uno es una idea separada. Juntos forman la columna vertebral.
El primero es la asimetría riesgo-recompensa. Cada predicción que el sistema emite viene con probabilidades explícitas y un número de confianza. Tiene que responder a la pregunta que me sigo haciendo a mí mismo en voz alta. Si me equivoco, ¿cuánto pierdo? Si acierto, ¿cuánto gano? ¿Y está esa proporción a mi favor?
El segundo es la calidad de la decisión por encima del resultado de la decisión. Atraviesa tanto La toma de decisiones en marketing y publicidad bajo incertidumbre como Cometo error tras error. La métrica principal no es la tasa de acierto. Es el error de calibración. Cuando el sistema dice 70 por ciento, ¿el mundo entrega 70 por ciento? Un predictor que dice 95 por ciento y acierta el 80 por ciento de las veces es más peligroso que uno que dice 70 por ciento y acierta el 70 por ciento de las veces. La construcción impone esto en su propia interfaz. La tasa de acierto nunca se reporta sin el error de calibración al lado. Los números solo cobrarán sentido cuando el registro tenga suficientes predicciones evaluadas. Un artículo posterior de esta serie entrará en cómo se calcula la comparación.
El tercero es el termómetro de ánimo. Lo describí como mi forma de leer el mercado — en parte a través de lo caro que estaba frente a su propia historia, y en parte a través de cómo hablaba de él la prensa financiera. Volví a las dos mitades más adelante, en El mercado bursátil zumba de esperanza y ¿Sabes qué es el CAPE?. En la primera fase de la construcción, el sistema formaliza solo la mitad de la valoración. Calcula el percentil CAPE frente a la distribución completa desde 1871. Clasifica el mercado en uno de dieciocho regímenes. Cada predicción inteligente se condiciona al régimen en el que se hizo. La mitad narrativa se queda en la hoja de cálculo, por ahora.
¿QUÉ HACE REALMENTE LA PRIMERA VERSIÓN?
A diario, en mi propia máquina, la construcción ingiere datos OHLCV del S&P 500, indicadores macro de FRED y la serie CAPE de Shiller. También extrae fundamentales de valoración de yfinance.
Después calcula características de valoración. P/E pasado y proyectado. Precio sobre valor en libros. Rentabilidad por dividendo. Percentil CAPE frente a la larga distribución histórica. A partir de esas características etiqueta el régimen de hoy, eligiendo uno de dieciocho. Cinco ejemplos: tendencia alcista de baja volatilidad, corrección de alta volatilidad, lateral, valoración elevada o suelo cíclico.
Después emite predicciones para el S&P 500 a través de seis horizontes, desde un día hasta doce meses. Cada predicción es una distribución de probabilidad con un número de confianza calibrado adjunto. No es un solo número.
Cada predicción se evalúa en su fecha de revisión. El registro nunca se edita. El sistema se juzga a sí mismo por agregados, no por aciertos individuales. Se requiere una muestra mínima de treinta predicciones por métrica antes de que cualquier número se considere significativo. El registro empezó hoy. La parte interesante de esta serie comienza una vez que deje de ser pequeño.
Únete a la Biblioteca
Acceso completo a mis pensamientos, historias personales, hallazgos y lo que me cuentan las personas con las que me encuentro.
Únete a la Biblioteca — €29,99 al añoReciba el artículo completo por correo electrónico y no dude en responder si desea seguir comentándolo.
Aviso legal
Fuentes
Resumen
Preguntas frecuentes sobre el tema del artículo
¿Puede la IA predecir el mercado bursátil?
¿Qué significa calibrar un sistema de predicción?
¿Por qué la tasa de acierto es una métrica engañosa para los pronósticos bursátiles?
¿Qué es el ratio CAPE y por qué importa para predecir el S&P 500?
¿Puede un sistema de pronóstico bursátil correr localmente sin servicios en la nube?
¿Cómo mantienes honesto un registro de pronósticos?
Artículos relacionados
Antes de enseñarle algo a la IA, necesitas ver lo que te está ocultando.
En el momento en que otras personas necesitaron acceso, el problema cambió por completo. Ya no se trataba de si el agente podía aprender. Se trataba de quién tenía derecho a enseñarle.
Quería construir un agente que no solo asista. Uno que actúe.
Más artículos
Praga, 13 de mayo de 2026. De camino al trabajo empecé a pensar en algo que se me quedó dentro durante días. Si en los próximos diez años desaparece la mayor parte del trabajo rutinario delante de un ordenador, y con ella desaparece buena parte del trabajo manual repetitivo, ¿qué pasa con el flujo del dinero? ¿Quién paga a quién y por qué? ¿Qué capas económicas existirán, qué tamaño tendrán y qué relaciones se establecerán entre ellas? Este es el mapa de seis capas que esbocé como respuesta.
Ayer no podía despegarme del ordenador. Cuando levanté la cabeza, eran las ocho y media de la tarde. Llevaba unas tres horas sentado solo arriba.
¿Me quitará la IA el trabajo? Un formador certificado de Google me dijo en junio de 2024 que mi profesión dejaría de existir. Veintidós meses después, mi cargo no ha cambiado — pero el noventa por ciento de lo que hago durante el día es distinto. He delegado más de mi pensamiento a agentes de IA de lo que jamás creí posible. No tengo miedo. Esto es por qué, y qué significa para cualquiera que se haga la misma pregunta.
Una hora. Cincuenta y cinco minutos. Ese es el tiempo que me llevó construir lo que una empresa checa de software había cotizado en más de 50.000 €. Lo construí con Claude Code. Ni un prototipo. Ni una prueba de concepto. Una herramienta funcional — la que la empresa realmente necesitaba. Aquella misma tarde ya estaba corriendo en staging. Esto no va sobre Claude Code. Va sobre lo que Claude Code deja al descubierto.
He realizado aproximadamente ciento cincuenta entrevistas prácticas a lo largo de los últimos cuatro años. Cincuenta para puestos de especialista en datos. Cien para especialistas en publicidad y marketing de rendimiento. Casi todas consistieron en sentarme con un candidato frente a una tarea práctica — algo cercano a un problema real que necesitamos resolver en la empresa. Sin teoría. Sin trivialidades. Resolución aplicada de problemas. Con el tiempo, empecé a notar un patrón.
Esto es lo que aprendí sobre IA local vs cloud y por qué cambié a Claude Code.
¿Qué ocurrió y cómo puede revertirse?
Cuatro días en Cataluña. Sin ordenador, sin IA, casi sin redes sociales. Me compré este cuaderno para anotar lo que pensaría y lo que encontraría y aprendería durante el viaje.
