Article
Construire un système d'IA qui prédit la bourse et s'évalue lui-même
En juillet 2024, j'ai écrit sur les changements d'humeur du marché boursier. J'ai décrit le suivi des ratios de valorisation aux côtés des récits médiatiques comme un thermomètre d'humeur. Cet article se terminait par une phrase à laquelle je reviens souvent : le marché boursier est un reflet des émotions et comportements humains collectifs.
Deux ans plus tard, ce thermomètre vit toujours principalement dans une feuille de calcul Google — ratios de valorisation en colonnes, mes propres commentaires sur ce que disait la presse financière à côté. Cela fonctionne pour moi. Cela ne fonctionne pour personne d'autre. Et plus important encore, cela ne peut pas être testé. Je ne peux pas pointer vers un registre calibré du nombre de fois où mes lectures ont été justes, du nombre de fois où elles ont été fausses, ou si je vaux mieux qu'un tirage à pile ou face quand je prétends voir une valorisation élevée.
Alors j'ai décidé de construire quelque chose. Je suis dessus depuis cinq heures du matin. Je l'écris à huit heures. La première version tourne désormais sur ma propre machine. Le pipeline fonctionne de bout en bout. Il n'a pas encore assez de prédictions évaluées pour me dire quelque chose de significatif — cette partie ne fait que commencer. Cet article est le premier d'une série qui documente la construction elle-même, et ce que le système me dit une fois que le registre commence à se remplir.
SUR QUOI REPOSE UN SYSTÈME DE PRÉDICTION CALIBRÉ ?
Trois articles plus anciens convergent dans la conception de ce que j'ai construit. Chacun est une idée distincte. Ensemble, ils en forment la colonne vertébrale.
Le premier est l'asymétrie risque-récompense. Chaque prédiction émise par le système s'accompagne de probabilités explicites et d'un nombre de confiance. Elle doit répondre à la question que je continue de me poser à voix haute. Si je me trompe, combien je perds ? Si j'ai raison, combien je gagne ? Et ce ratio est-il en ma faveur ?
Le second est la qualité de la décision plutôt que le résultat de la décision. Cela traverse à la fois La prise de décision en marketing et publicité dans l'incertitude et Je fais erreur sur erreur. La métrique principale n'est pas le taux de réussite. C'est l'erreur de calibration. Quand le système dit 70 pour cent, le monde livre-t-il 70 pour cent ? Un prédicteur qui dit 95 pour cent et a raison 80 pour cent du temps est plus dangereux qu'un prédicteur qui dit 70 pour cent et a raison 70 pour cent du temps. La construction impose cela dans sa propre interface. Le taux de réussite n'est jamais reporté sans l'erreur de calibration à côté. Les chiffres ne deviendront significatifs qu'une fois que le registre aura suffisamment de prédictions évaluées. Un article ultérieur de cette série traitera de la façon dont la comparaison est calculée.
Le troisième est le thermomètre d'humeur. Je l'ai décrit comme ma façon de lire le marché — en partie à travers son coût par rapport à sa propre histoire, et en partie à travers la façon dont la presse financière en parlait. Je suis revenu sur les deux moitiés plus tard, dans Le marché boursier vibre d'espoir et Savez-vous ce qu'est le CAPE ?. Dans la première phase de la construction, le système ne formalise que la moitié valorisation. Il calcule le percentile CAPE par rapport à la distribution complète depuis 1871. Il classe le marché dans l'un des dix-huit régimes. Chaque prédiction intelligente est conditionnée au régime dans lequel elle a été faite. La moitié narrative reste dans la feuille de calcul, pour l'instant.
QUE FAIT RÉELLEMENT LA PREMIÈRE VERSION ?
Quotidiennement, sur ma propre machine, la construction ingère les données OHLCV du S&P 500, les indicateurs macro de FRED, et la série CAPE de Shiller. Elle extrait également les fondamentaux de valorisation depuis yfinance.
Elle calcule ensuite des caractéristiques de valorisation. P/E historique et prévisionnel. Prix sur valeur comptable. Rendement du dividende. Percentile CAPE par rapport à la longue distribution historique. À partir de ces caractéristiques, elle étiquette le régime du jour, en choisissant l'un des dix-huit. Cinq exemples : tendance haussière à faible volatilité, correction à forte volatilité, sans direction, valorisation élevée ou creux cyclique.
Elle émet ensuite des prédictions pour le S&P 500 sur six horizons, d'un jour à douze mois. Chaque prédiction est une distribution de probabilité avec un nombre de confiance calibré attaché. Ce n'est pas un nombre unique.
Chaque prédiction est évaluée à sa date de revue. Le registre n'est jamais édité. Le système se juge lui-même par agrégats, non par succès individuels. Un échantillon minimum de trente prédictions par métrique est requis avant qu'un nombre soit considéré comme significatif. Le registre a commencé aujourd'hui. La partie intéressante de cette série commence une fois qu'il cesse d'être petit.
Rejoindre la Bibliothèque
Accès complet à mes pensées, histoires personnelles, observations et ce que j'entends des gens que je rencontre.
Rejoindre la Bibliothèque — €29,99 par anRecevez l’article complet par e-mail et n’hésitez pas à répondre si vous souhaitez en discuter davantage.
Avertissement
Sources
Résumé
Questions fréquentes sur le sujet de l'article
Une IA peut-elle prédire le marché boursier ?
Que signifie calibrer un système de prédiction ?
Pourquoi le taux de réussite est-il une métrique trompeuse pour les prévisions boursières ?
Qu'est-ce que le ratio CAPE et pourquoi importe-t-il pour prédire le S&P 500 ?
Un système de prévision boursière peut-il tourner localement sans services cloud ?
Comment garder honnête un registre de prévisions ?
Articles connexes
Avant d'enseigner quoi que ce soit à l'IA, il faut voir ce qu'elle vous cache.
Dès que d'autres personnes ont eu besoin d'y accéder, le problème a complètement changé. Il ne s'agissait plus de savoir si l'agent pouvait apprendre. Il s'agissait de savoir qui avait le droit de lui enseigner.
Je voulais construire un agent qui ne se contente pas d'assister. Un agent qui agit.
Plus d'articles
Prague, 13 mai 2026. En allant au travail, je me suis mis à penser à quelque chose qui m’est resté en tête plusieurs jours. Si l’essentiel du travail routinier sur ordinateur disparaît dans les dix prochaines années, et qu’avec lui disparaît une large part du travail manuel répétitif, qu’advient-il du flux de l’argent ? Qui paie qui, et pour quoi ? Quelles couches économiques existeront, quelle sera leur taille, et quelles relations s’établiront entre elles ? Voici la carte en six couches que j’ai esquissée comme réponse.
Hier, je n'arrivais pas à m'arracher à l'ordinateur. Quand j'ai levé la tête, il était huit heures et demie du soir. J'étais resté seul à l'étage pendant environ trois heures.
L'IA va-t-elle prendre mon travail ? Un formateur certifié Google m'a dit en juin 2024 que ma profession cesserait d'exister. Vingt-deux mois plus tard, mon intitulé de poste n'a pas changé — mais quatre-vingt-dix pour cent de ce que je fais dans la journée est différent. J'ai délégué plus de ma réflexion à des agents IA que je ne l'aurais cru possible. Je n'ai pas peur. Voici pourquoi, et ce que cela signifie pour quiconque se pose la même question.
Une heure. Cinquante-cinq minutes. Voilà le temps qu'il m'a fallu pour construire ce qu'une société tchèque de logiciels avait chiffré à plus de 50 000 €. Je l'ai construit avec Claude Code. Pas un prototype. Pas une preuve de concept. Un outil fonctionnel — celui dont l'entreprise avait réellement besoin. Le soir même, il tournait sur un environnement de test. Ce n'est pas à propos de Claude Code. C'est à propos de ce que Claude Code met à nu.
J'ai mené environ cent cinquante entretiens pratiques au cours des quatre dernières années. Cinquante pour des postes de spécialistes en données. Une centaine pour des spécialistes en publicité et en marketing de performance. Dans la quasi-totalité des cas, il s'agissait de s'asseoir face à un candidat devant une tâche pratique — quelque chose de proche d'un problème réel que nous devons effectivement résoudre dans l'entreprise. Pas de théorie. Pas de trivialités. De la résolution de problèmes. Avec le temps, j'ai commencé à percevoir un schéma récurrent.
Voici ce que j'ai appris sur l'IA locale versus le cloud, et pourquoi je suis passé à Claude Code.
Je n'ai jamais vu un écart de connaissance aussi profond que celui lié à l'intelligence artificielle.
Quatre jours en Catalogne. Sans ordinateur, sans IA, presque sans réseaux sociaux. J'ai acheté ce carnet pour y noter ce à quoi je penserais et ce que je rencontrerais et apprendrais durant le voyage.
