Bonjour, je suis Richard. Sur ce blog je partage mes pensées, pas des conseils en investissement. Ce n'est pas une recommandation d'acheter ou de vendre des titres.
Construire un système d'IA qui prédit la bourse et s'évalue lui-même
Construire un prévisionniste S&P 500 par IA — et écrire à mesure que je le construis
En juillet 2024, j'ai écrit sur les changements d'humeur du marché boursier. J'ai décrit le suivi des ratios de valorisation aux côtés des récits médiatiques comme un thermomètre d'humeur. Cet article se terminait par une phrase à laquelle je reviens souvent : le marché boursier est un reflet des émotions et comportements humains collectifs.
Deux ans plus tard, ce thermomètre vit toujours principalement dans une feuille de calcul Google — ratios de valorisation en colonnes, mes propres commentaires sur ce que disait la presse financière à côté. Cela fonctionne pour moi. Cela ne fonctionne pour personne d'autre. Et plus important encore, cela ne peut pas être testé. Je ne peux pas pointer vers un registre calibré du nombre de fois où mes lectures ont été justes, du nombre de fois où elles ont été fausses, ou si je vaux mieux qu'un tirage à pile ou face quand je prétends voir une valorisation élevée.
Alors j'ai décidé de construire quelque chose. Je suis dessus depuis cinq heures du matin. Je l'écris à huit heures. La première version tourne désormais sur ma propre machine. Le pipeline fonctionne de bout en bout. Il n'a pas encore assez de prédictions évaluées pour me dire quelque chose de significatif — cette partie ne fait que commencer. Cet article est le premier d'une série qui documente la construction elle-même, et ce que le système me dit une fois que le registre commence à se remplir.
SUR QUOI REPOSE UN SYSTÈME DE PRÉDICTION CALIBRÉ ?
Trois articles plus anciens convergent dans la conception de ce que j'ai construit. Chacun est une idée distincte. Ensemble, ils en forment la colonne vertébrale.
Le premier est l'asymétrie risque-récompense. Chaque prédiction émise par le système s'accompagne de probabilités explicites et d'un nombre de confiance. Elle doit répondre à la question que je continue de me poser à voix haute. Si je me trompe, combien je perds ? Si j'ai raison, combien je gagne ? Et ce ratio est-il en ma faveur ?
Le second est la qualité de la décision plutôt que le résultat de la décision. Cela traverse à la fois La prise de décision en marketing et publicité dans l'incertitude et Je fais erreur sur erreur. La métrique principale n'est pas le taux de réussite. C'est l'erreur de calibration. Quand le système dit 70 pour cent, le monde livre-t-il 70 pour cent ? Un prédicteur qui dit 95 pour cent et a raison 80 pour cent du temps est plus dangereux qu'un prédicteur qui dit 70 pour cent et a raison 70 pour cent du temps. La construction impose cela dans sa propre interface. Le taux de réussite n'est jamais reporté sans l'erreur de calibration à côté. Les chiffres ne deviendront significatifs qu'une fois que le registre aura suffisamment de prédictions évaluées. Un article ultérieur de cette série traitera de la façon dont la comparaison est calculée.
Le troisième est le thermomètre d'humeur. Je l'ai décrit comme ma façon de lire le marché — en partie à travers son coût par rapport à sa propre histoire, et en partie à travers la façon dont la presse financière en parlait. Je suis revenu sur les deux moitiés plus tard, dans Le marché boursier vibre d'espoir et Savez-vous ce qu'est le CAPE ?. Dans la première phase de la construction, le système ne formalise que la moitié valorisation. Il calcule le percentile CAPE par rapport à la distribution complète depuis 1871. Il classe le marché dans l'un des cinq régimes. Chaque prédiction intelligente est conditionnée au régime dans lequel elle a été faite. La moitié narrative reste dans la feuille de calcul, pour l'instant.
QUE FAIT RÉELLEMENT LA PREMIÈRE VERSION ?
Quotidiennement, sur ma propre machine, la construction ingère les données OHLCV du S&P 500, les indicateurs macro de FRED, et la série CAPE de Shiller. Elle extrait également les fondamentaux de valorisation depuis yfinance.
Elle calcule ensuite des caractéristiques de valorisation. P/E historique et prévisionnel. Prix sur valeur comptable. Rendement du dividende. Percentile CAPE par rapport à la longue distribution historique. À partir de ces caractéristiques, elle étiquette le régime du jour, en choisissant l'un des cinq : tendance haussière à faible volatilité, correction à forte volatilité, sans direction, valorisation élevée ou creux cyclique.
Elle émet ensuite des prédictions pour le S&P 500 sur six horizons, d'un jour à douze mois. Chaque prédiction est une distribution de probabilité avec un nombre de confiance calibré attaché. Ce n'est pas un nombre unique.
Chaque prédiction est évaluée à sa date de revue. Le registre n'est jamais édité. Le système se juge lui-même par agrégats, non par succès individuels. Un échantillon minimum de trente prédictions par métrique est requis avant qu'un nombre soit considéré comme significatif. Le registre a commencé aujourd'hui. La partie intéressante de cette série commence une fois qu'il cesse d'être petit.
Accès complet à mes pensées, histoires personnelles, observations et ce que j'entends des gens que je rencontre.
Rejoindre la BibliothèqueAvertissement
Résumé
Sources
Questions fréquentes sur le sujet de l’article
Une IA peut-elle prédire le marché boursier ?
Que signifie calibrer un système de prédiction ?
Pourquoi le taux de réussite est-il une métrique trompeuse pour les prévisions boursières ?
Qu'est-ce que le ratio CAPE et pourquoi importe-t-il pour prédire le S&P 500 ?
Un système de prévision boursière peut-il tourner localement sans services cloud ?
Comment garder honnête un registre de prévisions ?
Si vous avez des pensées, des questions ou des retours, n’hésitez pas à m’écrire à mail@richardgolian.com.