Tout système quant a des limites. Les masquer, c'est promettre. Les exposer, c'est s'engager à la rigueur. Voici, exhaustivement, ce que le Decision OS ne sait pas faire actuellement · et probablement ce qu'il ne saura jamais faire.
Ces limites sont fondamentales · elles ne dépendent pas de la qualité de l'implémentation. Elles existent par construction.
Le Decision OS ne formule aucune prédiction sur le prix futur d'un actif. Il évalue des conditions de marché contemporaines, classifie des contextes, et calcule des probabilités historiques sur des familles de situations similaires.
La distinction est fondamentale. "Le prix va monter de 5 %" est une prédiction. "Dans 90 % des contextes similaires observés, le trade aurait été perdant" est une mesure statistique. La deuxième est falsifiable, la première ne l'est jamais.
Même quand toutes les conditions seront favorables, le système ne pourra pas garantir un résultat positif sur un trade individuel. La probabilité historique d'un setup de qualité 80/100 reste une probabilité · pas une certitude.
Sur 100 trades pris avec un setup historique gagnant à 65 %, on s'attend à ce que 35 soient perdants. Si on a 5 perdants consécutifs, ce n'est pas anormal · c'est statistique. Le système doit survivre à ces séquences. C'est exactement ce que la couche Risk Engine + kill-switch est conçue pour faire.
Le système apprend à partir d'événements passés. Par construction, un événement totalement inédit (un nouveau type de manipulation, un krach déclenché par un mécanisme jamais observé) ne peut pas être reconnu à l'avance.
C'est pour ça que les stress tests historiques (LUNA, FTX, COVID, Bear 2018) sont utiles · ils valident que la défense fonctionne face à des scénarios déjà documentés. Mais ils ne protègent pas contre l'inconnu absolu. Aucun système ne le peut.
Ces limites sont dues aux choix d'implémentation actuels · certaines pourront être levées dans le temps.
À ce jour, le système a accumulé moins de 60 jours de données shadow. Cela représente un seul régime de marché (manipulé / bruité). Il n'a pas encore vu un vrai trend up prolongé, ni une vraie panique systémique, ni une vraie euphorie de fin de bull market.
Les modules de régime ont été calibrés sur des heuristiques + une période courte. Leur robustesse multi-régimes reste à démontrer. C'est exactement la raison de la phase shadow longue · accumuler le manque de données.
L'agent classique scanne 26 paires Binance définies en dur. Pas de stocks, pas de forex, pas de matières premières, pas même toutes les crypto. La couche macro (DXY, VIX, Nasdaq, or) est inscrite en doctrine V13 mais pas encore implémentée.
Cela signifie que le système peut être totalement aveugle à un événement majeur qui se passe sur des actifs qu'il n'observe pas. Une crise des taux US obligataires pourrait passer inaperçue jusqu'à ce qu'elle impacte directement le BTC.
Le Decision OS ne peut pas profiter des phases baissières en prenant des positions short. Dans un bear market prolongé, son meilleur résultat sera de ne rien faire. C'est cohérent avec la doctrine V12 ("savoir quand ne pas trader"), mais cela limite mécaniquement la performance potentielle.
L'ajout du short est techniquement possible mais introduit une complexité substantielle (margin, funding rates, liquidation risk). Pas prévu avant que le long-only n'ait prouvé sa robustesse.
Ces limites concernent ce que le système peut ou ne peut pas savoir · même en théorie.
Les memecoins post-listing dump structurellement aujourd'hui. C'est observé sur des centaines d'occurrences. Mais ce comportement pourrait évoluer si les market makers initiaux changeaient leurs pratiques, ou si l'écosystème crypto se réglementait davantage.
Le système apprend continuellement, donc en théorie il devrait s'adapter. En pratique, il y a toujours un delay entre le changement de régime et la mise à jour des règles. Pendant ce delay, le système peut continuer à appliquer une logique obsolète.
Le système apprend à partir des trades historiques générés par l'agent classique. Si l'agent classique ne génère jamais de signal sur certaines paires ou certaines conditions, le système n'apprend rien sur ces paires/conditions.
C'est un biais de sélection structurel. L'espace des décisions exploré est limité par les choix initiaux de l'agent classique. Pour explorer plus large, il faudrait modifier l'agent classique · ce qui violerait l'invariant "side-car strict".
Quand on raffine un système sur des données existantes, il y a toujours le risque que les améliorations soient des optimisations spécifiques à ces données. Sur out-of-sample, l'edge disparaît.
Les modules de détection d'overfitting (correlation IS/OOS, walk-forward analysis) sont conçus pour réduire ce risque. Ils ne l'éliminent pas. Le test ultime sera la performance sur des données futures, pas sur des backtests rétroactifs.
Parce que c'est la seule façon de construire de la confiance à long terme. Un projet qui prétend tout savoir mentira inévitablement. Un projet qui publie ce qu'il ne sait pas pourra ajuster, apprendre, évoluer · sans avoir à camoufler des promesses non tenues.
Cette page sera mise à jour à chaque fois qu'une nouvelle limite sera identifiée. Si vous en repérez une qui n'est pas listée · merci de la signaler.
« La transparence radicale n'est pas un slogan marketing. C'est une discipline opérationnelle quotidienne. »