Indeed bypass WAF · sourcing avec proxies résidentiels
Research
Talent · sourcing
Initié · 2026-05-26
Indeed FR retourne 403 + challenge JS sur les requêtes serveur classiques (Cloudflare + WAF maison). Exploration des solutions · proxies résidentiels (Bright Data, Oxylabs), services tiers (ScrapingBee, ZenRows), capture de cookies depuis browser réel. Aucune piste validée pour la production.
Playwright
playwright-stealth
Cookie sessions
Proxy résidentiel
Statut · bloqué · ROI vs coût des services tiers à arbitrer. Volume FR déjà fort via FT API + Adzuna + HelloWork (~200 offres/jour user).
Sites métier ESS · worker Mac local
Prototype
Talent · sourcing
Initié · 2026-05-26
Certains sites emploi médico-social (emploi-medico-social.fr, sociodoo, profession-formation.gouv.fr) timeoutent depuis le VPS mais répondent depuis IP résidentielle. Exploration d'un worker Python local Mac qui scrape ces sources et POST les offres au backend VPS via une API d'ingestion.
Python local
launchd cron
API ingestion VPS
Site-spécifique parsers
Statut · spec rédigée · le worker n'est pas encore codé. Décision pendante sur l'architecture de communication local→VPS (HTTPS direct vs queue).
Trading shadow validation · journal longitudinal 90 jours
Experiment
Trading · decision OS
Initié · 2026-05-19
Validation longitudinale de la doctrine V20 · le système prend des décisions virtuelles en mode shadow, sans exécuter, et le journal est comparé aux signaux marché 90 jours après. Vise à mesurer l'edge réel "savoir QUAND ne pas trader" hors curve-fitting.
Decision OS V20
Architecture probabiliste
Anti-overfitting
Mode shadow strict
Statut · infrastructure en place · aucune position réelle prise · doctrine "savoir quand ne pas trader" verrouillée.
LinkedIn Easy Apply via Playwright + cookies user
Prototype
Talent · auto-apply
Initié · 2026-05-26
Connecteur LinkedIn complet · injection du cookie li_at utilisateur dans une session Playwright headless, recherche jobs avec filtres, détection des offres "Easy Apply" vs externes, et plus tard automatisation du form-fill. Backend et endpoints prêts, en attente d'un cookie de test pour validation.
Playwright headless
Cookie auth
Easy Apply detection
Form-fill IA
Statut · backend déployé · UI saisie cookie pending · première session test à valider.
Business diagnostic engine · multi-secteur
Research
Pilotes · diagnostic
Origine · CitizOS (héritage 2025-2026)
Moteur de diagnostic métier qui détecte automatiquement le sous-type d'un business (5 sous-types garage par exemple) via keyword matching sur description, ratings, photos. Couplé aux vertical_knowledge_*.json pour générer des recommandations sectorielles précises.
Keyword matching
vertical_knowledge_garage.json
Multi-source enrichment
Cold-email-ready briefs
Statut · opérationnel sur le secteur garage · à étendre médico-social, restauration, esthétique. Knowledge files à enrichir.
Multi-modèles routing · DeepSeek / Claude / GPT
Research note
Infrastructure · agents IA
2026-05-26
Pour la génération de LM IA, DeepSeek-chat est utilisé (rapport qualité/coût favorable, ~10s par génération). Exploration d'un router qui choisit dynamiquement le modèle selon la tâche · DeepSeek pour génération texte, Claude pour parsing complexe, GPT pour tâches de raisonnement.
DeepSeek-chat
Claude Sonnet
GPT-4o-mini
Routing dynamique
Statut · DeepSeek seul en production · décision multi-modèles repoussée tant que la qualité actuelle suffit (KISS principle).