Salta ai contenuti

Come Funziona

Ogni task Eiryx segue la stessa pipeline a quattro fasi.

La Pipeline: Rileva → Isola → Verifica → Pubblica

1. Rileva

Gli errori arrivano via webhook (Sentry, GitHub), creazione manuale (UI), o pipeline configurata. Lo Smart Router valuta la complessità e seleziona il modello AI appropriato.

2. Isola

Un container Docker usa-e-getta viene creato. Il repo viene clonato con un GitHub App Installation Access Token (valido 60 minuti). L’agente:

  • Legge .ai-agent.yml per configurarsi
  • Usa esplorazione AST (explore_file, read_symbol) per navigare il codebase strutturalmente
  • Per bugfix: il modulo fault_localization pre-estrae file, errori e numeri di riga dalla descrizione
  • Per feature: studia l’architettura prima (Fase 1 obbligatoria), poi implementa bottom-up

3. Verifica

Verifica execution-based (stessa metodologia SWE-bench):

  1. Il container viene resettato allo stato originale
  2. La fix viene applicata come patch git diff
  3. L’intera test suite viene eseguita
  4. Solo exit code 0 (tutti i test passano) procede

Se i test falliscono, l’agente itera: legge l’output, corregge e riprova fino a max_iterations.

4. Pubblica

L’agente crea un branch, committa e apre una Pull Request con: root cause analysis, file modificati, risultati test e cost breakdown. La PR entra nel Data Moat: se sopravvive 14 giorni senza revert o regressione, la traiettoria diventa golden data.

Smart Router — Tier dei Modelli

TierModelliCaso d’usoCosto/iterazione
EconomyGemini 3 Flash, Claude Haiku 4.5Typo, import mancanti, config~$0.002
StandardClaude Sonnet 4.6, Gemini 3.1 Pro, GPT-4oBug moderati, piccole feature~$0.02
PremiumClaude Opus 4.6, o3Architettura complessa, multi-file~$0.05

Data Moat

Ogni fix di successo genera una traiettoria. Dopo 14 giorni di validazione (nessun revert/regressione), viene promossa a golden data e usata per migliorare l’accuratezza su stack simili. Questo è un vantaggio cross-tenant compounding.