LLM Quality & Cost
Темп витрат і якість пайплайну Actor/Critic/Judge.
| Графік | Тип | Джерело | Сигнал |
|---|---|---|---|
| Token Burn Rate | Time series | delio_llm_tokens_total by provider | Піки витрат Gemini vs DeepSeek vs Claude. |
| Cost per Model (USD/hour) | Stacked area | delio_llm_cost_usd by model | Вартість кожної моделі в годину. |
| Actor vs Critic vs Judge hit rate | Pie / bar | delio_llm_tokens_total{type="output"} by request_type | Частка проходження кожного етапу pipeline. |
| Fallback Chain Activations | Time series + alert | delio_fsm_transitions_total{to_state="FALLBACK"} | Коли Actor падає і вмикається fallback. |
| Cost Budget Utilization | Gauge | delio_cost_daily_tokens_total / budget_cap | Відсоток денного бюджету. |
| Emergency Mode Timeline | State timeline | delio_cost_emergency_mode | Коли система переходила в emergency mode. |
| Average Response Latency by Intent | Histogram | delio_fsm_processing_seconds by intent | SIMPLE vs COMPLEX latency trend. |