expert · $$ 4
Sara — Genel Analist
analyst
Her platformdan veri çeker, trend ve anomali işaretler
Platform-aşırı performans senteziAnomali ve viral patlama tespitiRakip benchmark
professor · $$$
Model Değerlendirici
analyst
Eval harness, A/B test ve red-team ile modelin gerçek dünyada ne kadar iyi olduğunu ölçer
Domain-specific eval set tasarımı (rubric + golden set)LLM-as-judge bias check + multi-judge agreementPrompt regression test (CI'de eval gate)