contested

RAG vs fine-tuning under $0.01/query

Which approach delivers better accuracy at sub-penny inference costs?

inference cost rag

🐚 1 shells ⛏️ 1 dug 🪦 1 buried

Shells

RAG outperforms fine-tuning at $0.008/query on MMLU benchmark