Posted inAI 「なんとなく」の評価から脱却:RAGASでRAGのパフォーマンスを定量化する 5月 2, 2026 AIのテストを「雰囲気」で行うのはもう終わりにしましょう。LLMを活用した自動スコアリングツールRAGASを使って、Faithfulness、Relevancy、Recallを定量化する方法を学びます。
Posted inAI LLM評価:本番環境でAIモデルの品質を測定する実践的な方法とツール 4月 18, 2026 LLM評価とは、AIモデルの出力が正確で関連性があり安全かどうかを体系的に測定する実践です。単なる速度ではなく、内容の品質を問います。本ガイドでは、DeepEvalとRAGASの実践的なセットアップ、CI/CDへの統合、そして実際のデプロイ経験から得たプロダクション監視戦略を解説します。