AI tutorial - IT technology blog

LLM評価:本番環境でAIモデルの品質を測定する実践的な方法とツール

LLM評価とは、AIモデルの出力が正確で関連性があり安全かどうかを体系的に測定する実践です。単なる速度ではなく、内容の品質を問います。本ガイドでは、DeepEvalとRAGASの実践的なセットアップ、CI/CDへの統合、そして実際のデプロイ経験から得たプロダクション監視戦略を解説します。
AI tutorial - IT technology blog

DoclingでPDFテーブルを抽出してRAGシステムに活用する

PDFヘビーなRAGシステムでDoclingを6ヶ月間本番運用した経験をもとに、テーブルを正確に抽出し、インテリジェントにチャンク化して、精度の高い検索のためにインデックス化する方法を解説します。クイックスタート、パイプライン構築、そして苦労して得た実践的なヒントを網羅しています。
AI tutorial - IT technology blog

RAG解説: 本番環境でLLMの信頼性を維持する方法

本番環境でLLMが幻覚を起こしたり、古い情報を提供していませんか?検索拡張生成(RAG)がその解決策です。このチュートリアルでは、RAGのアーキテクチャと、信頼性の高い事実に基づいたAIシステムを構築するためのPythonの例を詳しく説明します。