AI tutorial - IT technology blog

Claude SDKで作る自律型Pythonエージェント

AIを受動的なチャットボットから、能動的に動くエージェントへと進化させましょう。Claude SDKを使用して、ツールの呼び出し、状態管理、複雑なPythonワークフローを処理する方法をガイドします。
AI tutorial - IT technology blog

LLM評価:本番環境でAIモデルの品質を測定する実践的な方法とツール

LLM評価とは、AIモデルの出力が正確で関連性があり安全かどうかを体系的に測定する実践です。単なる速度ではなく、内容の品質を問います。本ガイドでは、DeepEvalとRAGASの実践的なセットアップ、CI/CDへの統合、そして実際のデプロイ経験から得たプロダクション監視戦略を解説します。