AI tutorial - IT technology blog

llama.cppの量子化でLLMモデルをGGUF形式に変換する方法

大規模言語モデルをローカルで動かすには、品質を損なわずにファイルサイズを削減する必要があります。このガイドでは、Hugging Faceからモデルをダウンロードし、GGUF形式に変換して、Q4_K_Mなどのレベルに量子化することで一般的なハードウェアで動作させるまでのllama.cppの全パイプラインを解説します。
AI tutorial - IT technology blog

Claude Codeの設定:settings.jsonファイルの活用ガイド

settings.jsonファイルを使いこなして、Claude Code CLIのエクスペリエンスを最適化しましょう。コマンド承認の自動化、コスト削減のためのモデル切り替え、プロジェクト固有のカスタム指示の設定方法を解説します。
AI tutorial - IT technology blog

WhisperとOllamaでローカル音声アシスタントを構築する:完全オフラインの音声認識とLLM応答

Whisperで音声認識、OllamaでローカルLLM応答を行う完全オフライン音声アシスタントの構築ガイド。クラウドAPI不要、レイテンシーのオーバーヘッドなし、完全なプライバシーを実現。6ヶ月の本番運用経験に基づく実測パフォーマンスデータを含む実践的な内容。
AI tutorial - IT technology blog

Claude SDKで作る自律型Pythonエージェント

AIを受動的なチャットボットから、能動的に動くエージェントへと進化させましょう。Claude SDKを使用して、ツールの呼び出し、状態管理、複雑なPythonワークフローを処理する方法をガイドします。