Posted in人工知能 Docling:RAGシステムの「PDFの呪い」を解く — データのゴミから高品質なMarkdownへ Posted by By admin 5月 10, 2026 複雑なPDFの処理は、RAG構築において常に最大の難所です。IBMのDoclingがAIを用いてレイアウトを解析し、PDFを正確なMarkdownへ変換する方法を解説します。LLMがデータを深く理解し、よりスマートに回答できるようになります。
Posted inPython PythonとPyMuPDFでPDFを「爆速」処理:シンプルなスクリプトからプロダクション環境まで Posted by By admin 5月 4, 2026 PyMuPDF (fitz) を使ったプロフェッショナルなPDF処理手法を学びましょう。構造化されたテキスト抽出からファイルの結合、自動ウォーターマーク挿入まで、Pythonプロジェクトのパフォーマンスを最適化するソリューションを紹介します。