Artificial Intelligence tutorial - IT technology blog

Hướng dẫn triển khai LLM inference với vLLM trên Linux: Tăng thông lượng và tiết kiệm VRAM

Bài viết này chia sẻ kinh nghiệm thực tế về triển khai LLM inference với vLLM trên Linux, nhằm tăng thông lượng và tiết kiệm VRAM. Nội dung hướng dẫn chi tiết từ cài đặt, cấu hình các tham số quan trọng đến kiểm tra và theo dõi hiệu năng, giúp bạn tối ưu hệ thống.
Artificial Intelligence tutorial - IT technology blog

Xây dựng hệ thống RAG với RAGFlow: Từ cài đặt đến triển khai production hiệu quả

Hệ thống RAG (Retrieval-Augmented Generation) giúp LLM trả lời chính xác hơn bằng cách truy xuất thông tin từ kho dữ liệu ngoài. RAGFlow là nền tảng giúp xây dựng, quản lý và triển khai RAG hiệu quả. Bài viết này hướng dẫn cài đặt RAGFlow, tạo ứng dụng RAG, cấu hình dữ liệu, LLM và triển khai API, tối ưu cho production.
Artificial Intelligence tutorial - IT technology blog

Hướng dẫn cài đặt và sử dụng Qdrant: Vector database mạnh mẽ cho ứng dụng AI và RAG thực chiến

Bài viết hướng dẫn chi tiết cách cài đặt và sử dụng Qdrant, một vector database mạnh mẽ, để xây dựng các ứng dụng AI và RAG hiệu quả. Mình chia sẻ kinh nghiệm thực tế sau hơn 6 tháng triển khai Qdrant trên môi trường production, phân tích ưu nhược điểm và cung cấp code Python mẫu để bạn có thể bắt đầu ngay.
Artificial Intelligence tutorial - IT technology blog

Tối Ưu Hóa Công Việc Với Gemini CLI: Trợ Lý AI Ngay Tại Terminal, Nâng Tầm Năng Suất Cho Developer

Bài viết này sẽ hướng dẫn chi tiết cách dùng Gemini CLI, công cụ giúp biến terminal thành một trợ lý AI đắc lực. Chúng ta sẽ cùng tìm hiểu cách cài đặt, cấu hình và xem các ví dụ thực tế về cách nó có thể tối ưu hóa công việc IT hàng ngày của bạn.
Artificial Intelligence tutorial - IT technology blog

MCP là gì? Hiểu Model Context Protocol và cách tích hợp vào dự án AI

MCP (Model Context Protocol) là giao thức chuẩn của Anthropic cho phép AI model kết nối trực tiếp với file system, database và các công cụ bên ngoài. Bài viết giải thích kiến trúc 3 thành phần, hướng dẫn cài đặt với Claude Desktop và Python SDK, cùng cách cấu hình bảo mật và debug thực tế.