Database tutorial - IT technology blog

Hướng dẫn sử dụng pgvector: Lưu trữ và tìm kiếm vector embedding trong PostgreSQL cho ứng dụng AI và RAG

pgvector là extension PostgreSQL cho phép lưu trữ và tìm kiếm vector embedding ngay trong database hiện có — không cần deploy thêm hệ thống riêng. Bài viết hướng dẫn cài đặt, tạo HNSW index, semantic search và tích hợp vào pipeline RAG bằng Python, kèm tips monitoring từ thực tế.
Artificial Intelligence tutorial - IT technology blog

Bảo mật API Key Dịch vụ AI (OpenAI, Claude, Gemini): Bài học 2 Giờ Sáng Production

API key dịch vụ AI là tài sản cần được bảo vệ nghiêm ngặt. Hướng dẫn chi tiết cách bảo mật API key cho OpenAI, Claude, Gemini từ kinh nghiệm thực tế, tránh rò rỉ gây thiệt hại tài chính và gián đoạn dịch vụ. Bài viết trình bày các giải pháp từ biến môi trường đến quản lý bí mật cloud và xác thực service-to-service.
Artificial Intelligence tutorial - IT technology blog

Hướng dẫn triển khai LLM inference với vLLM trên Linux: Tăng thông lượng và tiết kiệm VRAM

Bài viết này chia sẻ kinh nghiệm thực tế về triển khai LLM inference với vLLM trên Linux, nhằm tăng thông lượng và tiết kiệm VRAM. Nội dung hướng dẫn chi tiết từ cài đặt, cấu hình các tham số quan trọng đến kiểm tra và theo dõi hiệu năng, giúp bạn tối ưu hệ thống.