Skip to content
ITFROMZERO - Share tobe shared!
  • Window
    • Software
    • Windows 10
  • Linux
    • Centos
    • Ubuntu
    • MonitoringHệ thống giám sát trên Linux
  • Virtualization
    • VMware
    • Docker
  • Database
    • MySQL
    • Cassandra
  • Dev
    • Git
    • Python
  • Hardware
  • Tiếng Việt
    • Tiếng Việt
    • English
    • 日本語
  • Window
    • Software
    • Windows 10
  • Linux
    • Centos
    • Ubuntu
    • MonitoringHệ thống giám sát trên Linux
  • Virtualization
    • VMware
    • Docker
  • Database
    • MySQL
    • Cassandra
  • Dev
    • Git
    • Python
  • Hardware
  • Tiếng Việt
    • Tiếng Việt
    • English
    • 日本語
  • Facebook

web scraping

Python tutorial - IT technology blog
Posted inPython

Cào data ‘cứng đầu’ với Playwright Python: Giải pháp tối ưu cho web JavaScript-heavy

Posted by By admin Tháng 5 16, 2026
Hết thời dùng BeautifulSoup cho web hiện đại! Khám phá cách Playwright Python xử lý gọn các website JavaScript-heavy, từ việc giả lập cuộn trang đến dùng Trace Viewer để debug thần tốc.
Read More
Artificial Intelligence tutorial - IT technology blog
Posted inAI

Crawl4AI: Biến Website thành Markdown ‘sạch’ cho RAG chỉ với vài dòng Code Python

Posted by By admin Tháng 5 7, 2026
Dẹp bỏ nỗi lo dữ liệu web 'bẩn' khi làm RAG. Hướng dẫn chi tiết cách dùng Crawl4AI để chuyển đổi website thành Markdown chuẩn hóa, giúp tăng 70% hiệu quả cho hệ thống AI của bạn.
Read More
Python tutorial - IT technology blog
Posted inPython

Web Scraping với Python BeautifulSoup: Chọn đúng công cụ trước khi code

Posted by By admin Tháng 3 3, 2026
So sánh requests+BeautifulSoup, Selenium và Scrapy để chọn đúng công cụ scrape web theo từng bài toán. Hướng dẫn triển khai từng bước với code Python thực tế: parse HTML, CSS selector, xử lý edge case và mẹo từ dự án thực.
Read More
Artificial Intelligence tutorial - IT technology blog
Posted inAI

Firecrawl: Thu Thập Dữ Liệu Web Cho Ứng Dụng AI Khi Scraper Thông Thường Thất Bại

Posted by By admin Tháng 2 27, 2026
Khi BeautifulSoup trả về "Please enable JavaScript" lúc 2 giờ sáng trước deadline, Firecrawl là thứ cứu cả pipeline. Hướng dẫn thực tế về cách dùng Firecrawl để crawl dữ liệu web sạch cho AI và RAG pipeline bằng Python.
Read More
Copyright 2026 — ITFROMZERO. All rights reserved.
Privacy Policy | Terms of Service | Contact: [email protected] DMCA.com Protection Status
Scroll to Top