Viết Unit Test cho ứng dụng Python với Pytest: Hướng dẫn từ cơ bản đến thực hành – ITFROMZERO

Table of Contents

Bối cảnh & Tại sao cần viết Unit Test cho Python?

Trong quá trình phát triển phần mềm, việc đảm bảo chất lượng code luôn là một thách thức lớn. Bạn có bao giờ lo lắng khi thay đổi một dòng code nhỏ, sợ rằng nó sẽ phá vỡ một tính năng nào đó ở một nơi xa xôi trong hệ thống không? Hay mỗi khi triển khai tính năng mới, bạn lại phải mất hàng giờ kiểm tra thủ công các chức năng cũ?

Những tình huống này rất phổ biến với bất kỳ lập trình viên nào. Khi dự án lớn dần, codebase phình to, việc quản lý và duy trì chất lượng càng trở nên khó khăn. Các lỗi phát sinh thường có chi phí sửa chữa cao hơn nhiều nếu chúng bị phát hiện muộn, đặc biệt là sau khi sản phẩm đã đến tay người dùng. Một ví dụ điển hình là việc một lỗi nhỏ ở khâu thanh toán có thể khiến công ty mất hàng chục ngàn đô la mỗi ngày nếu không được phát hiện kịp thời.

Giải pháp cho vấn đề này chính là Unit Test – kiểm thử đơn vị. Unit Test giúp bạn kiểm tra độc lập từng phần nhỏ nhất (đơn vị) của ứng dụng. Mỗi đơn vị, thường là một hàm hoặc một phương thức, sẽ được kiểm tra để đảm bảo hoạt động đúng như mong đợi trong mọi trường hợp. Điều này không chỉ giúp phát hiện lỗi sớm mà còn cung cấp một ‘lưới an toàn’ vững chắc mỗi khi bạn cần refactor (tái cấu trúc) code hoặc thêm tính năng mới.

Mình từng có kinh nghiệm refactor một codebase lên tới 50.000 dòng code. Bài học lớn nhất mình rút ra từ dự án đó là: phải có test coverage tốt trước khi bắt đầu. Không có unit test, mỗi lần thay đổi code là một canh bạc lớn, tiềm ẩn rủi ro khôn lường.

Điều này đặc biệt đúng trong các dự án lớn, nơi một thay đổi nhỏ có thể gây ra hậu quả không lường trước được. Có unit test, mình tự tin hơn rất nhiều khi điều chỉnh các thành phần, bởi vì mình biết ngay nếu có gì đó không ổn. Điều này giúp giảm thời gian debug từ vài giờ xuống còn vài phút.

Trong Python, có nhiều framework hỗ trợ viết unit test, nhưng Pytest nổi bật nhờ sự đơn giản, cú pháp dễ đọc và khả năng mở rộng mạnh mẽ.

So với module unittest tích hợp sẵn, Pytest mang lại trải nghiệm viết test thân thiện hơn, giúp bạn tập trung vào logic kiểm thử thay vì các đoạn code boilerplate rườm rà. Với người mới bắt đầu làm quen với lập trình, việc học Pytest sẽ là một khoản đầu tư xứng đáng vào kỹ năng phát triển phần mềm chất lượng cao, giúp bạn tiết kiệm hàng trăm giờ kiểm thử thủ công trong tương lai.

Cài đặt Pytest và cấu trúc dự án cơ bản

Để bắt đầu với Pytest, trước tiên bạn cần đảm bảo máy tính đã cài đặt Python và trình quản lý gói pip. Sau đó, chúng ta sẽ cài đặt Pytest cùng với một thư viện hữu ích khác là pytest-cov (để đo độ phủ mã kiểm thử).

1. Chuẩn bị môi trường (Optional nhưng rất khuyến khích)

Mình khuyên bạn nên sử dụng môi trường ảo (virtual environment) cho mỗi dự án Python. Cách này giúp tránh xung đột giữa các phiên bản thư viện của các dự án khác nhau một cách hiệu quả.


python3 -m venv venv
source venv/bin/activate

Lệnh trên sẽ tạo một thư mục venv chứa môi trường ảo, sau đó kích hoạt nó. Bạn sẽ thấy (venv) xuất hiện ở đầu dòng lệnh của mình, báo hiệu môi trường ảo đã sẵn sàng.

2. Cài đặt Pytest và pytest-cov


pip install pytest pytest-cov

Sau khi chạy lệnh này, Pytest và pytest-cov đã sẵn sàng để bạn sử dụng ngay lập tức.

3. Cấu trúc dự án

Một cấu trúc dự án đơn giản nhưng hiệu quả cho việc kiểm thử sẽ trông như thế này:


my_project/
├── src/
│   └── my_module.py
└── tests/
    └── test_my_module.py

src/: Chứa mã nguồn chính của ứng dụng.
tests/: Nơi lưu trữ tất cả các tệp kiểm thử. Pytest sẽ tự động tìm kiếm các tệp có tiền tố test_ hoặc hậu tố _test.py trong thư mục này.

Cấu hình chi tiết và viết Unit Test hiệu quả với Pytest

Với Pytest, việc viết test case trở nên rất trực quan và dễ hiểu. Chúng ta sẽ cùng đi sâu vào các thành phần chính để bạn có thể tạo ra những bài kiểm thử chất lượng cao.

1. Viết Test Case đầu tiên

Hãy bắt đầu với một hàm Python đơn giản trong src/my_module.py:


# src/my_module.py

def add(a, b):
    """Cộng hai số a và b.

    Args:
        a (int/float): Số thứ nhất.
        b (int/float): Số thứ hai.

    Returns:
        int/float: Tổng của a và b.
    """
    return a + b

def subtract(a, b):
    """Trừ hai số a và b.

    Args:
        a (int/float): Số bị trừ.
        b (int/float): Số trừ.

    Returns:
        int/float: Hiệu của a và b.
    """
    return a - b

Bây giờ, tạo một tệp kiểm thử tương ứng trong tests/test_my_module.py:


# tests/test_my_module.py

from src.my_module import add, subtract

def test_add_positive_numbers():
    assert add(1, 2) == 3

def test_add_negative_numbers():
    assert add(-1, -2) == -3

def test_subtract_numbers():
    assert subtract(5, 3) == 2

def test_subtract_negative_result():
    assert subtract(3, 5) == -2

Giải thích chi tiết:

Pytest tự động tìm các hàm bắt đầu bằng test_ trong các tệp có tiền tố test_.
Câu lệnh assert được dùng để kiểm tra một điều kiện cụ thể. Nếu điều kiện là False, test sẽ thất bại, báo hiệu có lỗi.

2. Sử dụng Fixtures (Bộ thiết lập)

Fixtures là các hàm mà Pytest chạy trước (và đôi khi cả sau) khi thực thi một hoặc nhiều test case. Chúng rất hữu ích để thiết lập môi trường test (ví dụ: tạo đối tượng, kết nối database, tạo tệp tạm thời) và dọn dẹp sau đó. Điều này giúp code test của bạn gọn gàng hơn, dễ tái sử dụng hơn và đáng tin cậy hơn.

Ví dụ, giả sử bạn có một test cần tạo một tệp tạm thời. Thay vì tự tạo và dọn dẹp thủ công, bạn có thể dùng fixture:


# tests/test_my_module.py (tiếp theo)

import pytest
import os

@pytest.fixture
def temp_file(tmp_path):
    # tmp_path là một fixture có sẵn của pytest, giúp tạo thư mục tạm thời
    file_path = tmp_path / "test.txt"
    file_path.write_text("Hello Pytest!")
    yield file_path # Code sau 'yield' sẽ chạy sau khi test hoàn thành (để dọn dẹp)
    # Thực tế, tmp_path tự dọn dẹp, nhưng đây là ví dụ minh họa cách yield hoạt động
    # print(f"Dọn dẹp tệp tạm thời: {file_path}") # Chỉ để minh họa

def test_read_temp_file(temp_file):
    # temp_file ở đây chính là giá trị được trả về từ fixture temp_file
    with open(temp_file, 'r') as f:
        content = f.read()
    assert content == "Hello Pytest!"
    assert os.path.exists(temp_file) # Kiểm tra xem tệp có thực sự tồn tại không

Trong ví dụ này, temp_file là một fixture sẽ tạo một tệp tạm thời và cung cấp đường dẫn của nó cho test case test_read_temp_file. Pytest sẽ tự động quản lý vòng đời của fixture này, đảm bảo môi trường test luôn sạch sẽ.

3. Parameterization (Tham số hóa)

Khi bạn cần kiểm thử một hàm với nhiều bộ dữ liệu đầu vào khác nhau nhưng cùng một logic kiểm thử, parameterization là công cụ đắc lực. Thay vì viết nhiều test case trùng lặp, bạn có thể định nghĩa một test case và cung cấp danh sách các tham số. Điều này giúp giảm đáng kể lượng code test.


# tests/test_my_module.py (tiếp theo)

@pytest.mark.parametrize("a, b, expected", [
    (1, 2, 3),
    (-1, -2, -3),
    (0, 0, 0),
    (100, -50, 50),
])
def test_add_various_inputs(a, b, expected):
    assert add(a, b) == expected

@pytest.mark.parametrize("a, b, expected", [
    (5, 3, 2),
    (3, 5, -2),
    (0, 0, 0),
    (10, -5, 15),
])
def test_subtract_various_inputs(a, b, expected):
    assert subtract(a, b) == expected

Decorator @pytest.mark.parametrize nhận vào hai đối số: một chuỗi chứa tên các tham số được ngăn cách bởi dấu phẩy, và một danh sách các tuple chứa các giá trị tương ứng cho mỗi lần chạy test. Ví dụ trên sẽ tạo ra 4 test case riêng biệt cho hàm add và 4 test case cho hàm subtract chỉ từ một định nghĩa.

4. Giả lập (Mocking)

Khi hàm của bạn tương tác với các hệ thống bên ngoài (API, database, file system), việc kiểm thử có thể trở nên phức tạp và chậm chạp. Mocking cho phép bạn thay thế các thành phần bên ngoài này bằng các đối tượng giả (mocks) có hành vi được định trước. Điều này giúp bạn kiểm thử logic của hàm một cách độc lập và nhanh chóng hơn nhiều.

Pytest hoạt động rất tốt với thư viện unittest.mock. Ví dụ, nếu bạn có một hàm gọi API:


# src/my_module.py
import requests

def get_user_data(user_id):
    response = requests.get(f"https://api.example.com/users/{user_id}")
    response.raise_for_status() # Raise an exception for HTTP errors
    return response.json()

Bạn có thể giả lập requests.get như sau:


# tests/test_my_module.py (tiếp theo)

from unittest.mock import patch

def test_get_user_data_success():
    with patch('src.my_module.requests.get') as mock_get:
        # Cấu hình mock object
        mock_get.return_value.status_code = 200
        mock_get.return_value.json.return_value = {"id": 1, "name": "Test User"}
        mock_get.return_value.raise_for_status.return_value = None

        data = get_user_data(1)
        assert data == {"id": 1, "name": "Test User"}
        mock_get.assert_called_once_with("https://api.example.com/users/1")

def test_get_user_data_http_error():
    with patch('src.my_module.requests.get') as mock_get:
        mock_get.return_value.status_code = 404
        mock_get.return_value.json.return_value = {}
        # Giả lập raise_for_status ném ra ngoại lệ HTTPError
        mock_get.return_value.raise_for_status.side_effect = requests.exceptions.HTTPError

        with pytest.raises(requests.exceptions.HTTPError):
            get_user_data(2)

Sử dụng patch, chúng ta đã thay thế hàm requests.get bằng một đối tượng mock. Điều này cho phép chúng ta kiểm soát kết quả trả về và kiểm tra xem hàm đó có được gọi đúng cách hay không mà không cần thực sự gọi API bên ngoài.

Kiểm tra & Monitoring: Đảm bảo chất lượng liên tục

Sau khi đã viết xong các test case, bước tiếp theo là chạy chúng và phân tích kết quả. Pytest cung cấp một bộ công cụ mạnh mẽ để làm điều này, giúp bạn dễ dàng theo dõi chất lượng code.

1. Chạy Unit Test

Từ thư mục gốc của dự án (my_project/), bạn chỉ cần chạy lệnh pytest:


(venv) $ pytest

Pytest sẽ tự động tìm kiếm và chạy tất cả các test case mà nó tìm thấy trong dự án. Kết quả đầu ra sẽ cho bạn biết có bao nhiêu test đã chạy, bao nhiêu test pass (ký hiệu .), fail (ký hiệu F) hoặc bị lỗi (ký hiệu E).

2. Các tùy chọn dòng lệnh hữu ích

pytest -v: Chế độ verbose, hiển thị chi tiết hơn từng test case đang chạy.
pytest -s: Cho phép hiển thị các câu lệnh print() trong quá trình test. Rất hữu ích cho việc debug.
pytest -k "add and not negative": Chỉ chạy các test case có tên chứa “add” và không chứa “negative”.
pytest tests/test_my_module.py::test_add_positive_numbers: Chạy một test case cụ thể.
pytest --maxfail=1: Dừng chạy test ngay sau khi gặp test case thất bại đầu tiên. Hữu ích khi bạn muốn sửa lỗi nhanh chóng.


(venv) $ pytest -v
============================= test session starts ==============================
platform linux -- Python 3.x.x, pytest-x.x.x, pluggy-x.x.x -- /home/user/my_project/venv/bin/python
rootdir: /home/user/my_project
plugins: cov-x.x.x
collected 8 items

tests/test_my_module.py::test_add_positive_numbers PASSED                 [ 12%]
tests/test_my_module.py::test_add_negative_numbers PASSED                 [ 25%]
tests/test_my_module.py::test_subtract_numbers PASSED                     [ 37%]
tests/test_my_module.py::test_subtract_negative_result PASSED             [ 50%]
tests/test_my_module.py::test_read_temp_file PASSED                      [ 62%]
tests/test_my_module.py::test_add_various_inputs[1-2-3] PASSED            [ 75%]
tests/test_my_module.py::test_add_various_inputs[-1--2--3] PASSED         [ 87%]
tests/test_my_module.py::test_add_various_inputs[0-0-0] PASSED            [100%]

============================== 8 passed in X.XXs ===============================

3. Đo độ phủ mã (Test Coverage)

Test coverage là một chỉ số quan trọng cho biết bao nhiêu phần trăm mã nguồn của bạn đã được kiểm thử bởi các unit test. Một độ phủ cao không đảm bảo code không có lỗi, nhưng nó cho thấy bạn đã kiểm tra được hầu hết các nhánh và dòng code. Công cụ pytest-cov mà chúng ta đã cài đặt sẽ giúp đo lường chỉ số này một cách dễ dàng.

Để chạy test và tạo báo cáo coverage, bạn dùng lệnh:


(venv) $ pytest --cov=src --cov-report=term-missing

--cov=src: Chỉ định thư mục hoặc module mà bạn muốn đo độ phủ (ở đây là thư mục src).
--cov-report=term-missing: Hiển thị báo cáo chi tiết trực tiếp trên terminal, bao gồm cả các dòng code chưa được test.


============================= test session starts ==============================
...
-------------------------- coverage: platform linux --------------------------
Name                  Stmts   Miss  Cover   Missing
---------------------------------------------------
src/my_module.py         12      0   100%   
---------------------------------------------------
TOTAL                    12      0   100%
============================== 8 passed in X.XXs ===============================

Báo cáo này cho thấy src/my_module.py của chúng ta đạt 100% độ phủ, nghĩa là mọi dòng code trong đó đều đã được thực thi ít nhất một lần bởi các test case. Nếu có các dòng code chưa được test, bạn sẽ thấy chúng được liệt kê rõ ràng trong cột ‘Missing’, giúp bạn dễ dàng bổ sung test.

4. Tích hợp với CI/CD (Continuous Integration/Continuous Deployment)

Unit test là một phần không thể thiếu của quy trình CI/CD hiện đại. Bằng cách tự động chạy tất cả các test mỗi khi có thay đổi được đẩy lên repository, bạn có thể đảm bảo rằng code mới không gây ra lỗi hồi quy và duy trì chất lượng tổng thể của ứng dụng.

Mặc dù việc thiết lập CI/CD là một chủ đề lớn và phức tạp hơn, nhưng về cơ bản, các hệ thống CI/CD sẽ gọi lệnh pytest tương tự như cách bạn chạy trên máy local để kiểm tra mã nguồn trước khi cho phép nó được hợp nhất hoặc triển khai. Điều này giúp bắt lỗi sớm, tiết kiệm thời gian và nguồn lực.

Kết luận

Viết unit test với Pytest không chỉ là một kỹ năng cần thiết mà còn là một tư duy quan trọng trong phát triển phần mềm chuyên nghiệp. Nó giúp bạn xây dựng ứng dụng bền vững hơn, giảm thiểu lỗi, tăng tốc độ refactor và mang lại sự tự tin cho toàn bộ đội ngũ phát triển.

Với những kiến thức từ cơ bản đến thực hành này, mình tin rằng bạn đã có đủ hành trang để bắt đầu hành trình kiểm thử ứng dụng Python của mình một cách hiệu quả. Đừng ngần ngại áp dụng Pytest vào dự án tiếp theo của bạn để thấy sự khác biệt rõ rệt về chất lượng code.