QPS (Queries Per Second) trong load balancer là số lượng các yêu cầu truy vấn (query) được gửi tới một máy chủ hoặc ứng dụng web trong một giây. Đây là một chỉ số quan trọng trong quá trình tối ưu hóa hiệu suất của hệ thống, bởi vì nó cho phép các nhà phát triển và quản trị viên hệ thống đánh giá khả năng chịu tải của hệ thống và điều chỉnh nó cho phù hợp.
Trong một môi trường load balancer, QPS thường được sử dụng để xác định tải của các máy chủ và các yêu cầu truy vấn được phân phối đều giữa các máy chủ khác nhau để đảm bảo hiệu suất tối ưu. Khi QPS quá cao, hệ thống có thể gặp phải các vấn đề về hiệu suất và thời gian phản hồi, do đó cần điều chỉnh để đảm bảo hệ thống hoạt động tốt.