Được chôn trong các thông báo Google I/O 2026 là một thay đổi về giá có thể quan trọng hơn bất kỳ tính năng mới nào: Gemini đang chuyển từ giới hạn số lượng prompt mỗi ngày sang mô hình định giá dựa trên mức độ tính toán. Thay vì “bạn được X tin nhắn mỗi ngày,” giá sẽ tính theo độ phức tạp của prompt, các tính năng bạn sử dụng và độ dài cuộc hội thoại.
Điều này nghe có vẻ kỹ thuật. Nhưng ý nghĩa thực tế rất rõ ràng: bạn sẽ không còn bị chặn giữa buổi chiều vì đã dùng hết số tin nhắn hàng ngày. Không cần phải tiết kiệm prompt. Và mô hình định giá mới phản ánh đúng giá trị bạn nhận được từ mỗi tương tác.
Điểm chính cần nhớ
Định giá dựa trên mức độ tính toán tốt hơn với hầu hết người dùng. Người dùng nhẹ nhàng được tương tác nhiều hơn. Người dùng nặng trả nhiều tiền hơn nhưng không bao giờ chạm giới hạn cứng. Giới hạn tin nhắn hàng ngày — nơi bạn dễ bị chặn vào một buổi chiều làm việc hiệu quả — sẽ biến mất. Google đang đặt cược rằng việc loại bỏ rào cản sẽ tăng tổng lượng sử dụng và doanh thu nhiều hơn so với các giới hạn cố định.
Định giá dựa trên mức độ tính toán hoạt động như thế nào?
Thay vì đếm số tin nhắn, hệ thống đo lường mức độ tính toán tiêu tốn cho mỗi tương tác. Một câu hỏi đơn giản (“mấy giờ rồi ở Tokyo?”) tiêu tốn rất ít tài nguyên — có thể chỉ 1/100 ngân sách của bạn. Một nhiệm vụ phức tạp (“phân tích tài liệu 50 trang này, trích xuất dữ liệu tài chính và tạo bảng so sánh”) sẽ tiêu tốn nhiều hơn đáng kể — có thể là 1/5 ngân sách của bạn.
| Loại nhiệm vụ | Mức độ sử dụng tính toán | Theo mô hình cũ | Theo mô hình tính toán |
|---|---|---|---|
| Câu hỏi nhanh | Rất thấp | Tính là 1 tin nhắn (giống với nhiệm vụ phức tạp) | Gần như không ảnh hưởng đến ngân sách |
| Cuộc hội thoại thông thường | Thấp-Trung bình | Tính là 1 tin nhắn mỗi lượt | Tiêu tốn mức tính toán vừa phải mỗi lượt |
| Phân tích tài liệu | Trung bình-Cao | Tính là 1 tin nhắn (không công bằng) | Tiêu tốn nhiều tính toán hơn (công bằng hơn) |
| Nhiệm vụ của agent Gemini Spark | Cao | N/A (Spark là tính năng mới) | Tiêu tốn nhiều tính toán cho mỗi nhiệm vụ |
| Gemini Omni video | Rất cao | N/A (Omni là tính năng mới) | Tiêu tốn nhiều tính toán nhất |
Hiệu quả thực tế: bạn có thể gửi hàng trăm tin nhắn đơn giản mà không cần lo lắng. Các nhiệm vụ phức tạp và hoạt động của agent sẽ tiêu tốn ngân sách nhanh hơn. Điều này phù hợp với thực tế — một câu hỏi nhanh không nên tốn kém bằng một phân tích 50 trang.
---📬 Bạn thấy hữu ích? Chúng tôi phân tích các thay đổi về giá AI ảnh hưởng đến ví tiền của bạn. Nhận qua email →
---Ai được lợi và ai thiệt thòi?
| Loại người dùng | Tác động | Lý do |
|---|---|---|
| Người dùng thông thường (10-30 truy vấn/ngày) | Tốt hơn | Truy vấn đơn giản gần như không ảnh hưởng đến ngân sách tính toán. Không bao giờ chạm giới hạn. |
| Người dùng chat nhiều (100+ tin nhắn/ngày) | Gần như không đổi | Số lượng cao nhưng độ phức tạp mỗi truy vấn thấp nên cân bằng. |
| Người dùng nặng của Spark/agent | Có thể tệ hơn | Nhiệm vụ của agent tiêu tốn nhiều tính toán. Có thể chạm ngân sách nhanh hơn. |
| Người xử lý tài liệu/dữ liệu | Hỗn hợp | Phân tích tài liệu lớn tốn kém. Tuy nhiên không còn tình trạng “1 tài liệu = 1 tin nhắn” gây lãng phí. |
| Người sáng tạo video (Omni) | Có thể tệ hơn | Tạo video tiêu tốn cực nhiều tính toán. |
Nhà cung cấp khác có làm theo không?
Gần như chắc chắn. Claude đã sử dụng định giá theo token cho truy cập API — định giá dựa trên mức độ tính toán là phiên bản tương đương cho gói đăng ký. Giới hạn tin nhắn của ChatGPT vẫn là vấn đề người dùng thường xuyên phàn nàn. Cả Anthropic và OpenAI đều có dữ liệu hạ tầng để triển khai định giá dựa trên mức độ tính toán; Google chỉ là nhà cung cấp đầu tiên công bố chuyển đổi này cho gói đăng ký người dùng cá nhân.
Hãy kỳ vọng Claude và ChatGPT sẽ chuyển sang mô hình tương tự trong vòng 12-18 tháng. Hướng đi đã rõ ràng: giới hạn tin nhắn cố định là công cụ thô sơ. Định giá dựa trên mức độ tính toán công bằng hơn, linh hoạt hơn và phù hợp hơn với giá trị sử dụng thực tế.
Cách tối ưu hóa khi sử dụng định giá dựa trên mức độ tính toán
Viết prompt cụ thể. Prompt mơ hồ → phải hỏi đi hỏi lại → lãng phí tính toán cho việc làm rõ. Prompt cụ thể → nhận được câu trả lời ngay lần đầu → sử dụng tính toán hiệu quả. Prompt Optimizer giúp tái cấu trúc bất kỳ prompt nào để đạt độ chính xác, từ đó giảm trực tiếp mức độ tính toán tiêu tốn.
Sử dụng đúng mô hình cho từng nhiệm vụ. Không nên dùng mô hình cao cấp cho những câu hỏi đơn giản. Khi Gemini cho phép bạn chọn giữa Flash (nhanh/rẻ) và Pro (chậm/đầy đủ tính năng), hãy chuyển các truy vấn đơn giản sang Flash và tiết kiệm tài nguyên Pro cho công việc phức tạp.
Tránh ngữ cảnh không cần thiết. Tải lên tài liệu 100 trang khi bạn chỉ cần 5 trang là lãng phí tính toán. Chỉ chọn những trang liên quan. Nguyên tắc từ bài viết context windows của chúng tôi càng đúng khi kích thước ngữ cảnh ảnh hưởng trực tiếp đến chi phí.
---📬 Bạn muốn đọc thêm nội dung tương tự? Chúng tôi giúp bạn tận dụng tối đa giá trị từ mỗi đồng chi tiêu cho AI. Đăng ký miễn phí →
---Câu hỏi thường gặp
Tôi có phải trả nhiều tiền hơn khi chuyển sang định giá dựa trên mức độ tính toán không?
Hầu hết người dùng sẽ trả cùng mức hoặc ít hơn. Nếu bạn đang lãng phí tin nhắn cho các truy vấn đơn giản vốn có cùng giới hạn với các nhiệm vụ phức tạp, định giá dựa trên mức độ tính toán sẽ hiệu quả hơn. Nếu bạn là người dùng nặng của agent/tài liệu, bạn có thể cần nâng cấp gói.
Tôi có thể vẫn sử dụng Gemini miễn phí không?
Có — gói miễn phí vẫn tiếp tục. Định giá dựa trên mức độ tính toán chủ yếu áp dụng cho các gói trả phí, nơi nó thay thế giới hạn tin nhắn hàng ngày. Người dùng gói miễn phí sẽ có ngân sách tính toán giới hạn thay vì số lượng tin nhắn.
Tôi làm thế nào để theo dõi mức độ sử dụng tính toán của mình?
Google chưa công bố chi tiết giao diện theo dõi. Hãy kỳ vọng sẽ có bảng điều khiển sử dụng tính toán tương tự như cách các dịch vụ đám mây hiển thị mức tiêu tốn tài nguyên. Tính năng này có lẽ sẽ có trong phần cài đặt Gemini.
Mô hình này tốt hơn hay tệ hơn so với mô hình hiện tại của ChatGPT?
Tốt hơn về tính linh hoạt (không có giới hạn cứng hàng ngày). Có thể tệ hơn cho người dùng nặng, những người hiện đang được tin nhắn không giới hạn trong giới hạn của họ. Kết quả cuối cùng phụ thuộc vào cách sử dụng của bạn. Xem hướng dẫn kiểm tra gói đăng ký của chúng tôi để đánh giá chi phí AI giữa các nhà cung cấp.
Tôi làm thế nào để giảm thiểu mức độ tiêu tốn tính toán?
Ba chiến lược: viết prompt cụ thể (sử dụng Prompt Optimizer), dùng mô hình rẻ nhất có thể xử lý được nhiệm vụ, và tránh tải lên các tài liệu quá lớn không cần thiết. Khung ICCSSE giúp tạo kết quả chất lượng ngay từ lần đầu, loại bỏ chi phí cho các lượt hỏi lại.
Tuyên bố: Một số liên kết trong bài viết này là liên kết tiếp thị. Chúng tôi chỉ giới thiệu những công cụ mà chúng tôi đã tự kiểm tra và sử dụng thường xuyên. Xem chính sách tiết lộ đầy đủ của chúng tôi.