Hướng dẫn Giá OpenAI API 2026 — GPT-5, GPT-4o, o3 | APIMaster.ai

Phân tích chi tiết giá OpenAI API cho GPT-5, GPT-4o, o3 và o4-mini. So sánh giá chính thức với chiết khấu APIMaster.ai và tính toán chi phí thực tế của bạn.

Hướng dẫn Giá OpenAI API 2026

Giá OpenAI API dựa trên mức sử dụng: bạn trả phí trên mỗi triệu token được xử lý. Hướng dẫn này bao gồm giá hiện tại cho tất cả các mô hình chính, ví dụ tính toán chi phí và cách giảm hóa đơn OpenAI API của bạn với APIMaster.ai.

Bảng Giá OpenAI API (Giá Chính Thức)

Mô hình	Đầu vào (trên 1M)	Đầu ra (trên 1M)	Đầu vào đã lưu cache
GPT-5.5	$5.00	$30.00	$0.50
GPT-5.4	$2.50	$15.00	$0.25
GPT-4o	$2.50	$10.00	$1.25
GPT-4o mini	$0.15	$0.60	$0.075
o3	$10.00	$40.00	$2.50
o4-mini	$1.10	$4.40	$0.275
GPT-4o Realtime	$5.00	$20.00	—

Giá từ OpenAI. Kiểm tra trang giá OpenAI để biết giá mới nhất.

Giá OpenAI API Đã Chiết Khấu qua APIMaster.ai

APIMaster cung cấp quyền truy cập tương thích với OpenAI đến các mô hình GPT được hỗ trợ với giá trực tiếp và xác minh dấu vân tay.

Truy cập chợ APIMaster để xem giá trực tiếp cho từng tầng mô hình.

Mức tiết kiệm thay đổi tùy theo mô hình và tầng. Kiểm tra giá trực tiếp trước khi ước tính chi phí sản xuất.

Cách Hoạt Động của Giá OpenAI API

Token là gì?

1 token ≈ 4 ký tự tiếng Anh:

Hello, world! = 4 token
Một bài luận 750 từ ≈ 1.000 token
Cuộc gọi API trung bình: ~500 token đầu vào + 300 token đầu ra

Token Đầu vào và Đầu ra

OpenAI tính phí riêng cho đầu vào (tin nhắn của bạn) và đầu ra (phản hồi). Token đầu ra thường đắt gấp 3–4 lần token đầu vào.

Ví dụ:

10.000 cuộc gọi API/ngày
Trung bình 800 token đầu vào + 400 token đầu ra mỗi cuộc gọi
Sử dụng hàng tháng: 240M token đầu vào + 120M token đầu ra
Chi phí GPT-4o: 240 × $2,50 + 120 × $10 = $600 + $1.200 = $1.800/tháng
GPT-4o qua APIMaster: thấp hơn đáng kể—xem chợ để biết giá hiện tại

Lưu Cache Prompt

Tính năng lưu cache prompt của OpenAI giảm 75% chi phí cho ngữ cảnh lặp lại (prompt hệ thống, tài liệu dài). Token đầu vào được lưu cache được tính phí 25% của giá đầu vào tiêu chuẩn.

APIMaster truyền qua giá lưu cache ở nơi được hỗ trợ.

Chiến Lược Tối Ưu Chi Phí

1. Chọn Mô Hình Phù Hợp

Đừng sử dụng mô hình tiên tiến nếu GPT-4o mini đáp ứng được:

Nhiệm vụ	Mô hình Được Khuyến Nghị	Chi phí Xấp xỉ so với GPT-5
Phân loại, trích xuất	gpt-4o-mini	rẻ hơn nhiều
Hỗ trợ khách hàng, Hỏi đáp	gpt-4o	chi phí thấp hơn
Phân tích phức tạp, nghiên cứu	gpt-5.5 hoặc o3	cơ bản
Toán/khoa học thời gian thực	o3 hoặc o4-mini	phụ thuộc

2. Sử Dụng Lưu Cache Prompt

Đặt nội dung tĩnh (hướng dẫn, tài liệu tham khảo) ở đầu prompt để tối đa hóa lượt cache:

# The long system prompt is cached after the first call
response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[
        {"role": "system", "content": LONG_SYSTEM_PROMPT},  # cached
        {"role": "user", "content": user_message},            # not cached
    ],
)

3. Cắt Ngắn Ngữ Cảnh Dài

Mức sử dụng token tăng tuyến tính với độ dài ngữ cảnh. Tóm tắt hoặc cắt bớt lịch sử hội thoại cho các phiên dài:

def trim_history(messages, max_tokens=4000):
    # Keep system prompt + last N messages
    if len(messages) > 10:
        return [messages[0]] + messages[-9:]
    return messages

4. Yêu Cầu Hàng Loạt

Đối với các tác vụ không thời gian thực, Batch API của OpenAI cung cấp giảm 50% so với giá tiêu chuẩn với thời gian xử lý 24 giờ. APIMaster hỗ trợ các quy trình làm việc tương thích với batch.

Máy Tính Chi Phí OpenAI API

Công thức nhanh:

cost = (input_tokens / 1_000_000 × input_price) 
     + (output_tokens / 1_000_000 × output_price)

Trình ước tính chi phí Python:

def estimate_cost(input_tokens, output_tokens, model="gpt-5.4"):
    prices = {
        "gpt-5.4":     (2.50, 15.00),
        "gpt-4o":      (2.50, 10.00),
        "gpt-4o-mini": (0.15, 0.60),
        "o3":         (10.00, 40.00),
    }
    inp, out = prices.get(model, (2.50, 10.00))
    return (input_tokens / 1e6 * inp) + (output_tokens / 1e6 * out)

print(f"${estimate_cost(1_000_000, 500_000, 'gpt-4o'):.2f}")

Giảm Hóa Đơn OpenAI API Của Bạn

APIMaster.ai cung cấp các mô hình GPT được hỗ trợ với:

Xác minh dấu vân tay
Nhiều phương thức thanh toán
Bảng điều khiển giá theo thời gian thực

Câu Hỏi Thường Gặp

Giá OpenAI API là bao nhiêu? GPT-5.4 có giá $2,50/M đầu vào và $15/M đầu ra. GPT-4o có giá $2,50/M đầu vào và $10/M đầu ra. GPT-4o mini có giá $0,15/$0,60. o3 có giá $10/$40. Xem bảng đầy đủ ở trên cho tất cả các mô hình.

Mô hình OpenAI nào rẻ nhất? GPT-4o mini với $0,15/M đầu vào, $0,60/M đầu ra—tốt nhất cho các tác vụ khối lượng lớn, độ phức tạp thấp như phân loại và tóm tắt.

Làm thế nào để giảm hóa đơn OpenAI API của tôi? Sử dụng GPT-4o mini cho các tác vụ đơn giản, bật lưu cache prompt cho các prompt hệ thống lặp lại, đặt giới hạn max_tokens và sử dụng chế độ batch cho các công việc không thời gian thực (giảm 50%).

Giá OpenAI API so với Claude và DeepSeek như thế nào? GPT-4o và Claude Sonnet có giá tương tự. DeepSeek V4 Flash có thể là lựa chọn chi phí thấp hơn cho code; so sánh bằng giá trực tiếp trên chợ APIMaster.

Tôi có thể sử dụng OpenAI API qua APIMaster với giá thấp hơn không? Có—APIMaster cung cấp giá chiết khấu trên một số mô hình OpenAI chọn lọc. Nạp tiền từ $1 bằng epay, PayPal, thẻ tín dụng hoặc USDT.

Xem giá OpenAI API — Claude & DeepSeek trong một key →