GPT-5.6 Sol, Terra & Luna Preview — Định giá, Cấp độ và Điều Nhà phát triển Cần Biết
OpenAI đã xem trước GPT-5.6 vào ngày 26 tháng 6 năm 2026 với ba cấp độ — Sol (flagship), Terra (cân bằng) và Luna (nhanh). Định giá API chính thức, quy tắc bộ nhớ đệm, điểm chuẩn, triển khai an toàn và cách chuẩn bị stack của bạn.
Published 2026-06-27
Vào ngày 26 tháng 6 năm 2026, OpenAI (~500M lượt truy cập hàng tháng, ước tính SimilarWeb) đã bắt đầu xem trước có giới hạn cho dòng GPT-5.6: Sol (mô hình tác tử flagship), Terra (công việc hàng ngày cân bằng) và Luna (nhanh, chi phí thấp nhất). Định giá danh sách API chính thức là $5 / $30, $2.50 / $15 và $1 / $6 trên 1M token đầu vào/đầu ra, với giảm giá 90% cho đầu vào được lưu trong bộ nhớ đệm và các quy tắc bộ nhớ đệm lời nhắc 30 phút mới. Sol bổ sung nỗ lực suy luận max và chế độ ultra đa tác tử phụ. Quyền truy cập ban đầu bị giới hạn cho các đối tác API/Codex đáng tin cậy trước khi có sẵn rộng rãi trên ChatGPT và API trong những tuần tới.
Nếu bạn cần quyền truy cập tương thích với OpenAI ngay hôm nay trong khi các suất xem trước còn hạn chế, hãy so sánh các route trực tiếp trên thị trường APIMaster và xác minh những gì bạn thực sự nhận được bằng công cụ kiểm tra mô hình miễn phí.
OpenAI đã công bố những gì
OpenAI đang giới thiệu một sơ đồ đặt tên mới với GPT-5.6:
- Số (5.6) đánh dấu thế hệ.
- Sol, Terra và Luna là các cấp độ khả năng bền vững có thể phát triển theo nhịp phát hành riêng của chúng.
Trong quá trình xem trước, cả ba mô hình đều nhắm đến các điểm chi phí/độ trễ khác nhau trên cùng một thế hệ:
| Cấp độ | Định vị | Đầu vào (trên 1M token) | Đầu vào được lưu trong bộ nhớ đệm | Đầu ra (trên 1M token) |
|---|---|---|---|---|
| Sol | Flagship cho công việc tác tử đầy tham vọng | $5.00 | $0.50 | $30.00 |
| Terra | Mô hình cân bằng cho công việc hàng ngày | $2.50 | $0.25 | $15.00 |
| Luna | Công việc khối lượng lớn nhanh, giá cả phải chăng | $1.00 | $0.10 | $6.00 |

OpenAI tuyên bố rằng Terra ngang bằng hiệu suất GPT-5.5 với chi phí chỉ bằng một nửa, trong khi Luna mang lại khả năng mạnh mẽ ở mức giá thấp nhất trong dòng.
Sol: Các khả năng Flagship mà nhà phát triển quan tâm
GPT-5.6 Sol được định vị là mô hình mạnh nhất của OpenAI cho đến nay cho các quy trình làm việc dài hạn, sử dụng công cụ.
Điểm nổi bật từ thông báo:
- Terminal-Bench 2.1 — trạng thái nghệ thuật mới cho các tác vụ tác tử dòng lệnh (lập kế hoạch, lặp lại, phối hợp đa công cụ).
- GeneBench v1 — cải thiện phân tích sinh học/genomics so với GPT-5.5 với ít token hơn.
- An ninh mạng — cạnh tranh trên ExploitBench² và ExploitGym³ với hiệu quả mạnh mẽ; OpenAI nhấn mạnh các trường hợp sử dụng phòng thủ (vá lỗi, đánh giá, giáo dục) hơn là tự động hóa tấn công.
- Nỗ lực suy luận
max— cho Sol nhiều thời gian hơn để suy luận sâu về các vấn đề khó. - Chế độ
ultra— phối hợp các tác tử phụ cho công việc phức tạp vượt quá một vòng lặp tác tử đơn lẻ.
Đối với các stack mã hóa sản xuất (Codex, Cursor, tác tử tùy chỉnh), Sol là cấp độ cần theo dõi khi nút thắt cổ chai của bạn là chất lượng và độ tin cậy đa bước, không phải token thô trên giây.
Terra và Luna: Khi nào nên chọn cấp độ nào
Sử dụng khung quyết định này:
| Nếu khối lượng công việc của bạn là… | Bắt đầu với… | Tại sao |
|---|---|---|
| Tái cấu trúc đa tệp, chạy tác tử dài, nghiên cứu bảo mật, suy luận sâu | Sol | Trần khả năng cao nhất; chế độ max / ultra mới |
| Trò chuyện hàng ngày, RAG, viết mã vừa phải, hầu hết các tính năng SaaS | Terra | ~Lớp GPT-5.5 với giá chính thức thấp hơn 2× so với Sol |
| Phân loại, trích xuất, trò chuyện QPS cao, tóm tắt hàng loạt | Luna | $/token thấp nhất; tốt nhất cho khối lượng |
Nguyên tắc chung: Luna cho thông lượng, Terra cho sản xuất mặc định, Sol cho các tác vụ tác tử khó nơi chi phí thất bại vượt quá chi phí token.
Chi tiết định giá thay đổi hóa đơn của bạn
Ngoài tỷ lệ $/1M nổi bật, GPT-5.6 giới thiệu bộ nhớ đệm lời nhắc dễ dự đoán hơn:
- Điểm ngắt bộ nhớ đệm rõ ràng trong API.
- Thời gian tồn tại tối thiểu của bộ nhớ đệm: 30 phút trên GPT-5.6 và các mô hình sau này.
- Ghi bộ nhớ đệm được tính phí ở mức 1.25× tỷ lệ đầu vào không được lưu trong bộ nhớ đệm.
- Đọc bộ nhớ đệm giữ mức giảm giá 90% quen thuộc trên đầu vào được lưu trong bộ nhớ đệm.
Đối với các vòng lặp tác tử sử dụng lại lời nhắc hệ thống, lược đồ công cụ hoặc tiền tố ngữ cảnh dài, Terra và Luna có thể trông rẻ hơn nhiều trong thực tế so với định giá đầu vào nổi bật — nhưng chỉ khi tích hợp của bạn thực sự chạm vào bộ nhớ đệm.
Ví dụ: trên Sol, đầu vào không được lưu trong bộ nhớ đệm là $5/M; đầu vào được lưu trong bộ nhớ đệm là $0.50/M — giảm 10× trên các token tiền tố lặp lại.
Quyền truy cập xem trước: "Có giới hạn" có nghĩa là gì hôm nay
OpenAI không mở GPT-5.6 cho tất cả mọi người ngay từ ngày đầu tiên.
Các ràng buộc xem trước hiện tại (như đã nêu trong thông báo):
- Quyền truy cập ban đầu thông qua API và Codex cho một nhóm đối tác đáng tin cậy được chọn.
- Phối hợp với chính phủ Hoa Kỳ về việc triển khai theo giai đoạn gắn liền với các biện pháp bảo vệ khả năng mạng.
- Khả dụng rộng rãi hơn trong ChatGPT, Codex và API dự kiến trong những tuần tới.
- Triển khai Cerebras của Sol với tốc độ lên tới 750 token/giây nhắm mục tiêu vào tháng 7 năm 2026, bắt đầu với các khách hàng có giới hạn.
OpenAI nói rõ rằng họ không muốn sự kiểm soát vĩnh viễn của chính phủ đối với các bản phát hành — bản xem trước được đóng khung như một bước ngắn hạn trong khi các khuôn khổ EO về mạng đang trưởng thành.
Hàm ý thực tế cho nhà phát triển: nếu lộ trình sản phẩm của bạn giả định GPT-5.6 Sol trong tuần này, hãy lên kế hoạch dự phòng sang các route GPT-5.5 / Terra-class cho đến khi nhà cung cấp của bạn xác nhận quyền truy cập xem trước.
Ngăn xếp an toàn: Tại sao bạn có thể thấy từ chối hoặc chậm trễ
GPT-5.6 đi kèm với ngăn xếp an toàn nhiều lớp nhất của OpenAI cho đến nay, đặc biệt là xung quanh các yêu cầu sử dụng kép về mạng và sinh học.
Mong đợi trong quá trình xem trước:
- Từ chối cứng đối với hỗ trợ mạng bị cấm, bao gồm các nỗ lực jailbreak.
- Tạo bị tạm dừng khi các bộ phân loại gắn cờ đầu ra rủi ro cao để xem xét thứ cấp.
- Xem xét cấp tài khoản khi các mẫu trông giống như lạm dụng dai dẳng so với công việc bảo mật hợp pháp.
- Đôi khi dương tính giả trên việc đánh giá mã hợp pháp, chuẩn bị CTF hoặc thử nghiệm phòng thủ.
OpenAI báo cáo 700k+ giờ GPU tương đương A100 của red-teaming tự động cộng với thử nghiệm chuyên gia con người đang diễn ra. Đối với người mua doanh nghiệp, họ đề cập đến phát hiện bảo vệ quyền riêng tư trong tương lai và các kiểm soát an toàn do khách hàng vận hành.
Nếu bạn vận hành một cổng AI hoặc bán lại quyền truy cập mô hình, hãy tính đến độ trễ đuôi cao hơn và các khối không xác định vào SLA trong cửa sổ xem trước.
GPT-5.6 so với GPT-5.5: Điều gì thực sự đã thay đổi
| Khía cạnh | GPT-5.5 (thế hệ trước) | Dòng GPT-5.6 |
|---|---|---|
| Đặt tên cấp độ | Nhãn thế hệ đơn | Các cấp độ Sol / Terra / Luna trong 5.6 |
| Cấu trúc chi phí | Định giá danh sách trước | Terra ~một nửa Sol; Luna thấp nhất |
| Chế độ tác tử | Nỗ lực suy luận tiêu chuẩn | Sol thêm max + tác tử phụ ultra |
| Bộ nhớ đệm | Hành vi trước | Bộ nhớ đệm tối thiểu 30 phút, điểm ngắt rõ ràng, phí bảo hiểm ghi 1.25× |
| Đánh giá mạng | Mạnh | Sol/Terra/Luna đều cải thiện; Sol có khả năng nhất |
| Phát hành | Đường dẫn GA | Xem trước theo giai đoạn với các biện pháp bảo vệ mạnh hơn |
Làm thế nào để mua GPT-5.6?
Bản xem trước của OpenAI là chỉ dành cho khách mời đối với nhiều nhà phát triển. Trên APIMaster.ai, bạn có thể mua quyền truy cập API tương thích với OpenAI theo cùng cách bạn đã sử dụng GPT-5.5 — trả tiền khi bạn sử dụng từ $1, không cần đăng ký, tương thích với OpenAI SDK.
Hướng dẫn từng bước
- Đăng ký — tài khoản miễn phí, email hoặc OAuth.
- Nạp tiền từ $1 — ví trong bảng điều khiển; hỗ trợ PayPal, thẻ và các phương thức khác được liệt kê khi thanh toán (thường dễ dàng hơn so với việc liên kết thẻ trực tiếp trên platform.openai.com).
- Mở thị trường — tìm kiếm GPT-5.6, Sol, Terra hoặc Luna khi các route hoạt động. So sánh giá $/1M token trực tiếp giữa các kênh (thường thấp hơn giá chính thức trong quá trình triển khai).
- Tạo khóa API trong bảng điều khiển → sao chép một lần.
- Trỏ SDK của bạn vào URL cơ sở của APIMaster và slug mô hình được hiển thị trên thẻ thị trường:
from openai import OpenAI
client = OpenAI(
api_key="YOUR_APIMASTER_KEY",
base_url="https://apimaster.ai/v1",
)
resp = client.chat.completions.create(
model="gpt-5.6-terra", # sử dụng slug chính xác từ thị trường khi được liệt kê
messages=[{"role": "user", "content": "Trả lời chính xác: ok"}],
max_tokens=16,
)
print(resp.choices[0].message.content)
- Xác minh trước khi mở rộng quy mô — chạy cùng một khóa thông qua công cụ kiểm tra dấu vân tay mô hình miễn phí. Trong thời gian khan hiếm xem trước, một số relay âm thầm hạ cấp cấp độ mô hình; tính năng phát hiện của APIMaster giúp bạn xác nhận rằng bạn đang nhận được những gì bạn đã trả tiền.
Chọn cấp độ trên APIMaster: sử dụng các route Luna cho các cuộc gọi khối lượng lớn/rủi ro thấp, Terra làm mô hình sản xuất mặc định của bạn và Sol khi chất lượng tác tử quan trọng hơn $/token.
Chưa được liệt kê? Hãy nạp tiền ngay — các kênh Sol/Terra/Luna được thêm vào thị trường khi các đối tác thượng nguồn kích hoạt chúng; số dư ví tự động được chuyển tiếp.
Theo dõi APIMaster để cập nhật ra mắt GPT-5.6
GPT-5.6 đang được triển khai theo từng giai đoạn. Cách nhanh nhất để biết khi nào Sol / Terra / Luna có mặt trên thị trường — và ở mức giá nào — là theo dõi các kênh của APIMaster:
- Nhóm Telegram — cảnh báo ra mắt mô hình, thay đổi giá và hỗ trợ (t.me/apimasterai, ~kênh cộng đồng)
- Trang liên hệ / cộng đồng — mã QR Telegram và biểu mẫu phản hồi
- Blog — phân tích chuyên sâu như bài này khi các mô hình lớn được phát hành
- Nhật ký thay đổi — cập nhật sản phẩm và định tuyến
Khi OpenAI mở rộng quyền truy cập xem trước, chúng tôi đăng các kênh APIMaster nào vượt qua xác minh dấu vân tay để bạn có thể chuyển đổi base_url mà không cần viết lại ứng dụng của mình.
Tạo tài khoản của bạn → · Duyệt thị trường → · Tham gia Telegram →
Câu hỏi thường gặp
GPT-5.6 Sol, Terra và Luna là gì? Chúng là ba cấp độ khả năng trong thế hệ GPT-5.6 của OpenAI: Sol là mô hình tác tử flagship, Terra là cấp độ hàng ngày cân bằng (~lớp GPT-5.5 với chi phí thấp hơn) và Luna là cấp độ nhanh, chi phí thấp nhất cho công việc khối lượng lớn.
GPT-5.6 có giá bao nhiêu trên API chính thức? Định giá danh sách trên 1M token là Sol $5 đầu vào / $30 đầu ra, Terra $2.50 / $15, Luna $1 / $6, với đầu vào được lưu trong bộ nhớ đệm ở mức 10% giá đầu vào không được lưu trong bộ nhớ đệm (giảm giá 90%). Ghi bộ nhớ đệm có giá 1.25× đầu vào không được lưu trong bộ nhớ đệm; các mục nhập bộ nhớ đệm tồn tại ít nhất 30 phút.
GPT-5.6 Sol có sẵn cho tất cả mọi người hôm nay không? Không. OpenAI đã bắt đầu với bản xem trước có giới hạn cho các đối tác API/Codex đáng tin cậy vào tháng 6 năm 2026 và có kế hoạch khả dụng rộng rãi hơn trong những tuần tới. Kiểm tra tổ chức OpenAI hoặc bảng điều khiển nhà cung cấp của bạn để biết kích hoạt.
Chế độ ultra của GPT-5.6 Sol là gì?
ultra vượt ra ngoài một tác tử đơn lẻ bằng cách điều phối các tác tử phụ để tăng tốc các tác vụ phức tạp. Nó nhắm đến các khối lượng công việc nơi khám phá song song đánh bại một chuỗi tuần tự dài.
GPT-5.6 so với GPT-5.5 cho nhà phát triển như thế nào? Terra được định vị là cạnh tranh với GPT-5.5 với chi phí chính thức chỉ bằng một nửa. Sol vượt trội hơn GPT-5.5 trên các điểm chuẩn tác tử, sinh học và mạng mà OpenAI đã công bố. Luna đánh đổi khả năng đỉnh cao để lấy $/token thấp nhất.
Các cổng API của bên thứ ba sẽ có GPT-5.6 ngay từ ngày đầu tiên? Thường là không đồng nhất. Sự khan hiếm xem trước và kích hoạt cụ thể của nhà cung cấp có nghĩa là các cổng tổng hợp có thể triển khai Sol/Terra/Luna vào những thời điểm khác nhau. Luôn xác minh mô hình thực tế bằng dấu vân tay hành vi, không chỉ chuỗi mô hình trong yêu cầu.
Tôi có thể đọc nguồn chính ở đâu? Thông báo của OpenAI: Xem trước GPT-5.6 Sol (ngày 26 tháng 6 năm 2026). Thẻ hệ thống và các đánh giá mở rộng được hứa hẹn khi phát hành rộng rãi.