
Mac mini của Apple luôn là chiếc máy tính để bàn thầm lặng, dễ bị lãng quên ở phía sau Cửa hàng Apple. Thực dụng, giá rẻ theo tiêu chuẩn của Apple và phần lớn bị cộng đồng AI bỏ qua. Cho đến khi OpenClaw xuất hiện.
Vào thứ Năm, Tim Cook đã nói với các nhà phân tích rằng Mac mini và Mac Studio đã hết hàng—và có thể vẫn như vậy trong vài tháng tới. Ông nói trong cuộc họp báo cáo thu nhập quý 2 năm 2026 của Apple: "Cả hai đều là những nền tảng tuyệt vời cho AI và các công cụ tác nhân, và sự công nhận của khách hàng đang diễn ra nhanh hơn những gì chúng tôi dự đoán."
Nói cách khác: Apple đã tính toán sai mức độ khao khát của các nhà phát triển đối với những cỗ máy này, đặc biệt trong thời điểm khan hiếm đang làm nhiễu loạn thị trường.
Doanh thu Mac đạt 8,4 tỷ USD trong quý, tăng 6% so với cùng kỳ năm trước. Không hẳn là một sự bùng nổ—nhưng các hạn chế về nguồn cung, chứ không phải nhu cầu, là yếu tố giới hạn. Các cấu hình Mac mini và Mac Studio RAM cao không chỉ bị trì hoãn; một số thậm chí đã bị loại bỏ hoàn toàn khỏi Cửa hàng Apple.
Phiên bản Mac mini cơ bản giá 599 USD đã hết hàng tại Mỹ, không có sẵn để giao hàng hoặc nhận tại cửa hàng. Các cấu hình nâng cấp với 64GB RAM đang có thời gian chờ từ 16 đến 18 tuần. Các mẫu Mac Studio với 512GB bộ nhớ hợp nhất đã biến mất hoàn toàn khỏi cửa hàng. Những kẻ đầu cơ trên eBay đã nhanh chóng nắm bắt cơ hội, niêm yết các mẫu cơ bản với giá gần gấp đôi giá bán lẻ.
Chất xúc tác cho tất cả những điều này? OpenClaw và sự bùng nổ của AI tác nhân "ngốn" bộ nhớ.
Khung tác nhân AI mã nguồn mở—được xây dựng bởi Peter Steinberger và hiện được OpenAI hậu thuẫn sau cuộc chiến đấu thầu với Meta—đã bùng nổ với hơn 323.000 lượt gắn sao trên GitHub và trở thành cách nhanh nhất để các cá nhân và nhóm nhỏ chạy các tác nhân AI bền vững cục bộ. Và phần cứng tham chiếu không chính thức để chạy nó gần như ngay lập tức trở thành Mac mini.
Tuy nhiên, đó không phải là kết quả của một chiến dịch tiếp thị.
Điều mà hầu hết mọi người đưa tin về tình trạng khan hiếm Mac đều bỏ qua là Apple đã không liên quan đến các tác vụ AI nghiêm túc trong nhiều năm. Trước khi điều kỳ diệu của AI Agents trở nên phổ biến, mọi người phàn nàn rằng việc chạy LLM, Stable Diffusion hoặc bất kỳ loại phần mềm AI gia đình nào khác đều cực kỳ chậm và gần như không thể sử dụng được. Một chiếc Mac M2 có hiệu suất tương đương với GPU từ năm 2019. Việc Apple từ chối áp dụng CUDA hoặc sử dụng Nvidia, thay vào đó thúc đẩy công nghệ MLX của riêng mình, đã khiến nó trở nên không liên quan đến AI giống như đối với chơi game.
Nvidia thống trị vì CUDA—khung lập trình GPU độc quyền của họ—là xương sống của việc huấn luyện và suy luận mô hình. Toàn bộ hệ sinh thái AI được xây dựng xung quanh nó. Apple không có gì tương đương. Không ai muốn một chiếc Mac để suy luận cục bộ.
Nhưng CUDA có một bí mật bẩn thỉu: giới hạn VRAM.
Ngay cả GPU Nvidia tiêu dùng tốt nhất, RTX 5090, cũng chỉ đạt tối đa 32GB VRAM. Đó là một giới hạn cứng. Một mô hình lớn hơn 32GB không thể chạy hết tốc độ trên card đó—nó sẽ tràn vào RAM hệ thống chậm hơn, bò qua bus PCIe và hiệu suất giảm mạnh. Để chạy một mô hình 70 tỷ tham số nghiêm túc trên phần cứng Nvidia, bạn cần nhiều GPU, một giá đỡ máy chủ, tiêu thụ điện năng lớn và hàng ngàn đô la.
Kiến trúc Bộ nhớ Hợp nhất (UMA) của Apple giải quyết vấn đề này theo cách mà CUDA không thể. Trên Apple Silicon, CPU, GPU và Neural Engine đều chia sẻ cùng một vùng RAM vật lý. Không có VRAM riêng biệt. Không có bus PCIe để băng qua. Một chiếc Mac mini với 64GB có thể tải một mô hình 70 tỷ tham số mà một chiếc RTX 5090 giá 1.800 USD đơn giản là không thể xử lý được.
Chip M4 Ultra—con chip cung cấp sức mạnh cho các cấu hình Mac Studio cao cấp—hỗ trợ tới 192GB bộ nhớ hợp nhất. Điều đó đủ để chạy các mô hình 100 tỷ tham số cục bộ trên một máy duy nhất. Không máy chủ. Không hóa đơn đám mây hàng tháng.
OpenClaw đã làm cho sự đánh đổi này trở nên rõ ràng. Bởi vì nó chạy các tác nhân cục bộ—kết nối với các tệp, ứng dụng, tin nhắn của bạn—người dùng cần những cỗ máy có thể xử lý khối lượng suy luận mà không cần thuê tài nguyên điện toán từ đám mây. Một chiếc Mac mini với 32GB bộ nhớ hợp nhất có thể chạy thoải mái các mô hình 30 tỷ tham số. Một chiếc Mac Studio với 128GB xử lý các mô hình mà hầu hết các nhà phát triển không thể chạm tới nếu không có cụm GPU cấp doanh nghiệp một năm trước.
Một chiếc Mac chậm nhưng có khả năng chạy một mô hình AI mạnh mẽ tốt hơn nhiều so với một chiếc card Nvidia mạnh mẽ nhưng không thể tải được mô hình đó.
Kết quả: các nhà phát triển bắt đầu mua Mac mini theo cách họ từng mua Raspberry Pi—nhiều đơn vị cùng lúc, coi chúng là cơ sở hạ tầng chứ không phải máy tính cá nhân. Chuỗi cung ứng của Apple chưa bao giờ được thiết kế cho kiểu mẫu này.
Cũng có một sự thiếu hụt bộ nhớ rộng lớn hơn làm trầm trọng thêm vấn đề. IDC dự kiến lượng PC xuất xưởng toàn cầu sẽ giảm 11,3% vào năm 2026, một phần do thiếu hụt chip nhớ do nhu cầu máy chủ AI thúc đẩy. Apple hiện đang cạnh tranh nguồn cung RAM tương tự với các nhà cung cấp dịch vụ đám mây lớn đang xây dựng trung tâm dữ liệu.
Cook cho biết có thể mất "vài tháng" để đưa cung và cầu trở lại cân bằng đối với Mac mini và Studio. Một đợt làm mới chip M5 được dự kiến vào cuối năm 2026, điều này có thể giảm bớt áp lực—nhưng những người mua hiện tại đang phải chờ đợi hoặc trả giá cắt cổ.
Mac mini đã tạo ra sự cấp bách lớn hơn vào năm 2026 so với bất kỳ thời điểm nào trong lịch sử 20 năm của nó—và tất cả những gì nó cần chỉ là một chút trợ giúp từ một dự án mã nguồn mở mà Apple hoàn toàn không liên quan để biến điều đó thành hiện thực.