Siêu máy tính mạnh nhất thế giới Frontier ngày nào cũng bị lỗi, nghi là do GPU AMD Instinct
Siêu máy tính Frontier sử dụng đến 60 triệu linh kiện, và không có ngày nào là nó hoạt động trơn tru cả.
Siêu máy tính Frontier của Oak Ridge National Laboratory hiện đang là siêu máy tính mạnh nhất thế giới, nhưng ngặt nỗi ngày nào nó cũng bị vài lỗi phần cứng các bạn ạ.
Frontier là hệ thống đầu tiên trong ngành được thiết kế để mang lại hiệu năng tính toán lên đến 1,685 FP64 ExaFLOPS. Nó được trang bị các CPU AMD EPYC Trento 64 nhân, GPU AMD Instinct MI250X, các liên kết (interconnection) Slingshot của HPE, và ngốn tới 21 MW điện. HPE đã lắp đặt hệ thống này và sử dụng kiến trúc Cray EX vốn chủ yếu dành cho các siêu máy tính cực nhanh.
Trên lý thuyết, đúng là Frontier xịn sò thật đó, và phần cứng mà nó được trang bị cũng mang lại hiệu quả như mong đợi; nhưng nó lại liên tục gặp vấn đề về phần cứng, khiến các nhà nghiên cứu khó thể nào khai thác được toàn bộ hiệu năng của Frontier. Đại diện của Oak Ridge Leadership Computing Facility có chia sẻ trong một buổi phỏng vấn với InsideHPC rằng siêu máy tính quy mô cỡ này hiển nhiên sẽ gặp lỗi, nhưng thời gian trung bình giữa 2 lần lỗi sẽ tính bằng giờ, chứ không có tính theo ngày nữa.
Có tin đồn cho rằng Frontier gặp lỗi với liên kết Slingshot, tin khác thì nói rằng GPU AMD Instinct MI250X năm nay hoạt động không đáng tin cậy như kỳ vọng. Đại diện của Oak Ridge Leadership Computing Facility không xác nhận là lỗi do Instinct hay Slingshot; ông chỉ nhấn mạnh là Frontier gặp nhiều lỗi phần cứng mà thôi.
Frontier hiện vẫn chưa chính thức đi vào hoạt động, và đến đầu năm 2023 thì nó mới bắt đầu mở cửa cho các nhà khoa học sử dụng. Chúng ta cùng chờ xem liệu nó có hoạt động ngon lành đúng lịch trình không nhé.
Tóm tắt ý chính:
- Frontier là siêu máy tính mạnh nhất thế giới, nhưng ngày nào nó cũng bị vài lỗi phần cứng
- Frontier là hệ thống đầu tiên được thiết kế để mang lại hiệu năng tính toán lên đến 1,685 FP64 ExaFLOPS
- Nó được trang bị CPU AMD EPYC Trento 64 nhân, GPU AMD Instinct MI250X, liên kết Slingshot của HPE, và ngốn tới 21 MW
- Được biết, thời gian trung bình giữa 2 lần lỗi của Frontier sẽ tính bằng giờ, chứ không tính theo ngày nữa
- Frontier sẽ bắt đầu mở cửa cho các nhà khoa học sử dụng vào đầu năm 2023
Mời các bạn tham khảo thêm một số thông tin liên quan tại GVN 360 như:
- Siêu máy tính Frontier trang bị chip AMD phá vỡ giới hạn Exascale, trở thành siêu máy tính mạnh nhất thế giới
- Cách để biết siêu máy tính mạnh đến đâu là cho nó xử lý vụ nổ siêu tân tinh cách Trái đất 13.000 năm ánh sáng
Nguồn: tom’s HARDWARE