Phát hiện Trung Quốc “gian lận” khi công bố sức mạnh của loạt siêu máy tính
Siêu máy tính Trung Quốc bị phát hiện “ăn gian” kết quả benchmark hiệu năng.
Gần đây, siêu máy tính Trung Quốc thu hút nhiều sự chú ý từ cộng đồng phần cứng và HPC (high-performance computing) sau khi chính phủ Mỹ áp đặt các lệnh cấm. Hồi tháng 10/2021, có ít nhất 2 siêu máy tính Trung Quốc phá vỡ được giới hạn “exascale”. Và tại hội nghị SuperComputing 21 (SC21), nhiều nguồn tin cho rằng Trung Quốc đang có thêm một siêu máy tính exascale nữa đang trong quá trình phát triển. Tuy nhiên, sự thật có vẻ như là không hào nhoáng như vậy các bạn ạ.
Trước tiên, cần nói rõ một điều rằng các chuyên gia về siêu máy tính, chẳng hạn như Top500.org, đo lường hiệu năng tính toán của siêu máy tính theo con số double-precision (64-bit) FLOPS (floating-point operations per second), hay còn gọi là FP64 FLOPS, bằng cách dùng benchmark LINPACK. Mặc dù các vi xử lý có thể thực hiện FLOPS với độ chính xác thấp (lower precision) nhanh hơn, chuẩn thường dùng để đo hiệu năng HPC là FP61 FLOPS trong LINPACK.
Vào tháng 10/2021, trang tom’s HARDWARE có nói về 2 hệ thống exascale của Trung Quốc, bao gồm Sunway Oceanlite và Tianhe-3, và cả 2 đều được thử nghiệm bằng benchmark LINPACK (nghĩa là kết quả tương ứng với FP64 FLOPS). Cả 2 siêu máy tính này đều không nộp kết quả lên Top500.org, nhưng có một vài người cho rằng họ làm vậy là để bảo vệ nhà cung cấp không bị chính phủ Mỹ ban hành lệnh cấm.
Tuy nhiên, các nhà nghiên cứu tại NRCPC (National Research Center of Parallel Computer Engineering and Technology) có nộp kết quả của Sunway Oceanlite cho Gordon Bell – một sự kiện trao giải cũng khá là lớn. Để đạt được cúp Gordon Bell, hệ thống đó phải mô phỏng mạch điện (circuit) của Sycamore 53-qubit (kiến trúc lượng tử của Google), và Sunway Oceanlite hoàn thành trong 304 giây. Trong khi đó, một đội từ Oak Ridge National Laboratory (ORNL) ước tính siêu máy tính Summit (hiệu năng 200 PFLOPS) sẽ phải tốn khoảng 10.000 năm để mô phỏng Sycamore. Sycamore thì hoàn thành tác vụ này trong 200 giây.
Sau khi tìm hiểu thì để đạt được kết quả ấn tượng như thế, các kỹ sư từ NRCPC đã giảm độ chính xác của mô phỏng, và điều này được xem là gian lận trong benchmark PC. Bản thân việc này đã đáng chê trách rồi, chúng ta còn biết thêm rằng Sunway Oceanlite đạt hiệu năng 1,2 FP32 EFLOPS trong thuật toán này.
Dĩ nhiên, chúng ta không thể đem so kết quả LINPACK với kết quả mô phỏng Sycamore được. Tuy nhiên, có một điều khá lạ là tại sao 1 hệ thống có thể đạt 1,05 FP64 EFLOPS trong bài benchmark LINPACK mà chỉ đạt 1,2 FP32 EFLOPS trong bài benchmark Sycamore. Vì sự khác biệt này nên nhiều người đặt nghi vấn về hiệu năng LINPACK của Sunway Oceanlite và Tianhe-3.
Trung Quốc có vẻ như rất muốn chứng tỏ hiệu năng của siêu máy tính của mình, cho nên NRCPC cũng không ngại chuyện gian lận trong bài benchmark mô phỏng lượng tử. Hiện tại, vi xử lý và bộ gia tốc (accelerator) của Trung Quốc có thể không nhanh bằng các đối thủ ở Mỹ. Họ có vài cách để cải thiện điều này, nhưng vấn đề ở đây là các nhà phát triển CPU Sunway và Phytium dành cho 2 siêu máy tính kia đều bị Mỹ cho vào danh sách đen (blacklist), khiến họ gặp rất nhiều khó khăn trong việc phát triển và sản xuất vi xử lý.
Tóm tắt ý chính:
- Siêu máy tính Sunway Oceanlite của Trung Quốc hoàn thành bài test mô phỏng mạch điện của Sycamore 53-qubit trong 304 giây
- Trong khi đó, Oak Ridge National Laboratory (Mỹ) ước tính siêu máy tính Summit (hiệu năng 200 PFLOPS) sẽ phải tốn khoảng 10.000 năm để mô phỏng Sycamore
- Để đạt được kết quả ấn tượng như thế, các kỹ sư Trung Quốc đã giảm độ chính xác của mô phỏng khi chạy trên Sunway Oceanlite
- Điều này được xem là gian lận trong benchmark PC
Mời các bạn tham khảo thêm một số thông tin liên quan tại GVN 360 như:
- Trung Quốc ra mắt card gaming Fenghua No.1 để đấu với AMD và Nvidia
- Nhà Trắng cản trở kế hoạch tăng gia sản xuất chip ở Trung Quốc của Intel
- Mỹ vừa đưa lệnh cấm, 4 giám đốc lập tức tháo chạy khỏi hãng gia công lớn nhất Trung Quốc
Nguồn: tom’s HARDWARE