Generative AI sẽ rơi vào trạng thái “MAD” khi được huấn luyện bằng dữ liệu AI quá 5 lần

Generative AI sẽ rơi vào trạng thái “MAD” khi được huấn luyện bằng dữ liệu AI quá 5 lần

 Balo Asus Office

Balo Asus Office

290.000₫
190.000₫ -34%
0.0 (0 đánh giá)
Vừa mở bán
GEARVN - Bàn phím AKKO 5108B Plus Hatsune Miku Akko Piano Pro Switch

Bàn phím AKKO 5108B Plus Hatsune Miku Akko Piano Pro Switch

2.490.000₫
0.0 (0 đánh giá)
Vừa mở bán
 Bàn phím AKKO YU01 Antique Jade V3 Piano Pro switch

Bàn phím AKKO YU01 Antique Jade V3 Piano Pro switch

3.390.000₫
2.850.000₫ -16%
0.0 (0 đánh giá)
Vừa mở bán
 Bàn phím AULA F68 TM (Hồng/ Ice Crystal switch ) F68P

Bàn phím AULA F68 TM (Hồng/ Ice Crystal switch ) F68P

2.890.000₫
2.490.000₫ -14%
0.0 (0 đánh giá)
Vừa mở bán
GEARVN - Bàn phím AULA F81 TM (Đen/ Crystal switch) F8102

Bàn phím AULA F81 TM (Đen/ Crystal switch) F8102

2.590.000₫
2.090.000₫ -19%
0.0 (0 đánh giá)
Vừa mở bán
GEARVN - Bàn phím AULA F81 TM (Đen/ Ice Soul switch) F8105

Bàn phím AULA F81 TM (Đen/ Ice Soul switch) F8105

2.590.000₫
2.090.000₫ -19%
0.0 (0 đánh giá)
Vừa mở bán
GEARVN - Bàn phím AULA F81 TM (Hồng/ Crystal switch) F8103

Bàn phím AULA F81 TM (Hồng/ Crystal switch) F8103

2.590.000₫
2.090.000₫ -19%
0.0 (0 đánh giá)
Vừa mở bán
GEARVN - Bàn phím AULA F81 TM (Hồng/ Ice Soul switch) F8107

Bàn phím AULA F81 TM (Hồng/ Ice Soul switch) F8107

2.590.000₫
2.090.000₫ -19%
0.0 (0 đánh giá)
Vừa mở bán
GEARVN - Bàn phím AULA F81 TM (Tím/ Crystal switch) F8104

Bàn phím AULA F81 TM (Tím/ Crystal switch) F8104

2.590.000₫
2.090.000₫ -19%
0.0 (0 đánh giá)
Vừa mở bán
GEARVN - Bàn phím AULA F81 TM (Tím/ Ice Soul switch) F8108

Bàn phím AULA F81 TM (Tím/ Ice Soul switch) F8108

2.590.000₫
2.090.000₫ -19%
0.0 (0 đánh giá)
Vừa mở bán
GEARVN - Bàn phím AULA F81 TM (Trắng/ Ice Soul switch) F8106

Bàn phím AULA F81 TM (Trắng/ Ice Soul switch) F8106

2.590.000₫
2.090.000₫ -19%
0.0 (0 đánh giá)
Vừa mở bán
 Bàn phím AULA M75 TM (Xanh + Trắng + Tím/ Purple Fire V2 Switch) M7503

Bàn phím AULA M75 TM (Xanh + Trắng + Tím/ Purple Fire V2 Switch) M7503

2.090.000₫
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình LG 24G411A-B 24

Màn hình LG 24G411A-B 24" IPS 144Hz HDR10 Gsync chuyên game

2.990.000₫
2.650.000₫ -11%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình LG 27G610A-B 27

Màn hình LG 27G610A-B 27" IPS 2K 200Hz Gsync chuyên game

5.990.000₫
5.190.000₫ -13%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình ASUS TUF GAMING VG27AQ5A 27

Màn hình ASUS TUF GAMING VG27AQ5A 27" Fast IPS 2K 210Hz chuyên game

5.990.000₫
4.990.000₫ -17%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình Acer KG240Y-X1 24

Màn hình Acer KG240Y-X1 24" IPS 200Hz Gsync chuyên game

3.790.000₫
2.490.000₫ -34%
0.0 (0 đánh giá)
Đã bán: 1
 Màn hình Viewsonic VA2432A-H 24

Màn hình Viewsonic VA2432A-H 24" IPS 120Hz viền mỏng

3.590.000₫
2.050.000₫ -43%
0.0 (0 đánh giá)
Vừa mở bán
GEARVN - Màn hình Viewsonic VA2432-H-2 24" IPS 100Hz viền mỏng

Màn hình Viewsonic VA2432-H-2 24" IPS 100Hz viền mỏng

2.590.000₫
1.990.000₫ -23%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình ASUS ProArt PA248QFV 24

Màn hình ASUS ProArt PA248QFV 24" IPS 100Hz 16:10 chuyên đồ họa

5.990.000₫
5.290.000₫ -12%
0.0 (0 đánh giá)
Vừa mở bán
GEARVN - Màn hình ViewSonic VA2708-2K-MHD 27" IPS 2K 100Hz

Màn hình ViewSonic VA2708-2K-MHD 27" IPS 2K 100Hz

4.190.000₫
3.690.000₫ -12%
0.0 (0 đánh giá)
Đã bán: 7
 Màn hình ViewSonic VX2779A-HD-PRO 27

Màn hình ViewSonic VX2779A-HD-PRO 27" IPS 240Hz 1ms chuyên game

5.590.000₫
3.690.000₫ -34%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình AOC 24G50Z 24

Màn hình AOC 24G50Z 24" Fast IPS 260Hz chuyên game

3.490.000₫
2.790.000₫ -20%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình ViewSonic VX2758A-2K-PRO-4 27

Màn hình ViewSonic VX2758A-2K-PRO-4 27" IPS 2K 180Hz chuyên game

5.990.000₫
4.690.000₫ -22%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình AOC Q27G40E 27

Màn hình AOC Q27G40E 27" Fast IPS 2K 180Hz chuyên game

5.990.000₫
3.990.000₫ -33%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình LG 24G411A-B 24

Màn hình LG 24G411A-B 24" IPS 144Hz HDR10 Gsync chuyên game

2.990.000₫
2.650.000₫ -11%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình LG 27G610A-B 27

Màn hình LG 27G610A-B 27" IPS 2K 200Hz Gsync chuyên game

5.990.000₫
5.190.000₫ -13%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình ASUS TUF GAMING VG27AQ5A 27

Màn hình ASUS TUF GAMING VG27AQ5A 27" Fast IPS 2K 210Hz chuyên game

5.990.000₫
4.990.000₫ -17%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình Acer KG240Y-X1 24

Màn hình Acer KG240Y-X1 24" IPS 200Hz Gsync chuyên game

3.790.000₫
2.490.000₫ -34%
0.0 (0 đánh giá)
Đã bán: 1
 Màn hình Viewsonic VA2432A-H 24

Màn hình Viewsonic VA2432A-H 24" IPS 120Hz viền mỏng

3.590.000₫
2.050.000₫ -43%
0.0 (0 đánh giá)
Vừa mở bán
GEARVN - Màn hình Viewsonic VA2432-H-2 24" IPS 100Hz viền mỏng

Màn hình Viewsonic VA2432-H-2 24" IPS 100Hz viền mỏng

2.590.000₫
1.990.000₫ -23%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình ASUS ProArt PA248QFV 24

Màn hình ASUS ProArt PA248QFV 24" IPS 100Hz 16:10 chuyên đồ họa

5.990.000₫
5.290.000₫ -12%
0.0 (0 đánh giá)
Vừa mở bán
GEARVN - Màn hình ViewSonic VA2708-2K-MHD 27" IPS 2K 100Hz

Màn hình ViewSonic VA2708-2K-MHD 27" IPS 2K 100Hz

4.190.000₫
3.690.000₫ -12%
0.0 (0 đánh giá)
Đã bán: 7
 Màn hình ViewSonic VX2779A-HD-PRO 27

Màn hình ViewSonic VX2779A-HD-PRO 27" IPS 240Hz 1ms chuyên game

5.590.000₫
3.690.000₫ -34%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình AOC 24G50Z 24

Màn hình AOC 24G50Z 24" Fast IPS 260Hz chuyên game

3.490.000₫
2.790.000₫ -20%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình ViewSonic VX2758A-2K-PRO-4 27

Màn hình ViewSonic VX2758A-2K-PRO-4 27" IPS 2K 180Hz chuyên game

5.990.000₫
4.690.000₫ -22%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình AOC Q27G40E 27

Màn hình AOC Q27G40E 27" Fast IPS 2K 180Hz chuyên game

5.990.000₫
3.990.000₫ -33%
0.0 (0 đánh giá)
Vừa mở bán
Mục lục

Khi AI bị “MAD”, nó có thể đưa ra kết quả không còn khách quan và chính xác nữa.

Một bài nghiên cứu mới về AI cho biết mạng lưới của thế hệ AI hiện tại (được dùng bởi ChatGPT, Midjourney,…) có 1 hạn chế. Có vẻ như mạng lưới AI được huấn luyện bằng những dữ liệu được tạo bởi AI (chẳng hạn như văn bản được tạo bởi ChatGPT, hoặc hình ảnh được tạo bởi một mô hình Stable Diffusion) có chiều hướng trở nên “MAD” sau 5 chu kỳ huấn luyện. Trong những hình ngay dưới đây, các kết quả cho ra đều không giống thực tế một chút nào.

 

MAD là chữ viết tắt của Model Autophagy Disorder, và nó được sử dụng bởi những nhà nghiên cứu tại đại học Rice và Stanford. Những người này đang trong quá trình tìm hiểu cách mà các mô hình AI, cũng như là chất lượng đầu ra của nó, ngày một đi xuống khi được huấn luyện nhiều lần bởi các dữ liệu được tạo ra bởi AI. Cơ bản thì AI sẽ “ăn chính nó” và đưa ra những kết quả đi theo chiều hướng giá trị trung bình của dữ liệu, kiểu như con rắn nuốt cái đuôi của nó vậy.

Nôm na là việc huấn luyện LMM bằng kết quả của chính nó hoặc của AI khác sẽ tạo ra hiệu ứng hội tụ trên dữ liệu dùng để tạo ra chính LLM. Theo biểu đồ trên cho thấy, những dữ liệu ở phần rìa dần dần sẽ biến mất. Điều này khiến những dữ liệu còn lại trong mô hình sẽ không còn đa dạng như trước, và tiến gần đến giá trị trung bình hơn. Theo kết quả đưa ra thì sau 5 lần huấn luyện như vậy, tình trạng “MAD” sẽ xảy ra.

Không rõ MAD có ảnh hưởng đến tất cả mô hình AI hay không, nhưng các nhà nghiên cứu có xác nhận nó xảy ra với autoencoders, Gaussian mixture models, và những mô hình ngôn ngữ lớn. Riêng đối với các mô hình ngôn ngữ lớn – phần lõi của các ứng dụng chatbot phổ biến hiện nay (ChatGPT, AI Claude,…) – thì chúng cũng có khả năng trở nên “MAD” khi được huấn luyện bằng chính dữ liệu mà nó đã tạo ra.

Đây có thể là vấn đề đối với các mô hình ngôn ngữ hiện tại: nếu 1 mô hình được thương mại hóa và được huấn luyện bởi những dữ liệu đầu ra của chính nó thì khả năng cao là mô hình đó sẽ càng ngày càng cho ra dữ liệu nghiêng về giá trị trung bình nhiều hơn. Và nếu giá trị nghiêng về hướng trung bình nhiều hơn thì điều đó nghĩa là con AI đó đã có “thành kiến” (biased), do nó không còn xét đến những dữ liệu nhỏ lẻ khác.

Còn một vấn đề quan trọng nữa, đó là chúng ta cần phải xác định đâu là dữ liệu gốc, đâu là dữ liệu nhân tạo. Bằng không, chúng ta có thể vô tình nạp những dữ liệu nhân tạo cho AI để huấn luyện nó hết lần này đến lần khác, dẫn đến tình trạng MAD như trên. Có điều là nội dung AI đã xuất hiện cách đây rất lâu rồi, trước cả khi ChatGPT hay Midjourney bùng nổ, và nó đã nằm trên Internet đó giờ. Vì thế cho nên việc phân loại nội dung sẽ rất là khó khăn, nhưng đồng thời cũng là việc rất cần thiết.

Cũng có những cách khác để tránh việc AI trở nên có “thành kiến”. Một trong số đó là chỉnh mức độ quan trọng (weighting) của dữ liệu khi huấn luyện AI: nếu chúng ta khiến những dữ liệu nhỏ lẻ trở nên liên quan và xuất hiện nhiều lần hơn, theo lẽ thường tình thì nó cũng sẽ tiến gần tới giá trị trung bình luôn. Nói cách khác, theo như biểu đồ hình cái chuông úp ngược ban nãy, mô hình AI vẫn sẽ làm mất những dữ liệu ở phần rìa, nhưng những dữ liệu đó bây giờ không chỉ nằm ở phần rìa nữa mà nó còn nằm ở những nơi khác, gần phần giữa của cái chuông úp ngược hơn. Cho nên dù mô hình AI có cắt bớt dữ liệu nằm ở phần rìa thì cũng chẳng có gì to tát cho lắm.

Tất nhiên, cách này sẽ dấy lên nhiều câu hỏi, và khi trả lời xong 1 câu thì nhiều khi sẽ xuất hiện thêm vài câu khác – những câu hỏi liên quan đến tính chính xác của câu trả lời của mô hình AI, và liên quan đến việc liệu mô hình AI đó có còn thành kiến hay không, mà nếu có thì thành kiến đó đến từ đâu.

Tóm tắt ý chính:

  • MAD là chữ viết tắt của Model Autophagy Disorder
  • Có vẻ như mạng lưới AI được huấn luyện bằng những dữ liệu được tạo bởi AI có chiều hướng trở nên “MAD” sau 5 chu kỳ huấn luyện
  • Cơ bản thì AI sẽ “ăn chính nó” và đưa ra những kết quả đi theo chiều hướng giá trị trung bình của dữ liệu

Mời các bạn tham khảo thêm một số thông tin liên quan tại GVN 360 như:

Nguồn: tom’s HARDWARE

Bình luận của bạn sẽ được duyệt trước khi đăng lên