Microsoft phát triển AI Vall-E có thể nhái giọng người chỉ sau 3 giây thu âm

Microsoft phát triển AI Vall-E có thể nhái giọng người chỉ sau 3 giây thu âm

 Màn hình LG 24G411A-B 24

Màn hình LG 24G411A-B 24" IPS 144Hz HDR10 Gsync chuyên game

2.990.000₫
2.650.000₫ -11%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình Acer KG240Y-X1 24

Màn hình Acer KG240Y-X1 24" IPS 200Hz Gsync chuyên game

3.790.000₫
2.490.000₫ -34%
0.0 (0 đánh giá)
Đã bán: 1
 Màn hình ASUS TUF GAMING VG27AQ5A 27

Màn hình ASUS TUF GAMING VG27AQ5A 27" Fast IPS 2K 210Hz chuyên game

5.990.000₫
4.990.000₫ -17%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình ASUS ProArt PA248QFV 24

Màn hình ASUS ProArt PA248QFV 24" IPS 100Hz 16:10 chuyên đồ họa

5.990.000₫
5.290.000₫ -12%
0.0 (0 đánh giá)
Vừa mở bán
GEARVN - Màn hình Viewsonic VA2432-H-2 24" IPS 100Hz viền mỏng

Màn hình Viewsonic VA2432-H-2 24" IPS 100Hz viền mỏng

2.590.000₫
1.990.000₫ -23%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình Asus TUF GAMING VG279QE5A-R 27

Màn hình Asus TUF GAMING VG279QE5A-R 27" IPS 146Hz chuyên game

4.990.000₫
3.190.000₫ -36%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình ASUS VA27AQ 27

Màn hình ASUS VA27AQ 27" IPS 2K 75Hz viền mỏng

4.490.000₫
3.290.000₫ -27%
0.0 (0 đánh giá)
Vừa mở bán
GEARVN - Màn hình ViewSonic VA2708-2K-MHD 27" IPS 2K 100Hz

Màn hình ViewSonic VA2708-2K-MHD 27" IPS 2K 100Hz

4.190.000₫
3.690.000₫ -12%
0.0 (0 đánh giá)
Đã bán: 7
GEARVN - Màn hình ASUS ProArt PA279CRV 27“ IPS 4K USBC chuyên đồ họa

Màn hình ASUS ProArt PA279CRV 27" IPS 4K USBC chuyên đồ họa

16.990.000₫
12.990.000₫ -24%
0.0 (0 đánh giá)
Đã bán: 5
 Màn hình MSI MAG 245F X24 24

Màn hình MSI MAG 245F X24 24" Rapid IPS 240Hz chuyên game

3.990.000₫
2.990.000₫ -25%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình LG 27G610A-B 27

Màn hình LG 27G610A-B 27" IPS 2K 200Hz Gsync chuyên game

5.990.000₫
5.190.000₫ -13%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình Viewsonic VA2432A-H 24

Màn hình Viewsonic VA2432A-H 24" IPS 120Hz viền mỏng

3.590.000₫
2.050.000₫ -43%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình LG 24G411A-B 24

Màn hình LG 24G411A-B 24" IPS 144Hz HDR10 Gsync chuyên game

2.990.000₫
2.650.000₫ -11%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình Acer KG240Y-X1 24

Màn hình Acer KG240Y-X1 24" IPS 200Hz Gsync chuyên game

3.790.000₫
2.490.000₫ -34%
0.0 (0 đánh giá)
Đã bán: 1
 Màn hình ASUS TUF GAMING VG27AQ5A 27

Màn hình ASUS TUF GAMING VG27AQ5A 27" Fast IPS 2K 210Hz chuyên game

5.990.000₫
4.990.000₫ -17%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình ASUS ProArt PA248QFV 24

Màn hình ASUS ProArt PA248QFV 24" IPS 100Hz 16:10 chuyên đồ họa

5.990.000₫
5.290.000₫ -12%
0.0 (0 đánh giá)
Vừa mở bán
GEARVN - Màn hình Viewsonic VA2432-H-2 24" IPS 100Hz viền mỏng

Màn hình Viewsonic VA2432-H-2 24" IPS 100Hz viền mỏng

2.590.000₫
1.990.000₫ -23%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình Asus TUF GAMING VG279QE5A-R 27

Màn hình Asus TUF GAMING VG279QE5A-R 27" IPS 146Hz chuyên game

4.990.000₫
3.190.000₫ -36%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình ASUS VA27AQ 27

Màn hình ASUS VA27AQ 27" IPS 2K 75Hz viền mỏng

4.490.000₫
3.290.000₫ -27%
0.0 (0 đánh giá)
Vừa mở bán
GEARVN - Màn hình ViewSonic VA2708-2K-MHD 27" IPS 2K 100Hz

Màn hình ViewSonic VA2708-2K-MHD 27" IPS 2K 100Hz

4.190.000₫
3.690.000₫ -12%
0.0 (0 đánh giá)
Đã bán: 7
GEARVN - Màn hình ASUS ProArt PA279CRV 27“ IPS 4K USBC chuyên đồ họa

Màn hình ASUS ProArt PA279CRV 27" IPS 4K USBC chuyên đồ họa

16.990.000₫
12.990.000₫ -24%
0.0 (0 đánh giá)
Đã bán: 5
 Màn hình MSI MAG 245F X24 24

Màn hình MSI MAG 245F X24 24" Rapid IPS 240Hz chuyên game

3.990.000₫
2.990.000₫ -25%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình LG 27G610A-B 27

Màn hình LG 27G610A-B 27" IPS 2K 200Hz Gsync chuyên game

5.990.000₫
5.190.000₫ -13%
0.0 (0 đánh giá)
Vừa mở bán
 Màn hình Viewsonic VA2432A-H 24

Màn hình Viewsonic VA2432A-H 24" IPS 120Hz viền mỏng

3.590.000₫
2.050.000₫ -43%
0.0 (0 đánh giá)
Vừa mở bán
Mục lục

Vall-E được phát triển bởi 1 đội ngũ nhà nghiên cứu ở Microsoft, và nó sử dụng hệ thống mới toanh để học cách nói chuyện.

Vall-E là 1 trí thông minh nhân tạo (AI) được phát triển bởi 1 nhóm nhà nghiên cứu tại Microsoft. Nó có thể nhại theo giọng người nói với chất lượng rất tốt chỉ sau vài giây nghe đoạn thu âm mẫu. Vall-E không phải là công cụ giọng nói đầu tiên được ứng dụng AI, nhưng nó hứa hẹn sẽ xịn sò hơn tất cả các công cụ tương tự.

Vall-E được huấn luyện với khối lượng dữ liệu cực kỳ lớn và đa dạng, bao gồm 60.000 giờ thu âm giọng nói bằng tiếng Anh được thu thập từ hơn 7000 người nói độc nhất (unique speaker), tất cả đều được chuyển thành chữ viết bởi phần mềm nhận dạng giọng nói.

Lượng dữ liệu nạp vào AI chứa nhiều thông tin nhiễu (noisy speech) và sai sót hơn so với các hệ thống text-to-speech khác (chuyển từ chữ viết sang giọng nói). Tuy nhiên, các nhà nghiên cứu tin rằng do lượng thông tin nạp vào vô cùng lớn, cộng với việc nó cực kỳ đa dạng, cho nên Vall-E sẽ linh hoạt, dễ dàng thích nghi hơn, và quan trọng nhất là sẽ tự nhiên hơn so với những phương pháp trước đây. Ngoài ra, các nhà nghiên cứu còn nhận thấy Vall-E còn có thể giữ lại được cảm xúc của người nói.

Bạn có thể nghe thử kết quả của Vall-E tại đây (valle-demo.github.io/), cùng với đó là một vài đoạn phân tích cách thức hoạt động của nó. Có cái thì nghe sẽ giống robot, có cái thì nghe giống người hơn, nhưng nhìn chung thì với bản demo như thế thì quá là ấn tượng luôn rồi. Trong vòng vài năm tới, khi hệ thống này được cải thiện, dữ liệu nạp vô đa dạng hơn thì kết quả cho ra nhiều khi không biết đâu là người đâu là máy luôn các bạn ạ.

Các nhà nghiên cứu cũng biết được rằng do Vall-E có thể tự nói với giọng nghe y chang người thật, cho nên nó sẽ có rủi ro là kẻ gian sẽ lợi dụng điều này để đánh lừa hệ thống bảo mật, hoặc giả danh làm 1 ai đó nhằm mục đích trục lợi bản thân. Để hạn chế điều này, các nhà nghiên cứu cho biết họ có thể tạo ra 1 mô hình để nhận biết xem đoạn âm thanh đó có được tạo bởi Vall-E hay không. Ngoài ra, họ cũng sẽ tuân theo các quy định trong Microsoft AI Principles khi phát triển các mô hình.

Tóm tắt ý chính:

  • Vall-E là 1 trí thông minh nhân tạo được phát triển bởi 1 nhóm nhà nghiên cứu tại Microsoft
  • Nó có thể nhại theo giọng người nói với chất lượng rất tốt chỉ sau vài giây nghe đoạn thu âm mẫu
  • Vall-E được huấn luyện với lượng dữ liệu từ 60.000 giờ thu âm giọng nói bằng tiếng Anh được thu thập từ hơn 7000 người nói độc nhất
  • Các nhà nghiên cứu tin rằng Vall-E sẽ linh hoạt, dễ dàng thích nghi hơn, và nghe sẽ tự nhiên hơn so với những phương pháp trước đây
  • Các nhà nghiên cứu còn nhận thấy Vall-E còn có thể giữ lại được cảm xúc của người nói

Mời các bạn tham khảo thêm một số thông tin liên quan tại GEARVN như:

Nguồn: PC Gamer

Bình luận của bạn sẽ được duyệt trước khi đăng lên