GauGAN - Phần mềm "vẽ hộ" siêu thông minh của nVIDIA
Trong khuôn khổ sự kiện nVIDIA GTC 2019, nVIDIA đã giới thiệu một phần mềm đồ họa đang trong quá trình hoàn thiện có tên là GauGAN với khả năng “vẽ hộ” cho con người bằng cách sử dụng trí thông minh nhân tạo (AI).
Phần mềm GauGAN đã có một màn thể hiện cực kì ấn tượng. Cụ thể là khi người dùng vạch ra những vùng cụ thể trong bản phác thảo. Phần mềm sẽ lập tức nhận diện và lập tức lấp đầy vào những vùng được chọn bằng tư liệu ảnh thực tế trong kho dữ liệu của nVIDIA.
Chỉ với những thao tác đơn giản, vạch ra những vùng đối tượng cần thêm vào trong bố cục phác thảo, GauGAN sẽ có thể ngay lập tức cho ra một bức ảnh hoàn chỉnh tuyệt đẹp.
Giao diện phần mềm
Trong bản thử nghiệm, giao diện phần vẫn còn rất sơ khai nhưng tương đối đơn giản và dễ nắm bắt, chia làm 4 khu vực chính, gồm:
- Khu vực rìa bên trái gồm các công cụ tạo nét phác thảo với biểu tượng và công cụ đổ màu cho vùng chỉ định với biểu tượng thùng sơn.
- Khu vực chính giữa chia làm 2 tấm ảnh, bên trái là phần phác thảo và bên phải hiển thị phần phác thảo đã được xử lý.
- Khu vực rìa phải là những bức ảnh thực tế với vai trò là tấm background cho bức ảnh ảo mà người dùng muốn tạo ra.
- Khu vực bên dưới của giao diện là các màu đại diện cho từng đối tượng chỉ định.
Cách thức sử dụng
Để tạo ra một bức ảnh, người dùng có 3 công cụ tạo vùng chỉ định với các biểu tượng là một cây bút chì, một cây cọ và một thùng sơn. Cây cọ và bút chì dùng để tạo nét phác thảo và thùng sơn để đổ màu tạo vùng chỉ định.
Các màu sẽ tương ứng với nhiều đối tượng khác nhau, ví dụ như màu xanh da trời để khoanh vùng bầu trời, màu xám nhạt để chỉ mây, màu nâu để chỉ đất đá…
Ngoài ra, người dùng còn được cung cấp những bức ảnh thực tế với vai trò là tấm background cho bức ảnh mình muốn tạo ra ở khu vực rìa bên phải giao diện.
Chỉ cần vài nét phác thảo để khoanh vùng các đối tượng mà người dùng muốn hiển thị, GauGAN sẽ tự động làm tất cả mọi thứ để cho ra một bức ảnh như sản phẩm của những designer thực thụ chỉ trong vài giây.
Những hình ảnh phác thảo khi được lồng vào các khung nền khác nhau.
Cách thức hoạt động
Nói một cách đơn giản thì phần mềm phác thảo GauGAN sẽ kết nối với mạng thần kinh nhân tạo của nVIDIA, sử dụng (AI) để hiểu và biến đổi dữ liệu hình ảnh thực tế sao cho khớp với những gì mà người dùng đã vẽ ra trên các vùng chỉ định trong bức phác thảo.
nVIDIA cũng cho biết, họ đã tổng hợp xấp xỉ 1 triệu bức ảnh được cấp phép từ Flickr làm nguyên liệu huấn luyện cho mạng thần kinh nhân tạo của mình để phục vụ cho GauGAN. Đồng thời họ cũng tiết lộ rằng mạng lưới này đủ thông minh để tìm ra mối quan hệ giữa những vật thể đã được nhận diện trong kho dữ liệu. Từ đó vẽ ra những bức tranh chân thực và sống động nhất.
Flickr – Một trang web chia sẻ hình ảnh lớn nhất thế giới
Bạn sẽ dễ dàng nhận thấy điều đó nếu để ý kĩ những bức ảnh mà GauGAN đã vẽ ra, phần mềm này sẽ tự động thêm vào những chi tiết mà nó cảm thấy là hợp lý, ví dụ như bóng của một cái cây in xuống mặt đất hay hình ảnh phản chiếu của những rạng núi xa in lên mặt nước… Quả là một màn trình diễn ấn tượng chỉ với bản thử nghiệm đầu tiên!
Những thông tin về GauGAN hiện tại
Theo ông Bryan Catanzaro, phó chủ tịch phụ trách bộ phận nghiên cứu deep learning của nVIDIA cho biết, phần mềm GauGAN có thể chạy trên mọi cấu hình máy tính, bất chấp GPU hay CPU là gì. Tuy nhiên, tốc độ xử lý có thể giảm đáng kể trên những những dòng GPU cũ và yếu hơn.
Ông Bryan Catanzaro – Phó chủ tịch phụ trách bộ phận nghiên cứu deep learning của nVIDIA
Tại sự kiện nVIDIA GTC 2019, phần mềm GauGAN đã chạy trên hệ thống sử dụng VGA Titan RTX và kết quả hiển thị cho lại khá mượt mà. Những hình ảnh phác thảo được xử lý với tốc độ cực kì nhanh chóng, gần như là theo thời gian thực. Trên lý thuyết, theo như những gì mà ông Bryan Catanzaro chia sẻ thì GauGAN vẫn có thể chạy trên những dòng VGA phổ thông như RTX 2080, RTX 2060 hay là các dòng GTX 10XX hoặc thậm chí cũ hơn. Tuy nhiên, chắc chắn một điều là những chiếc VGA này sẽ không thể chạy GauGAN mượt mà như trên một chiếc VGA chuyên dụng siêu đắt đỏ như Titan RTX.
Titan RTX – Chiếc VGA siêu cao cấp đến từ nVIDIA
Hiện tại nVIDIA cho biết rằng hiện tại thì GauGAN vẫn còn đang trong giai đoạn thử nghiệm và họ chưa có kế hoạch thương mại hóa phần mềm siêu thông minh này. Tuy nhiên, họ sẽ phát hành một bản thử nghiệm công khai cho tất cả người dùng trong tương lai gần.
Ứng dụng và những khả năng phát triển trong tương lai
Với mạng thần kinh nhân tạo, GauGAN có thể tiết kiệm được rất nhiều công sức trong việc chỉnh sửa và sáng tạo hình ảnh 2D, hứa hẹn sẽ đem đến những bước đi mang tính cách mạng trong các ngành liên quan đến hình ảnh như thiết kế đồ họa, dựng phim…
Hiện tại thì GauGAN chỉ có thể “vẽ” nên những hình ảnh về phong cảnh thiên nhiên. Tuy nhiên, chúng ta hoàn toàn có thể hy vọng nó sẽ có thể tiến xa hơn nữa với những hình ảnh đường phố, thiết bị máy móc, sinh vật sống…
Nhắc lại một lần nữa, nVIDIA đã có kế hoạch phát hành một bản thử nghiệm của GauGAN trong tương lai gần. Và mọi người dùng của đội xanh đều sẽ có cơ hội trải nghiệm phần mềm siêu thú vị này, chắc chắn nó sẽ không giống với bất cứ phần mềm vẽ nào mà chúng ta từng thử qua.
(Bài viết có sử dụng thông tin được tổng hợp từ nhiều nguồn)