Khi Nintendo Switch 2 lần đầu được hé lộ, một trong những điểm nhấn công nghệ đáng chú ý là bộ xử lý tùy chỉnh của Nvidia, đặc biệt là GPU dựa trên kiến trúc Ampere có khả năng tận dụng công nghệ DLSS. Không còn là bí mật khi DLSS (Deep Learning Super Sampling) là công nghệ dẫn đầu về chất lượng hình ảnh trong số các công cụ nâng cấp độ phân giải, đến mức mô hình biến đổi mới nhất trong DLSS 4 thường cho hình ảnh trông đẹp hơn so với việc chạy game ở độ phân giải gốc. Tuy nhiên, kể từ khi console này ra mắt và các tựa game tích hợp DLSS xuất hiện, một điều đã trở nên rõ ràng: DLSS trên Switch 2 không giống như DLSS trên PC.
Đặc điểm hình ảnh của Switch 2 không trùng khớp với DLSS trên PC, và ngay cả giữa các tựa game dành cho Switch 2, chất lượng hình ảnh cũng có sự khác biệt lớn giữa các tựa như Fast Fusion và Cyberpunk 2077. Điều này là do thứ mà Digital Foundry – và cộng đồng đồ họa rộng lớn hơn – đã gọi là “DLSS Lite”. Các tựa game trên Switch 2 sử dụng một phiên bản DLSS tùy chỉnh, và mặc dù chúng ta chưa biết chính xác đó là phiên bản nào, nhưng các tựa game như Fast Fusion cho thấy đây là một cài đặt được tối ưu hóa cao nhằm hy sinh chất lượng hình ảnh để đạt được hiệu suất tốt hơn. Một mô hình như vậy có thể mang lại nhiều ý nghĩa quan trọng cho các máy tính cấu hình thấp nếu nó được phát hành rộng rãi.
Logo NVIDIA GeForce RTX 5070 thể hiện sức mạnh GPU hỗ trợ công nghệ DLSS.
DLSS Hoạt Động Theo Một Cách “Kỳ Lạ”
Chi Phí Hiệu Năng Của DLSS Trước Khi Mang Lại Lợi Ích
DLSS có chi phí hiệu năng (overhead), nhưng chúng ta rất dễ quên điều đó. Đây là một công cụ bạn sử dụng để cải thiện hiệu suất, và những cải thiện hiệu suất mà nó mang lại lớn hơn nhiều so với chi phí tính toán, khiến bạn gần như không bao giờ nhận ra. Chỉ cần chạy một trò chơi ở độ phân giải gốc mà DLSS dùng để render nội bộ và so sánh kết quả – DLSS sẽ cho hiệu suất thấp hơn. Mặc dù dễ hiểu là DLSS có chi phí, nhưng trong bối cảnh của Switch 2 và các PC cấp thấp, điều quan trọng là phải hiểu tại sao nó lại có chi phí đó.
Bạn thường nghe DLSS được gọi là “nâng cấp độ phân giải” (upscaling), nhưng thực tế nó không đơn thuần là vậy, ngay cả khi nó mang lại kết quả tương tự. Với upscaling, bạn đang sử dụng một thuật toán để điền vào các pixel bị thiếu. Cách dễ nhất để hình dung là một video 1080p phát trên màn hình 4K. Mỗi pixel 1080p được biểu thị bằng một khối bốn pixel trên màn hình 4K. Đó là cách upscaling hoạt động ở cấp độ cơ bản nhất, và từ đó, bạn có thể áp dụng các kỹ thuật khác nhau. Có thể bạn lấy mẫu các pixel lân cận để có được độ chuyển màu mượt mà hơn, hoặc có thể bạn xem xét các khung hình trước đó để biết các pixel bổ sung đó trông như thế nào. Đó chính là upscaling.
DLSS thực hiện upscaling, nhưng sự khác biệt quan trọng là nó không chỉ dựa vào thuật toán. Nó không chỉ đơn thuần lấy một pixel, chạy qua một phương trình và đưa ra kết quả. Nó lấy một pixel và chạy qua một mô hình AI đang hoạt động cục bộ trên GPU của bạn. Đó là một mô hình AI rất nhỏ, nhưng dù sao nó cũng là một mô hình AI. Và mô hình AI đó tạo ra nhiều chi phí hơn so với việc chỉ sử dụng một thuật toán để upscaling. Nếu bạn không tin, hãy khởi động một trò chơi với DLSS và FSR 1 và cho tôi biết cái nào tạo ra hiệu suất cao hơn; chắc chắn sẽ là FSR 1.
Việc xem DLSS như một dạng upscaling đặc biệt không quan trọng trong hầu hết các trường hợp, trừ việc cung cấp cho Nvidia những điểm nói trong các chiến dịch marketing của họ. Tuy nhiên, khi nói về DLSS Lite, điều này lại quan trọng. Không giống như các phiên bản FSR đầu tiên có thể chạy trên hầu hết mọi phần cứng render pixel, phần cứng cần đạt một ngưỡng hiệu suất nhất định để có thể sử dụng DLSS. Nếu bạn giảm xuống đủ thấp, lợi thế hiệu suất của việc render ít pixel hơn cuối cùng sẽ bị vượt qua bởi chi phí của mô hình AI đang chạy. Điều đó không phải là vấn đề trên bất kỳ card đồ họa desktop nào hỗ trợ DLSS. Nhưng trên Switch 2, thì có.
“DLSS Lite” Trên Switch 2: Hy Vọng Cho Phần Cứng Cấp Thấp
Hiểu Rõ Về Phiên Bản DLSS “Nhẹ”
Mặc dù Switch 2 có GPU dựa trên kiến trúc Ampere, nhưng con chip bên trong console này chậm hơn nhiều so với ngay cả card RTX desktop yếu nhất. Ngay cả RTX 2050 cũng có nhiều nhân hơn, và đó là chưa kể đến môi trường bị giới hạn nhiệt độ của Switch 2 cùng với nhu cầu hoạt động ở mức năng lượng cực thấp. Trong bối cảnh đó, nhu cầu về một mô hình DLSS nhẹ hơn để chạy game trên Switch 2 trở nên rõ ràng.
Mặc dù Nvidia chưa chia sẻ chi tiết về phiên bản DLSS tùy chỉnh mà các nhà phát triển đang sử dụng trên Switch 2, nhưng kết quả đã hiển hiện rõ ràng – nó trông tệ hơn. Tuy nhiên, nó vẫn trông tốt và có khả năng tốt hơn những gì FSR có thể đạt được với cùng độ phân giải đầu vào. Nhưng đó không phải là chất lượng mà chúng ta mong đợi từ DLSS trên PC. Rất có thể, đó là DLSS với mô hình AI được tinh chỉnh để chạy nhanh hơn nhưng kém chính xác hơn, giúp các nhà phát triển game có quyền truy cập vào một giải pháp nâng cấp thực sự hoạt động mà không bị sụp đổ dưới sức nặng của chính chi phí hiệu năng của nó.
Máy chơi game Nintendo Switch 2 với dock và Joy-Con, minh họa khả năng chạy DLSS Lite để tối ưu hiệu suất.
Ít nhất dựa trên những gì chúng ta biết hiện tại, phiên bản DLSS đó không có sẵn trên PC. Bạn có thể lập luận rằng nếu card RTX desktop yếu nhất vẫn nhanh hơn Switch 2 nhiều lần, thì chúng ta không cần DLSS Lite này trên PC. Tôi nghĩ rằng quan điểm đó thiếu tầm nhìn về hướng đi của các công nghệ như DLSS, cũng như phần cứng mà nó sẽ chạy trong tương lai.
DLSS Không Chỉ Tốt Hơn Mà Còn Đòi Hỏi Cao Hơn
Tham Vọng Phát Triển Của DLSS
Nvidia liên tục phát hành các phiên bản DLSS mới giúp cải thiện chất lượng hình ảnh một chút, nhưng gần đây họ đã đại tu Super Resolution với việc phát hành mô hình transformer. Như tôi đã đề cập ở đầu bài viết này, mô hình transformer trong DLSS 4 tốt đến mức thường trông đẹp hơn so với việc chạy game ở độ phân giải gốc. Đổi lại, mô hình transformer đòi hỏi cao hơn. Mức chênh lệch thường mỏng, nhưng bạn có thể thấy rằng mô hình CNN trước đó thực sự tạo ra tốc độ khung hình cao hơn so với mô hình transformer trong thử nghiệm của TechPowerUp.
Điều này không phải là vấn đề trên RTX 3060 và RTX 3080 mà TechPowerUp đã sử dụng để thử nghiệm, nhưng trên Switch 2 thì sao? Chắc chắn không thể khiến mô hình transformer chạy được, ít nhất là ở trạng thái ban đầu của nó. Nvidia thực tế đã cập nhật transformer bằng cách giảm 20% mức sử dụng VRAM của nó. Ở dạng nguyên bản, mô hình transformer đòi hỏi gần gấp đôi lượng VRAM so với mô hình CNN trước đó.
Card đồ họa NVIDIA GeForce RTX 5090 hiệu năng cao, đại diện cho công nghệ DLSS ngày càng đòi hỏi phần cứng.
Và bây giờ, cuối cùng, chúng ta có thể nói về PC. Phần cứng hiện có không yêu cầu DLSS Lite, nhưng phần cứng trong tương lai có thể. Nvidia đã rất rõ ràng về tham vọng của mình đối với DLSS và vai trò mà nó sẽ tiếp tục đóng trong việc render, điều này có thể dẫn đến các mô hình AI lớn hơn, đòi hỏi cao hơn. Theo một cách nào đó, chúng ta đã thấy điều đó với Frame Generation và Multi-Frame Generation, vốn bị khóa cho các thế hệ phần cứng nhất định. Nếu Nvidia có thể điều chỉnh các yếu tố để cân bằng tốt hơn giữa chất lượng hình ảnh và hiệu suất, có lẽ một phiên bản DLSS Lite trên PC sẽ không phải là một ý tưởng tồi.
Có thể một vài thế hệ nữa, bạn không thể chạy phiên bản DLSS đầy đủ, “nặng ký” trên một thứ như RTX 4060, nhưng bạn vẫn có thể truy cập phiên bản nhẹ hơn. Hoặc có thể Nvidia cuối cùng cũng phát hành SoC N1X theo tin đồn, và DLSS Lite có thể mang lại những cải thiện hiệu suất mà không gây ra chi phí quá lớn. Switch 2 cung cấp một cái nhìn thoáng qua về tương lai của DLSS, và nó chứng minh rằng Nvidia có khả năng điều chỉnh tiện ích cực kỳ phổ biến của mình để hoạt động trên phần cứng không phải là GPU RTX desktop chuyên dụng.