Il primo gioco RTX IO si carica più velocemente con meno pop-in delle texture.
Portal: Prelude RTX è un’impressionante vetrina della tecnologia RTX Remix di Nvidia, che prende quella che era una mod Source per Portal e le conferisce caratteristiche visive e tecnologie che rivaleggiano e addirittura superano le release tripla AAA di fascia alta. È davvero spettacolare e si spera che sia una delle tante rimasterizzazioni path-traced che arriveranno in futuro con l’avvicinarsi del rilascio degli strumenti di modding RTX Remix.
Ma la cosa più interessante è che Prelude è anche il primo gioco a supportare RTX IO, uno schema di decompressione accelerato dalla GPU che funziona sotto Vulkan. Si tratta essenzialmente di una versione a marchio Nvidia del Direct Storage 1.2, incluso anche in Ratchet and Clank: Rift Apart, che verrà lanciato su PC alla fine del mese. Il suo scopo è quello di accelerare il caricamento dei giochi e lo streaming delle risorse sulla piattaforma PC, e la sua inclusione ci offre una buona scusa per vedere come funziona la tecnologia.
Storicamente, il caricamento comportava il trasferimento di dati di gioco come texture o modelli da un disco rigido alla memoria di sistema e quindi alla GPU sotto il controllo della CPU. Si trattava di un approccio seriale che richiedeva una certa latenza, in quanto il disco doveva fisicamente far girare il fuso, individuare i dati e quindi caricarli blocco per blocco in modo da ridurre al minimo la quantità di ricerca necessaria.
Questa tecnica funzionava abbastanza bene con le risorse di gioco relativamente piccole caricate da HDD, ma con i giochi che ora hanno dimensioni di centinaia di gigabyte con risorse estremamente dettagliate, tutti questi dati devono essere compressi per fare buon uso dello spazio di archiviazione e della larghezza di banda disponibili. Ciò significa che le risorse devono essere decompresse dalla CPU prima di poter essere utilizzate sulla GPU e il tempo e l’onere della CPU che ne derivano fanno sì che l’approccio tradizionale inizi a non funzionare più.
Fortunatamente, l’avvento dello storage flash rapido e a bassa latenza nelle unità SSD significa che non è necessario leggere i dati in modo sequenziale per ridurre al minimo i tempi di ricerca: possiamo creare un nuovo standard. In primo luogo, vogliamo accedere ai dati in parallelo per ridurre in modo massiccio i tempi di caricamento rispetto al vecchio standard di I/O di Windows. In secondo luogo, vogliamo garantire che i dati vengano spostati dallo storage alla GPU prima che venga decompresso. Le GPU hanno molti core ed eseguono operazioni massicciamente parallele come la decompressione meglio delle CPU, quindi questo approccio consente di risparmiare molto tempo. Questo è il nuovo sistema previsto per RTX IO e Direct Storage 1.2, che garantisce tempi di caricamento più rapidi e, se utilizzato nel gameplay per lo streaming, una riduzione del carico della CPU che può potenzialmente migliorare le prestazioni.
Per l’RTX IO, come avviene in Portal Prelude RTX, i dati su disco vengono compressi utilizzando il formato GDeflate e spostati temporaneamente nella memoria di sistema, quindi nella VRAM e lì decompressi dalla GPU. Il formato GDeflate è uno standard di compressione aperto per le GPU di Nvidia, che è stato ceduto a Microsoft e al Kronos Group, ed è il formato che mi aspetto di vedere utilizzato nei giochi Direct Storage 1.2 che utilizzano DirectX su PC – con GPU di Nvidia, AMD e Intel tutte supportate.
Al contrario, Portal: Prelude RTX utilizza l’API grafica Vulkan, che non dispone di chiamate standard concordate per la decompressione della GPU; per quanto ne so, attualmente esistono solo le estensioni proposte da Nvidia. Queste estensioni di Nvidia per la decompressione della GPU potrebbero potenzialmente essere quelle adattate all’ingrosso dal gruppo Kronos per il Direct Storage Equivalent di Vulkan. Nel frattempo, la decompressione rapida della GPU in Portal Prelude: RTX funzionerà solo sui driver che supportano queste estensioni specifiche, ovvero sulle schede grafiche Nvidia RTX.
Tuttavia, Portal Prelude RTX funziona ancora con un paradigma di caricamento più tradizionale, il che significa che RTX IO non aumenta il frame-rate. Dopo tutto, RTX Remix non sostituisce il motore di gioco né altera il modo in cui i livelli vengono suddivisi e caricati; RTX Remix cambia invece il modo in cui viene eseguito il rendering e il modo in cui le risorse vengono caricate per alimentare il rendering. Questo è diverso da Ratchet and Clank: Rift Apart, che dovrebbe utilizzare la decompressione della GPU per velocizzare il gameplay. Portal Prelude RTX beneficia quindi principalmente dei tempi di caricamento dedicati e dei tempi di caricamento delle texture visibili.
Per verificare l’effetto di questa tecnologia, ho testato una build del gioco con RTX IO disattivato e con un’unità SSD SATA con un limite di 500MB/s. Il gioco si carica abbastanza velocemente, ma le texture impiegano un po’ di tempo per raggiungere la massima qualità: senza la compressione GDeflate di RTXIO, il gioco su disco è completamente non compresso e più grande del 60%. Quindi la larghezza di banda viene tassata di conseguenza per spostare le texture nella VRAM, impiegando poco più di un secondo per il caricamento dell’ultima texture. Con RTX IO attivo, la stessa texture su un SSD SATA si carica in meno della metà del tempo.
Configurazione | Carica nel gioco | Caricamento texture |
---|---|---|
12900K + 500MB/s SATA SSD + RTX IO off | 1.13s | 2.36s |
12900K + SSD SATA da 500MB/s + RTX IO on | 0.67s | 1.16s |
12900K + SSD NVMe 3.5GB/s + RTX IO off | 0.57s | 1.45s |
12900K + SSD NVMe da 3,5 GB/s + RTX IO su | 0.53s | 1.07s |
Non si tratta esattamente della più grande differenza nel mondo reale, dato che mezzo secondo se ne va in un attimo, ma il dimezzamento del tempo è comunque impressionante. Dopo aver effettuato una serie di test in diverse configurazioni, ho trovato due dati interessanti. In primo luogo, un’unità SATA da 500 MB/s con RTX IO attivato batte un’unità NVMe da 3,5 GB/s con RTX IO disattivato: un risultato davvero eccezionale. In secondo luogo, le differenze hardware tra CPU e GPU non hanno avuto un impatto drammatico sui tempi di caricamento: il sistema RTX 2060 Super + Core i9 12900K ha ottenuto le stesse prestazioni della stessa CPU con l’ammiraglia RTX 4090; anche un sistema RTX 4070 e Ryzen 5 3600 è risultato molto simile in termini di tempi di caricamento.
Quindi Portal: Prelude RTX è una promettente prima uscita di questa tecnologia su PC, ma allo stesso tempo è banale in quanto si applica a un gioco che utilizza un vecchio paradigma di caricamento. Con i giochi che utilizzano lo streaming attivo e non prevedono schermate di caricamento di alcun tipo, come Ratchet and Clank: Rift Apart e altri giochi futuri, è qui che questa tecnologia darà il meglio di sé. Naturalmente, non vediamo l’ora di occuparci di questo titolo molto presto, visto che il gioco arriverà su PC il 26 luglio, quindi rimanete sintonizzati.