Crescere da informatico nell’era di Hollywood non è stato per niente facile!
Vedere al cinema tutte queste fantastiche distorsioni ha sempre colpito e suscitato più di un sorriso: Ricordo ancora l’indirizzo IP sbagliato di “The Net”, o i colorati multischermi di “Codice swordfish”.
Una cosa però che mi faceva sempre arrabbiare era quella frase, tipicamente detta dallo sveglio analista della CIA all’esperto, un po’ nerd, che utilizzava il computer: “Puoi ingrandirlo?”
Ed ecco li che, come per magia, l’immagine compariva perfettamente definita! E si scopriva l’ombra, la macchia, o il dettaglio che consentiva alla trama di andare avanti, mentre tu mormoravi sommessamente con fare vagamente competente: “Se l’informazione non c’è, mica il computer può inventarla“
Tutto questo è vero, ma non lo è più nella sostanza.
Qualche anno fa un articolo interessante faceva notare come in un lavoro di Google si fosse riusciti ad ottenere una predizione molto vicina al reale (Ground truth) di come fosse un’immagine da un insieme quasi indistinto di Pixel.
Era un lavoro di super upscaling sfruttando tecniche di AI che forniva elementi interessanti e nuovi casi d’uso delle reti neurali.
Nel contempo il tema dell’upscaling diventava sempre più rilevante: I televisori cominciavano a diventare a 4K ed ora ad 8K e servivano tecnologie sempre più qualitative ed affidabili per rendere contenuti prodotti a risoluzioni inferiori presentabili alla qualità più alta.

Esistono molti siti e software che effettuano questi piccoli miracoli, sfruttando reti neurali deep: da GigaPixel AI al gratuito (ed ancora in beta) DeepImage AI.
Questi strumenti consentono di prendere immagini di scarsa qualità e trasformarli in foto di qualità invece elevatissima, consentendo di definire anche particolari molto piccoli di foto, oppure migliorare la qualità di foto molto vecchie.

L’AI Upscaling ha la capacità di produrre risultati qualitativamente molto superiori ed anche più vicini alla realtà del suo equivalente tradizionale basato su metodi trigonometrici.
Nvidia ha prodotto un dispositivo (Nvidia Shield) che consente di fare streaming di contenuti anche a 720p su televisori 4K sfuttando AI, ed ha realizzato questo sito per mostrare la differenza tra un upscaling tradizionale, che si trova nella maggior parte dei televisori, ed uno basato su AI.
Fin qui tutto bello: le foto del matrimonio della nonna ora possono sfavillare in tutto il loro splendore come fossero state scattate ieri!
Nel contempo, un ragazzo russo, utilizzando anche un altro strumento, gratuito e disponibile: Dain (frutto di un lavoro molto bello dell’università di Shangai), grazie al quale si generano anche le interpolazioni dei frame di un video per aumentare il suo frame rate.
Ha applicato entrambe queste tecniche (AI Upscaling e Frame interpolation) per dare nuova vita ad un video del 1896: L’arrivo del treno nella cittadina di La Ciotat.
Il risultato è impressionante dal punto di vista visivo. Forse non così sorprendente se si conoscono le tecniche ed il loro potenziale, ma utile per far comprendere semplicemente come l’AI sia già molto disponibile (e spesso anche gratuita!).
Un video del 1896 è ora disponibile in 4K di risoluzione e con un frame rate da 60 FPS, una qualità degna degli strumenti di registrazione più moderni direttamente da 124 anni fa…
Questo è il risultato delle elaborazioni:
Mentre qui sotto ho reperito la versione originale dei fratelli Lumière.
Pensate a cosa è possibile fare, con tecnologia accessibile, magari gratuita, che può essere resa facilmente disponibile grazie al Cloud computing: Investigazioni più efficaci (stavolta davvero!), analisi satellitari (Ne parleremo), restauri artistici e…. Come spesso accade, il limite è nella creatività con la quale applicheremo queste tecniche in futuro!
Stay tuned!
Davvero impressionante.