
Mentre la pandemia stava scomparendo dalle notizie, un’innovativa startup, Midjourney, ha fatto il suo debutto, sostenendosi autonomamente e affermandosi come un “laboratorio di ricerca indipendente”.
Midjourney ha trasformato una visione semplice ma rivoluzionaria in realtà, sviluppando tecnologie esclusive basate sui primi studi dei modelli noti come Diffusion Models. Con un’offerta distintiva, questa startup ha lanciato una piattaforma che democratizza la creazione di immagini sintetiche: chiunque, con un semplice prompt, può accedere al servizio e dar vita a immagini generate artificialmente con facilità e immediatezza
I modelli di diffusione rappresentano un’avanguardia nell’ambito dei modelli generativi, sfruttando processi elaborati per creare immagini sintetiche partendo da semplici descrizioni testuali. Questi modelli iniziano con una immagine casuale e attraverso una serie di passaggi progressivi, applicano modifiche controllate e reversibili. Ogni trasformazione si avvicina sempre di più all’immagine desiderata, delineata dal testo del prompt. Questo avviene sotto la guida di architetture di reti neurali sofisticate, che hanno il compito di enfatizzare gli aspetti rilevanti dell’immagine finale, eliminando contemporaneamente qualsiasi distorsione o “rumore”.
Il fulcro di questi modelli sono le reti neurali di tipo transformer, che condividono la stessa architettura dei Large Language Models (LLM). Queste reti non solo identificano le caratteristiche pertinenti al prompt, ma lavorano in sinergia con i Latent Diffusion Models (LDM). Gli LDM affinano ulteriormente il processo, assicurando che l’immagine risultante non sia solo fedele alla descrizione, ma anche di alta qualità, con coerenza visiva e dettagli raffinati. Insieme, questi due tipi di modelli definiscono lo stato dell’arte nella generazione di immagini sintetiche, spianando la strada per creazioni sempre più realistiche e dettagliate, nate dall’intreccio tra artefatti visivi e linguaggio naturale

Alcuni dei modelli di generazione di immagini più avanzati, come Stable Diffusion e Dall-E 3, sono accessibili gratuitamente al pubblico, sebbene richiedano una certa competenza tecnica. In risposta a questa esigenza, David Holz, già noto per aver co-fondato Leap Motion, ha intrapreso l’iniziativa di sviluppare e offrire i suoi modelli di intelligenza artificiale basandosi su un sistema di abbonamento. Questi modelli sono caratterizzati dalla facilità di utilizzo, grazie all’adozione di una piattaforma intuitiva che combina Discord con una WebApp essenziale.
La sua proposta si distingue per la semplicità e la velocità: la prima versione è stata rilasciata nel febbraio 2022, segnando un ciclo di miglioramenti costanti ogni due mesi. Questo ritmo di aggiornamento ha iniziato a rallentare nel 2023, con il rilascio della versione 5 a marzo e, di recente, la versione 6 in alpha il 21 dicembre.



Nonostante la sua popolarità, Midjourney impone un rigido sistema di moderazione che limita la creazione di contenuti: il blocco di parole chiave specifiche impedisce la generazione di immagini erotiche o violente e estende il divieto a termini legati alla religione o a figure di spicco mondiale. Questa politica di moderazione, tuttavia, non ha frenato l’espansione della base utenti, che ha raggiunto una cifra impressionante di 17 milioni di individui attivi sulla piattaforma.
David Holz, in un’intervista, ha rivelato che Midjourney ha iniziato a generare profitto già ad agosto 2022. Questo dimostra l’impressionante redditività della startup, che non ha avuto bisogno di finanziamenti esterni, bensì ha capitalizzato su un vasto mercato inesploso utilizzando AI avanzate, riuscendo a scalare rapidamente nel settore.
Da quando ha introdotto abbonamenti a pagamento nel dicembre 2022, Midjourney ha registrato introiti per circa 250 milioni di dollari, e la sua base di utenti cresce quotidianamente di 23.000 persone, con l’80% che opta per un abbonamento settimanale fin dai primi giorni di utilizzo.
Con appena 100 dipendenti, Midjourney sta rivoluzionando il mondo dell’arte, del design e dell’intrattenimento. Senza piani astrusi o ingenti investimenti, si dedica al continuo perfezionamento dei suoi modelli, rendendoli disponibili a tutti. Questo caso è emblematico di come l’intelligenza artificiale possa generare notevoli guadagni per chi sa sfruttarne rapidamente le applicazioni pratiche e i casi d’uso.
Mentre l’anno si avvicina al suo epilogo, invitiamo Midjourney a tracciare il nostro augurio per l’anno nuovo, attingendo alla bellezza del mare di Genova per un saluto che sia porta di speranza. Possa il 2023 aprirci gli occhi sull’impatto trasformativo dell’intelligenza artificiale, che promette di arricchire la società e guidarci nell’affrontare le sfide globali. Con fiducia e rinnovata consapevolezza, accogliamo l’anno nuovo, pronti a navigare verso orizzonti di progresso e benessere.
