PODCAST #002: GPT-4 — ChatGPT acquisisce il potere della vista

Nessun commento

31 minutes

Le ultime novità nel mondo dell'intelligenza artificiale: ChatGPT acquisisce la vista, Microsoft rivoluziona la produttività e la battaglia legale tra avvocati umani e robot.

PODCAST #002: GPT-4 — ChatGPT acquisisce il potere della vista

Scopri le ultime notizie sorprendenti nel mondo dell’intelligenza artificiale! In questo video, esploreremo come ChatGPT ha acquisito il potere della vista, consentendogli di assistere le persone non vedenti e migliorare la comprensione del contesto visivo. Discuteremo anche della ironica battaglia legale tra avvocati umani e robot, e di come Microsoft sta rivoluzionando il mondo della produttività grazie alla nuova suite Office dotata di ChatGPT. Non perderti queste entusiasmanti novità che stanno cambiando il modo in cui interagiamo con la tecnologia e il futuro del lavoro. Iscriviti al nostro canale per rimanere aggiornato sulle tendenze e le innovazioni dell’AI!


Trascrizione Podcast #002

1. Introduzione

Ciao ragazzi, buongiorno o buonasera, dipende da quando ci guarderete. Siamo di nuovo qui, io e Alessandro, per parlarvi di tutte le notizie che sono uscite questa settimana. Abbiamo da ChatGPT la nuova versione, poi abbiamo trovato anche informazioni su come rendere in 4K i vostri filmini di quando eravate piccoli. Io lo so, vi piacevano talmente tanto non in HD che vedervi piccoli e in HD sarà ancora più divertente, e altre notizie di cui parleremo nel podcast oppure nel nostro nuovissimo blog che stiamo sviluppando, che spero vi piacerà leggere le notizie direttamente da lì. Detto questo, per chi ancora non ci conosce, siamo un podcast italiano dove, appunto, vogliamo portare contenuti che trattano intelligenza artificiale, automazione, domotica, tutto ciò che riguarda il nostro futuro.

2. DoNotPay: un sito di servizi legali basati su AI ad accesso a buon mercato

Benissimo, partiamo con il primo articolo di cui volevo parlarvi oggi… Diciamo che la problematica sta nel fatto che sono nate diverse compagnie, tra cui la più famosa è questa che vedete a schermo che si chiama DoNotPay… Praticamente è un sito web che si occupa di fornire servizi legali, servizi legali però limitati a piccoli servizi come reclami sulle multe, bollette, reclami su bollette assurde, problemi di cancellazione delle carte di credito, problemi di rimozione di account online, messaggi abusivi e questo sito praticamente ti propone una lista di soluzioni, soluzioni di cui è capace di prendersi cura, da cui l’utente può poi selezionare qual è il problema che vuole risolvere e praticamente c’è un’IA che si occupa di tutto il processo legale, dall’inizio alla fine: nel primo momento capisce il problema, poi capisce come risolverlo legalmente e anche ad arrivare fino al processo di inviare magari una lettera a chi di riguardo per risolvere questo problema legale. E questo sito è chiaramente estremamente popolare, perché questi servizi di cui abbiamo appena parlato, molto spesso, quando si va da un avvocato nella vita reale, sono servizi che possono costarti centinaia se non migliaia di euro o più per risolverli secondo la difficoltà del problema legale e invece DoNotPay costa 36 dollari ogni tre mesi, quindi 12 dollari al mese, praticamente esatto: con 12 dollari al mese hai appunto accesso a un assistente legale che risolve quelle che secondo me sono molto spesso i problemi legali più comuni, perché in pochi hanno poi davvero bisogno di avvocati per i problemi grossi… Sì, per problemi grossi si spera che nessuno ne abbia mai bisogno, però per le piccole problematiche potrebbe risultare un sito molto interessante.

Le nostre opinioni sull’impatto di DoNotPay in Italia

Insomma, un’app così sicuramente avrebbe un impatto positivo in Italia perché, secondo me, c’è più bisogno che le persone agiscano per vie legali. Molto spesso in Italia, ci si nasconde dietro la difficoltà di comunicazione, e a volte le persone passano la voglia di lamentarsi o di agire perché la burocrazia è complessa, difficile e criptica. Quando un individuo privato agisce per vie legali chiare e pulite, è molto più difficile per chi sta facendo il torto o chi si sta comportando male. Ma il problema secondo me sarà sempre l’idea che qualcosa rubi del lavoro a qualcun altro. Purtroppo, in Italia, non ce la leveremo mai.

Sì, infatti, una cosa di cui volevo parlare è il fatto che, secondo me (poi mi dirai tu cosa ne pensi), il futuro di tutti i lavori che si basano sulla conoscenza è nero. Per esempio, non per diminuire il valore di un lavoro come l’avvocato, ma larga parte del lavoro dell’avvocato è quella di avere un ruolo di persona che sa le cose. Non c’è dubbio, però, che passa tanto tempo in ufficio a scartabellare, a leggere, a informarsi e a produrre, diciamo, delle lettere, dei testi o degli argomenti che vanno a discutere con altri argomenti. Poi, chiaramente, sono molto vago.

Sì, assolutamente. Diciamo che poi lo vedrai più grigia come cosa perché, a prescindere di tutte queste cose, non leveranno mai la figura dell’avvocato. Cioè, l’intelligenza artificiale, a prescindere, difficilmente supererà a livello creativo, a livello… Cioè non è neanche una questione di immaginarsi, è proprio il fatto che tu, da privato, al posto di andare a pagare un avvocato che magari ti costa centinaia e centinaia di migliaia di euro, apri una di queste intelligenze artificiali che ti fa 30 pounds al mese. E quindi, capito come va a riflettersi poi questa cosa sul mercato degli avvocati, sul lavoro degli avvocati, sulle grandi firme che magari hanno tanti dipendenti e che iniziano a vedere una diminuzione drastica del numero di lavori di richiesta che gli vengono assegnati.

Una firma di avvocati fa causa a DoNotPay per mancanza di licenza: l’interesse crescente verso le implicazioni legali delle AI

Ci abbiamo girato tanto attorno, ma il punto non è l’esistenza di questo servizio, che chiaramente i nostri ascoltatori avrebbero potuto dare per scontato a questo punto, vista l’efficienza di questa nuova AI. Ma una firma di avvocati americana ha fatto causa a questa azienda, che appunto produce questa intelligenza artificiale, in quanto i termini della causa sono basati sul fatto che DoNotPay, cioè l’intelligenza artificiale in sé, non ha una laurea in legge. Anche Business Insider dice che non è chiaro se DoNotPay abbia un team di legali al suo interno. Comunque, l’argomento che chi gli sta facendo causa sta utilizzando è il fatto che l’intelligenza artificiale in sé non ha una licenza per praticare il mestiere dell’avvocato in America, che invece tutti gli avvocati devono avere. Chiaramente, adesso non c’è una conclusione se DoNotPay dovrà poi chiudere o pagare, o cercare di ottenere una licenza da avvocato in America. È solo interessante vedere come queste AI stanno iniziando a essere coinvolte in dibattiti legali, etici e morali, essendo comunque già interconnesse e utilizzate per risolvere i problemi di tutti i giorni delle persone, ed era assolutamente inevitabile che una cosa del genere sarebbe successa.

I servizi di DoNotPay: tra problemi legali e soluzioni “assurde”

Prima di passare alla prossima notizia, vediamo un attimo quali sono i servizi più popolari offerti da DoNotPay, che sono problemi, per esempio, di iscrizione a servizi di messaggistica istantanea, come procurarsi un numero di telefono falso per la verifica di Google. Beh, dai, ti spiega cose molto legali, mettiamola così. Poi, i problemi che vengono risolti sono assolutamente ridicoli, molte cose sono legate a Tinder, stranamente, ironicamente, Whatsapp. Noto molte cose legate ad evitare di dare i propri dati personali, quindi evitare di dare numeri, evitare di dare e-mail. Sì, cancellare sottoscrizioni che non so come cancellare. Teoricamente, in Europa dovremmo essere a posto perché tutte le sottoscrizioni per la questione GDPR dovrebbero essere facilmente eliminabili dall’utente stesso. Ecco, vedi anche lettere per chiedere rimborsi, quindi lettere scritte correttamente per chiedere dei rimborsi. Eh sì, è interessante. Comunque, vedremo che fine farà sto servizio, magari poi aggiorneremo gli utenti se ci sono novità.

2. La nuova versione di ChatGPT: più intelligente e con nuove incredibili funzioni, come la capacità di riconoscere immagini

Bene, passiamo alla prossima notizia, che è quella più grossa, cioè ragazzi, ChatGPT vi può vedere. Cioè, ChatGPT ha gli occhi adesso. Fatemi spiegare: praticamente, la nuova versione di ChatGPT che è stata annunciata e rilasciata in parte ieri, è, in primo luogo, esponenzialmente più intelligente di quella precedente, e, in secondo luogo, ha delle feature che sono assolutamente incredibili, come, per esempio, la capacità di riconoscere le immagini e darti una risposta secondo le immagini che tu gli mandi. L’esempio più assurdo che adesso vi farò vedere è praticamente durante lo stream, in cui, cioè, la live, la diretta in cui hanno annunciato questa feature, hanno fatto vedere che il developer di ChatGPT gli mandava una foto di uno scarabocchio, di quello che doveva essere il design di un sito, uno scarabocchio fatto malissimo. C’è proprio un quadrato con dentro due quadrati e due scritte. Ha fatto la foto col telefono, live in diretta, al design. L’ha caricata su ChatGPT, gli ha detto “scrivimi il codice”, non solo HTML, ma c’era anche del Python, del Java, cioè può essere Java, scrivete CSS, immagino abbastanza avanzato per lo sviluppo del sito, per creare questo sito che io ti ho dato, che è solo una bozza, e lui, in cinque secondi, gli ha sputato fuori il codice HTML, Java, che lui poi ha testato sempre in diretta per vedere se gli faceva vedere il sito che voleva. Andiamo a vedere velocemente la clip: da sketch a sito web.

Creazione di un sito web da uno scarabocchio: la potenza di ChatGPT

Ecco, praticamente, sta facendo vedere lo scarabocchio che ha fatto del sito. Adesso ne fa una foto col telefono. Perché sono tutti pelati? Anche noi abbiamo Aranzulla che è pelato, tutti pelati. Perché non gliene frega niente dei capelli, probabilmente sono troppo concentrati su quello che fanno. Ecco la foto dello scarabocchio vista da vicino e contiene il titolo “Il mio sito web scherzo”, cioè il mio sito web finto. Poi adesso qua non si capisce, cioè questa è proprio… la cosa strabiliante è che questa è proprio anche calligrafia da medico, da dottore, che non capiresti mai cosa c’è scritto. Io vivo in Inghilterra da sei anni e non ho problemi di solito di conoscere la calligrafia, nonostante il linguaggio e questo è totalmente illeggibile. Andiamo a vedere qual è il risultato di questo scarabocchio illeggibile. Ok, quindi vedi, gli ha dato CSS, JavaScript e HTML. Ed ecco qua il sito. Il sito è chiaramente basico. Adesso questa qua che vedete in alto è semplicemente un’interfaccia che ti permette di vedere il codice del tuo sito mentre ne vedi anche una, come si dice, un’anteprima in basso. Chiaramente, questo non sarà il sito finale, ma fate finta che non ci sia questa barra enorme in alto con il codice, ma ci sia solo il sito. Il sito è chiaramente semplicissimo, basico, primitivo, però ci sono comunque già dentro delle feature che non sono facili da implementare, come i bottoni, la giusta formattazione del testo, che non è il tipico H1 con la scrittura Word. E quindi è pazzesco come da una foto è riuscito a tirare fuori un sito.

Perché questa nuova funzionalità di ChatGPT4 non è ancora disponibile? ChatGPT4 è la quarta versione, la quarta iterazione di ChatGPT. Come tutti i software e programmi, ChatGPT passa attraverso una serie di evoluzioni, iterazioni e aggiornamenti, come ad esempio Windows 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o macOS 10, 11, 12, eccetera. Come ChatGPT, passa attraverso aggiornamenti che poi vengono pubblicati nella versione finale. Al momento, è stata rilasciata la beta di ChatGPT-4. Tuttavia, nemmeno la beta di ChatGPT-4 ha questa funzionalità implementata perché questa funzionalità è ancora in fase beta di sviluppo. ChatGPT-4 è il nuovo modello più intelligente di cui parlavo prima, ma questa funzionalità di riconoscimento delle immagini non è disponibile neanche per chi ha accesso alla beta esclusiva. La funzionalità è privata perché ancora è in fase di sviluppo.

Ok, quindi il mio lavoro ce l’ho ancora per qualche mese. Per qualche mese. Poi basta, ehi ChatGPT, creami il sito, creami il blog, via, fuori dalle palle. Un altro esempio per farvi capire, diciamo, la differenza tra il ChatGPT che usate, che magari usate adesso al lavoro o in ufficio o a casa e il ChatGPT che esiste adesso, un buon esempio per far capire, diciamo, che poi non è davvero un buon esempio, è un esempio perché poi è molto meglio se andate a testarlo voi stessi, capite quello che può fare per voi. E un esempio di m***a però vi fa capire che diciamo è già più cosciente dei comandi che gli dai.

La dimostrazione delle capacità di ChatGPT nella creazione di riassunti con restrizioni linguistiche

Per esempio, in questa dimostrazione che fa sempre parte del livestream cioè la presentazione in diretta, lo sviluppatore gli chiede col modello vecchio, quello che siamo tutti abituati ad usare: “creami un sommario di questo articolo”. Per esempio, fate finta di aver preso un articolo dal Corriere. Gli date il testo dell’articolo del Corriere della Sera e gli dite: “fammi un sommario di questo articolo in 100 parole però usando solo la lettera A o usando solo la lettera G”. ChatGPT3.5, che è la versione che siamo tutti abituati ad usare, che usiamo tutti fino adesso, faceva fatica molto spesso, ignorava totalmente questo tipo di comando e faceva direttamente l’output senza darti quello che volevi. Invece, questa dimostrazione fa vedere come c’è ChatGPT3.5, non lo fa. Invece c’è ChatGPT4, ti tira fuori un riassunto di questo testo in cui tutte le parole hanno la lettera G come inizio. Ecco, vedete qua: gli dice “riassumimi questo articolo in una frase, neanche in 100 parole, dove ogni parola inizia con la lettera G” e la risposta è GPT4. Genera groundbreaking che adesso adesso non mi metto a tradurre tutto perché altrimenti rimaniamo fino a domani. Dice GPT4: “generates groundbreaking, grandiose gains greatly galvanizing, generalized AI goals”. E hai, però aspetta adesso ci arrivo, esatto adesso ignorate le AI, ma come vedete non è semplice inventarsi una frase da un riassunto che sia coerente con il testo perché tutti questi argomenti, queste keyword, queste parole chiave sono contenute nell’articolo e hanno coerenza con quello che è l’argomento dell’articolo e in più usare solo la lettera G. Io non ce la farei mai neanche se mi dai una settimana ad essere tirati fuori una frase con solo lettera G che riassume un articolo.

Ma io già faccio fatica, sai quando si gioca a quei. giochi dove devi trovare tutte le parole che iniziano con quella lettera che in quel minuto non ne vedi neanche mezza, poi dopo guardi meglio la scheda o il disegno che stai guardando e ne trovi 800.000 e dici “ma porca vacca”. E vabbè, siamo in due essere nati stupidi Riccardo, che ci vuoi fare? Vabbè, sei timido, puoi anche farlo, però manca il gioco. No, ma io sono coscientissimo di essere stupido e non me ne lamento. L’importante è essere consapevole. Esatto, e poi, chiaramente, come diceva Riccardo, bara perché ChatGPT non è perfetto, ma è anche quella la sua forza. C’è il fatto di non essere troppo programmato, ma essere in grado di piegare le regole richieste per darti delle risposte umane, perché così sono anche gli umani. No, gli umani piegano le regole per darti la creatività. Sta tutta appunto nel piegare le regole. Così fa ChatGPT e quindi gli dice, lo corregge, gli dice “guarda che la parola ‘AI’ non conta, stai barando” e chiaramente ChatGPT gli dà una risposta perfetta in risposta al suo commento. – Ah, ho fatto solo “AI”, non vedo bene la schermata, ma… – No, no… – …ha proprio cambiato… – Ah sì, l’ha solo rimossa… – L’ha solo rimossa, vedi? – Sono rimossa… – Ah, adesso è risolto… Tu mi rompi i…, io ti rimuovo la parola, adesso hai anche qualcos’altro da dire… –

Le potenzialità di ChatGPT-4 nella gestione di input di grandi dimensioni

Sì, questo è un esempio, chiaramente banalissimo, perché questo è solo, diciamo, la punta dell’iceberg di quello che ha ChatGPT4 può fare. Se poi vogliamo parlare di altre cose che sicuramente vi saranno utili nella vita di tutti i giorni che ha ChatGPT4, ma che ha ChatGPT3.5 non era in grado di fare, c’è per esempio il fatto che ha ChatGPT4 riceve in input, cioè potete scrivergli un numero di lettere molto più elevato di quello che potevate fare con GPT3.5, cioè ha ChatGPT3.5 prendeva, se non mi ricordo male, il massimo 4.000 caratteri in un input. Ciò voleva dire che, per esempio, se volevate dargli un lungo articolo da riassumere o volevate scrivergli un testo molto lungo da correggere grammaticalmente, dovevate separarli in messaggi separati e comunque, GPT3.5 faceva fatica a ricordarsi magari a volte il testo che gli avevi dato prima o che gli avevi dato dopo. Invece, ChatGPT4 riceve, se non sbaglio, addirittura fino a 32.000 parole o più, 42.000 parole, che adesso io non ho neanche guardato visivamente a quanto corrispondono, ma so che ho provato a dargli degli articoli molto lunghi di una o due pagine e non fa nessuna fatica riceverli. E quindi, cosa vuol dire? Capito? Rimuove una difficoltà enorme che c’era prima di dover dividere gli input in input più piccoli da dargli, e ciò creava anche delle difficoltà nel modo in cui ChatGPT in sé, diciamo, elaborava queste richieste, perché chiaramente è più efficiente dargli una richiesta unica che dargliene mille separate sullo stesso argomento.

Le nostre riflessioni su ChatGPT e le sue versioni

Volevo chiederti, ma secondo te queste future in più saranno poi disponibili per tutti, o stanno iniziando a differenziare il free dalla versione Plus? Allora, da privilegiato che sono, siccome ho tantissimi soldi, come sa benissimo Riccardo, navigo nei soldi e quindi sono un felice possessore della versione Plus di ChatGPT, anche perché altrimenti non potresti usarla. La versione 4, che costa ben 20 dollari al mese ragazzi, ci credete che costi tanti soldi o no? Beh, per il lavoro che ti fa risparmiare direi che ne vale assolutamente la pena, sì che vabbè. Cosa costa? Meno di Netflix? Meglio un abbonamento a ChatGPT che un abbonamento a Netflix. I possessori dell’accesso plus a ChatGPT hanno anche accesso alla preview, che vuol dire anteprima di ChatGPT4 e quindi io ho già accesso alle feature di ChatGPT4. A parte, come dicevo prima, la feature che riguarda il riconoscimento delle immagini che quella non è ancora stata implementata. Un’altra cosa interessante da notare è il fatto che comunque l’intelligenza di ChatGPT4 è ancora limitata al 2021, cioè non è ancora come ChatGPT3.5, è ancora limitato, cioè la sua conoscenza del web, dei testi a cui è stato allenato, si ferma al 2021, quindi non vi aspettate che ChatGPT4 adesso sappia informazioni più aggiornate di quelle che aveva ChatGPT3.5. Essendo un modello di linguaggio altamente complesso e comunque aperto al pubblico, loro non possono permettersi di avere una versione costantemente aggiornata, quindi anche con molti più problemi, perché come Riccardo sai benissimo tu che lavori nell’IT, ogni versione di un software, se tu usi sempre la versione più aggiornata, ok tutte le feature più nuove, l’ultimo, credo però molto spesso cosa succede che anche i problemi che non sono stati ancora risolti di queste nuove feature? La maggior parte delle volte, anzi, il problema diventa ancora più grande perché magari non lo risolvono, lo lasciano da parte, dicendo tanto sono pochi gli utenti che hanno questo problema e se lo portano dietro, se lo trascinano a volte per anni, addirittura non solo per poche versioni.

Sicurezza e responsabilità nell’utilizzo di ChatGPT: il rischio delle interpretazioni errate

Esattamente, poi comunque ChatGPT è più pericolosa di una normale applicazione per scrivere o di un registratore vocale perché molte persone al giorno d’oggi si affidano già a ChatGPT per avere risposte. Sai adesso chiaramente, una persona con un po’ di senso critico non si affida a ChatGPT per avere delle risposte, diciamo, su cose delicate come argomenti legali, medici. Però uno può metterla come vuole, ma ci saranno sempre delle persone che insistono a voler usare questi software per risolvere problemi legali, medici e quindi, chiaramente, non puoi rilasciare un software che c’è pericolo che queste persone utilizzino in maniera non sicura per fare queste cose al pubblico. È per questo che ci fanno aspettare così tanto a rilasciare, da un modo o dall’altro, perché devono testarne la sicurezza, devono assicurarsi che non dia risposte che poi possono essere interpretate nel modo sbagliato dagli utenti che magari non sono tanto… Purtroppo, in molti ambiti, soprattutto quando si tratta appunto di salute, spesso la gente si affida al web senza sapere chi c’è dietro e chi scrive determinate cose. A volte può essere un medico, altre volte può essere qualcuno che si spaccia per un medico… Sì, e quindi aziende come ChatGPT e Microsoft, che ormai hanno larga parte dello stake, cioè responsabilità su quello che fa OpenAI e ChatGPT, devono proteggersi dall’imminenza e dalla stupidità delle persone, perché quanti casi avete sentito di persone che hanno usato dei prodotti che non andavano usati in un certo modo e hanno poi fatto causa alla compagnia che li produceva dicendo “Ah voi non mi avete detto che devo fare così, cosà, quindi colpa vostra se io adesso mi sono bruciato la gamba”. Colpa vostra se io non ho letto il bugiardino della medicina. Sulla maggior parte delle medicine, se non mi sbaglio, anche l’aspirina o l’oki, c’è scritto che può causare morte, ma la maggior parte della gente non lo sa. Come dicevamo prima, l’importante è esserne consapevoli e in determinate situazioni prestare più attenzione. Sì, prestare attenzione, rimanere un po’ allerta a non fare le cose con gli occhi chiusi.

ChatGPT e la sfida dell’interpretazione di immagini: un esempio di riconoscimento di prodotto

E a proposito degli occhi chiusi, se ritorniamo all’argomento di ChatGPT in grado di riconoscere le foto: un esempio estratto da ChatGPT4 mostra come un utente ha inviato una foto di un cavo collegato, un cavo VGA che non può essere collegato al telefono. Come fa a collegarlo al telefono? Ah, è un mockup con un cavo dell’iPhone dentro, va bene. Gli ha dato questa foto di questa roba attaccata al telefono e gli ha chiesto che cos’è. E come vedete, ChatGPT gli ha dato una risposta perfetta su quello che la foto mostra: l’immagine mostra il packaging di un prodotto che si chiama Lightning Cable. Che per di più, non penso che ci sia… Ah si, è scritto in basso in inglese, ecco, Lightning Cable con tre pannelli. Non so a cosa si riferisce con tre pannelli. Ah, pannello 1 sono le immagini… Sono i connettori che poi… No, pannello 1 vedi che ha tipo 3… Ah, 3 immagini, quindi dice… Quindi è stato in grado di riconoscere il fatto che le immagini hanno 3 quadranti e non solo 1, cioè è come tipo una sorta di collage d’immagini, al posto che esserne di uniche. Gli dice nel collage 1 c’è il telefono con il cavo attaccato, nel collage 2 c’è il packaging. Però vedi che non l’ha riconosciuto? Che dice tipicamente con 15 connettori a pin, eccetera. Quindi lui l’ha proprio scambiato per un cavo VGA. Ah sì sì, e beh comunque c’è… Che ci sta, come l’abbiamo scambiato noi. Anche io pensavo fosse un cavo VGA all’inizio, ho detto ma come si fa con un cavo VGA all’iPhone? Comunque c’è, a parte, chiaramente, come l’esempio di prima del fatto che ti lasciava fuori, sai, le AI dalla rima delle G o eccetera. Cioè chiaramente ChatGPT non è mai perfetto e anche per quello che la gente deve essere cosciente del fatto che l’output di ChatGPT non è perfetto e quindi non è che tu puoi mandare lettere legali o lettere al tuo capo, lettere al capo dei tuoi capi scritte di ChatGPT senza guardarle. Chiaramente dovete sempre andare a controllare l’output e assicurarvi che quello che vi manda assicurarvi che sia corretto. Nel terzo punto comunque lo dice che c’è il connettore dell’iPhone, ha riconosciuto il connettore dell’iPhone addirittura rispetto a un type-C normale, semplicemente a malapena si vede, esatto, che poi come lo vediamo noi con l’occhio umano lo vede lui ma il design del cavo iniziale era palesemente quello di un cavo WGA o VGA, io non ho mai capito come si pronuncia, sono un informatico da 12 anni.

La collaborazione con Vision B: il riconoscimento visivo in ChatGPT4 e le aziende che già lo utilizzano

Comunque questa tecnologia di riconoscimento visivo, che poi come vi dicevo non è nemmeno la feature più interessante di ChatGPT4, perché dovete andare a provarlo per capire quanto è diverso. Se siete utilizzatori di ChatGPT vi renderete conto subito di quanto è superiore, ma a parte questo, la feature di riconoscimento visivo che è stata implementata in ChatGPT4 è il frutto di una collaborazione con un’azienda che si chiama Vision B, se non sbaglio. In questa pagina fa vedere a proposito interessante da discutere, fa vedere diciamo aziende che stavano già utilizzando GPT4, cioè il modello che per il pubblico è appena uscito, ma molte aziende avevano già accesso a questo modello e lo stavano già utilizzando come implementazione nelle loro app. E vediamo, per esempio, Stripe, che lo usava per implementare il codice del loro portale di pagamenti. Poi, chi c’era? Be My Eyes, questa è l’azienda che si occupa di fornire a OpenAI e a ChatGPT l’applicativo, cioè l’integrazione che permette poi a ChatGPT di vedere. Duolingo, sì Duolingo, ho sentito che è praticamente una famosissima app per imparare le lingue. Adesso ha un’integrazione basata su ChatGPT che ti permette di avere delle conversazioni nella lingua che vuoi imparare con l’app, praticamente come se tu parlassi con madrelingua, nella lingua che vuoi imparare, e ti corregge magari gli errori che fai e ti aiuta a imparare l’inglese più velocemente.

L’utilizzo dell’integrazione di ChatGPT in altre applicazioni: il caso delle startup e delle app come Shortly

Ecco, l’ultima cosa di cui volevo parlare, che può essere un argomento interessante legato appunto all’utilizzo dell’integrazione di ChatGPT in altri applicativi. Ne discutevamo l’altro giorno io e Riccardo è interessante pensare comunque che ci sono tantissime aziende che usano le API, uno strumento che ti permette di connetterti ai server di ChatGPT per utilizzare le feature di ChatGPT nella tua app, nella tua applicazione, nel tuo software. Quindi ci sono moltissime aziende appena nate che si chiamano comunemente startup in informatica che utilizzano, che sono nate solo grazie all’implementazione di ChatGPT nei loro programmi. Il problema qual è? Che ci sono una marea di applicazioni come questa che si chiama Shortly, che praticamente è un’applicazione famosissima che si occupa esclusivamente di scrivere saggi, compiti a casa o brevi articoli. Questa applicazione si basa chiaramente sull’integrazione di OpenAI e l’unica cosa che fa la differenza di ChatGPT è il fatto che riesce a elaborare testi più lunghi e prendere magari degli input più complessi. Però si basa comunque sul software fornito da OpenAI.

Esempio di problemi causati dall’utilizzo di API gratuite e possibili soluzioni per le aziende

In questa applicazione, supponiamo che due ragazzi come io e te, che sanno bene di web development, decidano di creare un sito semplicemente utilizzando l’API e dando dei prompt specifici, in modo da avere questo tipo di applicazioni esistenti sul sito. Tuttavia, utilizzano la versione gratuita dell’API, che effettua richieste limitate e lente al software di OpenAI e ti fornisce una risposta lenta. Comunque, ti fornisce dei risultati che possono aiutarti a creare una clientela, un pubblico di persone interessate alla tua app. E bene, tra un mese OpenAI potrebbe dire “no ragazzi, guardate, noi eravamo in prova, stavamo aprendo la nostra applicazione al pubblico, appunto perché ci servivano i dati di testing. Tuttavia, tra due mesi chiudiamo tutto e, da domani, se volete usare le API, dovrete pagare 150 centesimi a richiesta, che sono tantissimi, per continuare a utilizzare l’app, per continuare ad utilizzare l’API nella vostra applicazione”. Queste aziende chiudono. Il problema, quindi, è: cosa fanno queste aziende? Chiudono, si adattano, mettono anche loro dei pacchetti a pagamento dove… o hanno abbastanza profitto da quello che fanno, oppure chiudono.

E il problema è che di queste aziende, ragazzi, ce n’è a migliaia, perché ci sono interi siti che Riccardo mi ha fatto vedere, che riportano appunto liste di nuove app basate sull’AI, e vi garantisco che il 90% di quelle app si basano su un’integrazione di questo tipo: semplice web development, cioè sviluppo di un sito collegato con le capacità di OpenAI e ChatGPT per fare una web app, cioè un’app online. Ma c’è pochissima conoscenza da parte di questi sviluppatori del funzionamento di ChatGPT. È solo una questione di collegare le due cose e fornire un servizio leggermente diverso da quello che fa ChatGPT. E quindi, queste migliaia di compagnie che esistono, quando OpenAI decide di cambiare il modello di guadagno, capito, ci sarà un colpo… Sì, che adesso sono 20 dollari al mese per utilizzare le API a oltranza, magari un domani appunto ti mettono “ok, con 20 euro tu hai 200 richieste che puoi fare a ChatGPT. Vuoi mille richieste? Ne paghi 30, vuoi 10.000? Ne paghi 100”. Che poi è un po’ quello che è successo anche nel boom del web: sono nati migliaia e migliaia di siti e poi però quando la gente si è accorta che se abbiamo tutti i siti online bellissimo, però non è che tutti i siti ci portano davvero soldi, oppure i costi iniziano ad aumentare e allora la metà di queste presenze web hanno dovuto chiudere. Parliamo anche di business grossi, capito? E quindi è una cosa da pensare interessante e probabilmente è un segno che possiamo aspettarci sì una grossa bolla economica dovuta anche alle AI ma bisogna anche… Ma come per tutto verranno poi filtrate e si filtreranno da sole un po’ come anche nel mondo. Cioè nel mondo cripto se vogliamo parlare di qualcosa che esploso recentemente, dopo l’ultimo crash dei mercati finanziari e tutto quanto molti token sono spariti. Infatti queste aziende devono stare attente alla sostenibilità del business che propongono perché sai è facile per due ragazzini. che conoscono web development proporre un servizio ma non pensare poi alle conseguenze.

3. Microsoft rivoluziona la suite Office con l’integrazione di ChatGPT: la svolta dell’AI nel lavoro quotidiano

Comunque, passiamo al prossimo argomento perché su questo ci possiamo stare anche per due giorni interi e comunque pubblicheremo articoli sul blog a riguardo se poi dovessero saltare fuori altri argomenti, probabilmente ne parleremo anche in altri video perché sono temi che man mano si riprenderanno. A proposito, oggi è mercoledì 15 e giovedì 16 la Microsoft ha in programma un evento in cui si dice che abbia intenzione di rilasciare una versione della sua suite Office Windows, Word ed Excel, con integrazioni AI come ChatGPT. Il momento in cui vedrete davvero il cambiamento, la vera bomba che farà svegliare tutti, sarà quando nessuno più potrà dire “Ah sì, le AI, ok va bene, sì esistono, molto bravi, si”. Sarà il momento in cui la gente dovrà smettere di ignorare queste tecnologie, anche quelli che sono rimasti indietro. Sarà il momento in cui Microsoft inserisce ChatGPT in Word, Excel e PowerPoint. E non dimenticare Outlook. Quando questa tecnologia sarà implementata in Word, tutti saranno esposti, anche quelli che sono troppo impegnati, non hanno voglia di informarsi, non gli interessa. Anche loro saranno esposti, perché in ufficio tra qualche mese o un anno si troveranno installata una versione di Word che al posto di scrivergli, a Word gli dice: “Scrivimi questo”, e lui te lo scrive, capito? Quindi tutti saranno esposti a queste tecnologie e sai che eccitamento ci sarà chiaramente, sarà come un virus che si espande a quel punto e dall’inizio verrà preso in considerazione da molte più entità e persone. Diventerà il momento, l’inizio del Big Bang. Potrebbe essere domani.

L’uso di ChatGPT come insegnante e le sfide del sistema scolastico

Beh, io ho scoperto ieri che un cliente che già lo sta utilizzando per il figlio che deve fare i compiti. Un adulto che permette al figlio di utilizzare ChatGPT, ma semplicemente perché, giustamente, sono anche io dello stesso parere, ormai il sistema scolastico è talmente indietro che ti rifilano talmente tanti compiti che il bambino non ha neanche più tempo libero. Sicuramente, io mi fido di più di ChatGPT come insegnante, che è un insegnante medio italiano. Esatto, lo sta usando magari per chiedere informazioni su determinate cose, per risolvere alcuni problemi, per trovare soluzioni alternative alla risoluzione di problemi non… Sì, perché ChatGPT è capace di agire come insegnante. È pieno di gente online che lo usa per imparare la lingua, imparare la matematica, è solo questione di sapere cosa chiedergli. E in più, ti dà appunto soluzioni alternative a un metodo che ormai, io sinceramente, ho sempre ritenuto obsoleto.

4. L’upscaling di immagini e video: le potenzialità della tecnologia TopazVideo.

In ultimo passiamo ad un argomento un po’ più leggero, giusto per chiuderla con le questioni esistenziali sull’educazione e altri argomenti pesanti. Parliamo di una cosa che potrebbe entusiasmare chi come me o come Riccardo ha una larga collezione di filmini di famiglia girati con le telecamere. È così bello vedermi in quanto son ciccione da piccolino. Se adesso mi fai vedere in 4K la cosa potrebbe non piacere. Praticamente questa azienda che si occupa di quello che viene detto upscaling, cioè l’ingrandimento di immagini a bassa risoluzione. Allora, quando una persona fa un ingrandimento di un’immagine, chiaramente come sapete tutti, non basta ingrandirla, perché un’immagine ingrandita comunque lascia degli artefatti, delle imperfezioni, perché è come se voi vi avvicinassi a una foto e voleste che avvicinandovi a una foto vi desse più dettagli in quel punto della foto, ma non funziona così ed è la stessa cosa per le immagini digitali quando le immagini digitali vengono allargate, chiaramente non è che vedi più dettagli di quelli che già esistono e l’upscaling sta proprio nel fatto di allargare l’immagine ma poi attraverso tecnologie software o appunto AI creare quei dettagli in più che tu volevi vedere nell’immagine. Questa azienda che si chiama Topaz si occupa proprio solo di questo tipo di prodotti, cioè crea prodotti per l’upscaling delle immagini, l’upscaling dei video, l’upscaling delle foto e hanno rilasciato questa nuova versione del software che si chiama TopazVideo che ha lasciato me e Riccardo totalmente allibiti per quanto riguarda le potenzialità dell’upscaling di vecchi video o di elementi a estrema bassa risoluzione. E questo youtuber fa vedere come lui ha registrato con una di queste vecchie videocamere di famiglia mini dv VHS e poi ha usato questo software che si chiama TopazVideo e ne ha creato una versione che ha la qualità di un moderno iPhone 14, cioè è una cosa che io ancora non ci posso credere, cioè ancora ho dei dubbi che questa cosa sia vera e voglio testarla personalmente.

La possibilità di migliorare la qualità dei vecchi filmati grazie all’intelligenza artificiale

Un filmino girato nel ’94 può essere elaborato da un AI per risultare della stessa qualità di quello che potrebbe essere un filmato girato con l’iPhone 15 o il Samsung Galaxy più figo che c’è sul mercato in questo momento. La fotocamera migliore che esista al mondo. Mettiamola così. Sì, cioè è veramente pazzesco. A livello amatoriale intendo, non fotocamere o comunque cineprese da cinema. Ad oggi se vai a comprare una fotocamera da 300 euro già puoi ottenere video in 4K o in 8K. Quando ci guardano questi video, quello che più fa notare la qualità di questa conversione è quando si guarda, per esempio, l’acqua. Si vede che l’acqua che è difficilissima da… l’acqua è ricca di dettagli e, per di più, sono dettagli in continuo movimento. Sono dettagli che si muovono e cambiano costantemente, quindi il lavoro che deve fare questa AI è allucinante, non so come altro descriverlo.

Quindi, come diceva Riccardo, chi ha dei filmini a casa vecchi, è sicuramente un esperimento che vogliamo fare io e lui. Può tranquillamente cercare di avere una versione aggiornata e sarebbe molto interessante vedere che tipo di emozioni ti danno una volta che li vedi poi in alta qualità o nella qualità di cui siamo abituati al giorno d’oggi. Sarebbe veramente strabiliante. Che poi da quello che mi avevi spiegato non è una questione di caricare il file. Lui fa tutto in automatico. Comunque c’è molto lavoro dietro. Bisogna prendere in base alla scena, capire quale filtro mettere, come modificarlo. Sì, c’è un sacco di impostazioni, di prove da fare. Chiaramente, una persona più tecnologicamente “versata” ha meno difficoltà. Poi, chiaramente, nel tempo, questi software stanno diventando sempre più semplici. È solo questione di anni o mesi prima che esca una versione che tu trascini il file, il video dentro e ti fa il video… Sì, in automatico ti rileva se è uno spazio aperto, quindi se usare un determinato filtro. Se è acqua, usare un altro. Se magari la maggior parte dei filmini sono in casa mentre i genitori ti spogliano, che non ho mai capito perché.

5. Epilogo e saluti da MiniMaxAI

Questa era l’ultima news di cui volevamo parlarvi, anche perché il tempo ormai è passato. Siamo qui da un’ora e mezza e stiamo parlando troppo o troppo poco, dipende dai punti di vista. Spero che vi siate divertiti, che le notizie che vi abbiamo portato possano in qualche modo givoare anche a voi ed esservi utili. Esatto, essere utili. In ogni caso, se avete domande o dubbi, potete sempre commentare. Ricordatevi di mettere un like se il video vi è piaciuto e soprattutto seguiteci per tutte le nuove uscite che ci saranno da qui a quando avremo voglia di fare i podcast. Grazie ancora per averci guardato e ci vediamo al prossimo podcast. Ciao a tutti! Ciao!

Lascia un commento