Anem a explicar-te què és Google Gemini, el nou model d’intel·ligència artificial creat per l’empresa del cercador. Ho farem explicant-te les seves principals característiques d’una manera que sigui fàcil d’entendre, i que així puguis comprendre per què és un llançament tan important.
Què és Google Gemini?
Gemini és un model d’intel·ligència artificial creat per Google, i que busca liderar el competitiu mercat de la intel·ligència artificial. Els models d’intel·ligència artificial no són les aplicacions o bots com Google Bard, sinó que són la tecnologia amb la qual aquests funcinan.
Gemini és un model multimodal, que podrà entendre diversos tipus d’informació, tant els textos que li escriguis com les imatges, i també podrà entendre àudio i codi de programació. Això ho convertirà en un model extremadament flexible.
Com funciona Google Gemini?
Els models d’intel·ligència artificial són entrenats de manera intensiva amb una gran quantitat de dades. Es recopilen dades de tota Internet, i se li donen als algorismes d’entrenament perquè aquest sistema de llenguatge aprengui a entendre les coses que li diguem, tingui dins de si mateix la informació amb les respostes, i aconsegueixi generar respostes escrites que siguin naturals.
En el cas de Gemini en concret, Gemini ha estat dissenyat des de zero per Google. Des del principi ha estat creat com un model multimodal. Això vol dir que no se li ha entrenat per a entendre una font com el text, i després se li ensenya a transformar altres fonts a aquesta primera. El seu entrenament ha estat distint.
Aquest model s’ha entrenat ja des del principi per a combinar diferents modalitats de manera nativa. Això vol dir que podrà entendre tant un text com un dibuix que li fem en temps real. Segons l’empresa del cercador, també és capaç de relacionar objectes en temps real i suggerir cançons a mesura que li donem indicacions.
Gemini també introdueix nou sistema de generació de codi anomenat AlphaCode2. Aquest sistema millora la comprensió de matemàtiques complexes i la teòrica de ciències de la computació. També s’ha millorat el raonament i la seva capacitat d’entendre codi, de manera que hi hagi menys «al·lucinacions» i les respostes siguin més fiables.
¿ChatGPT o Gemini? Diferencias de IA, comparativa y cuál es mejor en 2024
Què és ChatGPT?
ChatGPT és el bot de OpenAI que està basat en arquitectura GPT (Generative Pre-*trained Transformer), sent un sistema que és capaç de crear llenguatge natural, converses, text, informació i fins i tot traducció instantània i amb un funcionament realment molt bo.
Es va llançar en 2022, punt de partida en el qual altres empreses, entre les quals estava Google, van començar a desenvolupar els seus sistemes més veloçment, ja que ChatGPT va sortir amb més potencial del que s’esperava.
Actualment, té una versió gratuïta que funciona amb GPT-3.5 i de manera limitada amb GPT-*4o. Existeixen dues versions de pagament, una anomenada Plus per 20 dòlars al mes i una altra denomina Team que val 25 dòlars mensuals.
¿Qué es Gemini?
Gemini va substituir a Bard al desembre de 2023, convertint-se en la nova intel·ligència artificial de Google. En el recent Google I/O de 2024 va tenir un bon nombre d’actualitzacions, presentant diferències respecte al que era Gemini fins a aquest moment.
- Gemini 1.5 Flaix: és un model que fa que les respostes de Gemini sigui molt més ràpides i estiguin millor optimitzades.
- Gemini 1.5 Pro: és on majors actualitzacions va realitzar, ja que s’han carregat nous sistemes de traducció, maneig del codi i millorat substancialment el raonament. Amb tot això es pretén que sigui capaç de manejar tasques molt més complexes, fent que tot resulti molt més fluid.
En què és millor ChatGPT?
Existeixen unes certes parts on ChatGPT ha mostrat ser millor que Gemini, a l’espera que totes les actualitzacions que tots dos han promès s’incorporin de manera definitiva i a ple rendiment.
Es pot dir que ChatGPT avança a Gemini en:
- Impacte social: en popularitat, ChatGPT està bastant per sobre de Gemini, que en ser relativament nou, encara no ha arribat a tants usuaris com sí ho ha fet el ‘bot’ de Open AI.
- Conversa: per naturalitat i per acompliment a l’hora de realitzar una conversa, resulta més efectiva i sembla més de “personal” la que s’aconsegueix amb ChatGPT.
- Plantilles: pel que fa a les plantilles o suggeriments per a realitzar un contracte, un currículum o una carta d’alguna mena d’imperatiu per a un estament legal, ChatGPT respon de millor manera.
- Traduccions: també està per davant en les traduccions, encara que no amb tant d’avantatge com abans, ja que Gemini compta amb una evolució del Traductor de Google, però, així i tot, el context i les expressions són més precises en ChatGPT.
- Creativitat: a l’hora de crear algun tipus d’escrit que requereix cert grau de creativitat, ChatGPT es comporta millor per a la invenció i el sentit de les històries.
- Xarxes socials: dels dos, ChatGPT és el que millor s’adapta a xarxes socials. És capaç de crear contingut basant-se en el tema que se li assigni per a crear diferents títols o frases per a l’una o l’altra xarxa social.
En què és millor Gemini?
L’excel·lent treball de Google amb la seva eina d’intel·ligència artificial i sobretot la velocitat al que ha realitzat és encomiable. Per descomptat, això es tradueix en diversos punts en els quals Gemini és millor que ChatGPT, avui dia.
- Versatilitat: és el gran punt fort de Gemini, ja que no sols es limita al text com ocorre en ChatGPT, sinó que és capaç de treballar amb imatges, àudio i un altre tipus de fonts d’informació, per la qual cosa en aquest sentit és summament complet.
- Anàlisi del text: és capaç d’analitzar els textos de manera més exacta i treure millor el detall, la qual cosa comporta un resultat menys generalista i molt més concret.
- Llenguatge més actual: el bo és que, en tenir una connexió directa a la informació, tot és actual i el tipus de resposta, depenent de la situació, es basa en unes formes més actuals, amb dades més pròximes a l’actualitat que en ChatGPT.
- Respostes més veloces: la velocitat és major en estar en línia, la qual cosa comporta resultats més ràpids, mantenint la coherència intacta.
- Imatges: el fet de poder manejar imatges, interpretar-les i gestionar-les, li dona un plus. Això és una cosa que l’usuari agraeix molt, ja que pot tenir informació no sols en text, sinó també visual.
- Enllaços de les fonts: el poder observar d’on s’ha tret la informació és una cosa que pot permetre a l’usuari entrar en l’origen per a fins i tot completar parts que reconegui que li poden ser útils. A més, això fomenta en gran manera la transparència.
Com es diferencia d’altres models de IA?
Gemini consisteix en tres sistemes distints, organitzats en el següent ordre d’acord amb la seva complexitat i capacitat multimodal:
- Gemini Ultra: aquesta és la versió més avançada, que ha superat, en diferents testatges, a experts en diferents matèries (des d’història fins a ètica), i promet ser la més intel·ligent en existència.
- Gemini Pro: aquesta és una versió una mica menys desenvolupada que la primera, però que té com a equivalent el que avui es coneix com GPT-3. És una mica més limitada en les seves funcions que Ultra, però es tracta de la més àmplia per a poder atacar moltes tasques que els usuaris podrien buscar resoldre amb Google Bard.
- Gemini Nano: encara que sembli la més senzilla, a la versió Nano en realitat la hi remarca com de les més revolucionàries per tractar-se d’un model que es pot implementar sense mediació d’una plataforma en un dispositiu. Això no té comparació en el mercat.
Com utilitzar sistemes que es potenciïn amb Google Gemini?
Ara com ara, el gegant tecnològic ha anunciat una aplicació escalonada de Gemini Pro en Google Bard. Es podrà utilitzar, primer, en anglès i solament en uns certs països del món, però amb el temps s’espera que expandeixi el seu abast.
En uns mesos, Google anunciarà el seu Bard Advanced, que contindrà un “motor” de Gemini Ultra, la veritat és que no es van anunciar dates exactes.
Gemini Nano, pel seu costat, arribarà als cel·lulars que utilitzin Píxel 8 Pro de Google i tindrà un sistema, anomenat AICore, per a ser implementat per creadors d’apps.
Gemini no tanca les seves aplicacions a Google Bard, sinó que també serà adherit a altres serveis i altres aplicacions del gegant tecnològic, com per al cercador, on podria aplicar-se en Google Ads, Duet AI i al mateix Chrome.
Programador de videojocs, Creador de pàgines Web, Desenvolupador d’aplicacions per Android.