Google lanserer også bildegenereringsverktøy.
Liker det eller ikke, AI – eller kunstig intelligens – fortsetter å utvikle seg i et imponerende tempo. Google annonserte nettopp at Gemini Pro har lansert globalt, noe som betyr at den er tilgjengelig i over 230 land og over 40 språk. Endelig hører også Norge hjemme her.
Gemini Pro er enkelt forklart som en mer avansert versjon Chatbot Bard fra Googleog burde trolig ha bedre ferdigheter i avansert argumentasjon, planlegging og generell forståelse av ulike temaer.
I tillegg må den kunne ta hensyn til tekst, bilder, lyd, video og kode når den genererer sine svar, så det er en såkalt «multimodal» modell.
Gemini Pro har vært tilgjengelig på engelsk i noen måneder nå, men Bard bør forbedre seg på andre språk også.
Fra tekst til bilder
Samtidig annonserte Google ankomsten av et generativt AI-verktøy for bildegenerering. Dette bør gjøres direkte gjennom Bard og bruker det Google kaller tekst-til-bilde-teknologi. Figur 2.
Denne teknologien er ment å tilby en grei balanse mellom fotorealisme og hastighet.
Google opplyser også at alle bilder som lages er vannmerkede ved bruk av selskapets eget vannmerke. Synthesizer ID– teknologier. Dette sikrer at disse bildene kan identifiseres som genererte, samtidig som de ikke er synlige for vanlige mennesker.
Gjennom verktøyet får vi også et alternativ til å bruke Bard til å generere bilder ImageFX. Grunnteknologien er den samme, men verktøyet er ment å kunne gi forslag for å forbedre eller modifisere det genererte bildet.
Som sognebarn på det europeiske markedet må vi vanligvis vente en stund, siden fotografering med Bard er begrenset til USA og noen andre regioner foreløpig.