Google ha presentado su último avance en inteligencia artificial “Gemini”, es un modelo de inteligencia artificial multimodal, no es sólo texto o imágenes, puede funcionar con audio y cualquier otro tipo de datos, lo que permite al usuario, tal y como se ha visto en la presentación oficial de Google, interacciones mucho más naturales y atractivas; casi como hablar con una persona real.
Desarrollada por DeepMind, una unidad de Google con sede en Londres, Google afirma que Gemini eclipsa al modelo más potente de ChatGPT, GPT-4, en 30 de 32 pruebas comparativas, lo que demuestra destreza en el razonamiento y la comprensión de imágenes. Sus capacidades son realmente avanzadas: desde generar texto creativo hasta responder preguntas complejas y traducir idiomas; su conjunto de habilidades es muy amplio.
Según la empresa, Gemini 1.0 está disponible en tres tamaños diferentes: Nano, que está optimizado para dispositivos móviles y desarrolladores de aplicaciones; Pro, que es el modelo por defecto diseñado para una amplia gama de tareas y clientes; y Ultra, el modelo de IA más sofisticado construido por Google y que aún está siendo sometido a pruebas de seguridad.
Bard, el chatbot de IA propiedad de Google, ya fue actualizado con una versión del modelo Gemini, dijo la compañía el miércoles, con planes para agregar Gemini a productos ampliamente utilizados, incluyendo el motor de búsqueda de Google y el navegador web Chrome, que son utilizados por miles de millones de personas en todo el mundo.