Google lanzó un nuevo conjunto de modelos de inteligencia artificial (IA) generativa que, por primera vez, funcionarán de manera directa en teléfonos móviles, lo que representa un gran avance en los esfuerzos de la compañía de tecnología para competir con rivales como OpenAI, creador de ChatGPT.
La empresa describió Gemini como su sistema de inteligencia artificial “más grande, más capaz y más general”, el cual puede analizar información de imágenes y audio y tiene sofisticadas capacidades de razonamiento y “planeación”. Ahora será la base del chatbot Bard de Google y se incorporará a su motor de búsqueda el próximo año.
Una versión de Gemini, conocida como nano, se diseñó en específico para funcionar en dispositivos móviles y se integrará en los últimos teléfonos Pixel de Google. La firma declaró a Financial Times que esta versión “se va a ejecutar de forma nativa” en el dispositivo y que el modelo nano se “optimizó para móviles, de modo que los desarrolladores de Android pueden crear con facilidad aplicaciones y funciones de inteligencia artificial que trabajen sin conexión o que utilicen (información) personal que es mejor mantener privada en el dispositivo”.
Este avance puede ayudar a responder a un problema económico con la tecnología. Ejecutar IA generativa con la potencia informática disponible en los teléfonos móviles, en lugar de hacerlo a través de la nube en servidores operados por grandes grupos, reducirá los costos de operar ese tipo de sistemas. También proporciona una capa de seguridad para quienes desean mantener los datos privados restringidos a un dispositivo.
“Creo que la transición que vemos ahora con la inteligencia artificial será la más profunda de nuestras vidas, mucho mayor que el paso anterior a los dispositivos móviles o a la red”, dijo el director ejecutivo de Google y Alphabet, Sundar Pichai, en una publicación en un blog. “Esta nueva era de modelos representa uno de los mayores esfuerzos de ciencia e ingeniería que hemos emprendido como compañía”.
La inteligencia artificial generativa abrió un nuevo frente en la batalla por el dominio de las grandes firmas de tecnología en Silicon Valley. El último sistema de Google se produce tras una serie de modelos lanzados por empresas, incluidas OpenAI, respaldada por Microsoft, Meta, y startups como Anthropic y Mistral, que son capaces de producir respuestas plausibles a preguntas en lenguaje natural: en texto, código, imagen y audio.
El mes pasado, el gigante empresarial Microsoft desplegó un asistente de inteligencia artificial, denominado Copilot, en su conjunto de aplicaciones de productividad Microsoft 365, que incluye Word, PowerPoint y Excel.
Google informó que Gemini obtuvo una calificación superior a 90 por ciento en un punto de referencia “estándar de la industria”, que evalúa los llamados modelos de lenguaje de gran tamaño, la tecnología subyacente a los productos de IA.
- Te recomendamos Google abre en España su mayor centro europeo de ciberseguridad Negocios
La firma agregó que Gemini fue el primer modelo de IA que superó a los expertos humanos en tareas determinadas, superando al modelo GPT4 de OpenAI en varias pruebas. En particular, puede resolver problemas de razonamiento matemático, analizar datos científicos y realizar programación avanzada. Google no proporcionó la comparación con el modelo GPT4 de OpenAI cuando informó a los periodistas, pero más tarde lo aclaró en un blog.
Gemini también se integrará en Bard, el chatbot de Google impulsado por inteligencia artificial, en inglés, disponible en más de 170 territorios, incluidos Estados Unidos, Asia y África, con planes de actualizarlo con un software más potente el próximo año.
Sin embargo, todavía no estará disponible en Europa o Reino Unido, lo que, según Google, se debe a obstáculos regulatorios.
“Estamos trabajando en eso con los reguladores locales… para asegurarnos de que estamos interactuando con esas personas antes de lanzarnos en cualquier área en particular”, dijo Sissie Hsiao, vicepresidenta de Google y directora general de Bard.
Hsiao dijo que la integración mejorará las capacidades de Bard en “comprensión y resumen de contenidos, razonamiento, lluvia de ideas, escritura y planeación”.
Entre los ejemplos de uso de Gemini está el escaneado de una hoja de cálculo escrita a mano con fórmulas matemáticas, la corrección de errores y su explicación.
En la demostración de Google, el youtuber Mark Rober utilizó la tecnología para dirigir un video en el que probaba cómo fabricar el avión de papel más aerodinámico. La IA sugirió experimentos y mejoras en el diseño y formas de probar su precisión, incluido lanzarlo por un anillo de fuego.
Gemini se pondrá a disposición de algunos desarrolladores y clientes empresariales en diciembre; el acceso se ampliará el próximo año.