La firma tecnológica Google presentó a Gemini, su nueva inteligencia artificial (IA) que competirá contra GPT-4 de OpenAI al contar con sofisticadas capacidades de razonamiento multimodal.
En conferencia, la compañía destacó que el desarrollo puede comprender y razonar perfectamente sobre todo tipo de entradas desde cero, “mucho mejor que los modelos multimodales existentes”, y sus capacidades son de última generación en casi todos los dominios.
- Te recomendamos Crean aplicación con IA que traduce el lenguaje de señas a texto Ciencia y Salud
“Casi ocho años después de nuestro viaje como una empresa que da prioridad a la IA, el ritmo del progreso no hace más que acelerarse: millones de personas están utilizando la IA generativa en todos nuestros productos para hacer cosas que no podían ni siquiera hace un año, desde encontrar respuestas hasta soluciones más complejas” expuso Sundar Pichai, CEO de Google.
Reveló que la primera versión, Gemini 1.0, está optimizada para diferentes tamaños: Ultra, Pro y Nano.
“Estos son los primeros modelos de la era Gemini y la primera realización de la visión que tuvimos cuando formamos Google DeepMind a principios de este año. Esta nueva era de modelos representa uno de los mayores esfuerzos de ciencia e ingeniería que hemos emprendido como empresa. Estoy realmente emocionado por lo que está por venir y por las oportunidades que Gemini desbloqueará para personas de todo el mundo”, expuso.
Capacidades de nueva generación
Google destacó que, hasta ahora, el enfoque estándar para crear modelos multimodales implicaba entrenar componentes separados para diferentes modalidades y luego unirlos para imitar aproximadamente parte de esta funcionalidad.
“A veces, estos modelos pueden ser buenos para realizar determinadas tareas, como describir imágenes, pero tienen dificultades con un razonamiento más conceptual y complejo”, explicó.
Pero en el caso de Gemini, la firma lo diseñó para que sea multimodal de forma nativa, previamente entrenado desde el principio en diferentes modalidades.
“Luego lo perfeccionamos con datos multimodales adicionales para perfeccionar aún más su eficacia”, remarcó.
Gemini 1.0 fue capacitado para reconocer y comprender texto, imágenes, audio y más al mismo tiempo, por lo que comprende mejor la información matizada y puede responder preguntas relacionadas con temas complicados.
“Esto lo hace especialmente bueno para explicar el razonamiento en materias complejas como matemáticas y física”, destacó.
Construido con responsabilidad
Google afirmó que el desarrollo de Gemini fue hecho con base a sus principios de IA y las sólidas políticas de seguridad de sus productos.
“Gemini tiene las evaluaciones de seguridad más completas de cualquier modelo de IA de Google hasta la fecha, incluidas las de sesgo y toxicidad. Hemos llevado a cabo investigaciones novedosas en áreas de riesgo potencial como ciberataques, persuasión y autonomía, y hemos aplicado las mejores técnicas de prueba adversarial de Google Research para ayudar a identificar problemas críticos de seguridad antes de la implementación de Gemini”, reveló.
¿Cuándo estará disponible?
Gemini 1.0 ahora se está implementando en una variedad de productos y plataformas de Google.
A partir de hoy, Bard utilizará una versión mejorada de Gemini Pro para un razonamiento, planificación, comprensión más avanzados y más. Esta es la mayor actualización de Bard desde su lanzamiento.
“Estará disponible en inglés en más de 170 países y territorios, y planeamos expandirnos a diferentes modalidades y admitir nuevos idiomas y ubicaciones en el futuro cercano”, reveló.
También llevarán Gemini a Pixel 8 Pro, el primer teléfono inteligente diseñado para ejecutar Gemini Nano, que impulsa nuevas funciones como Resumir en la aplicación Grabadora y la implementación de Respuesta inteligente en Gboard, comenzando con WhatsApp, y el próximo año habrá más aplicaciones de mensajería.
En los próximos meses, Gemini estará disponible en más productos y servicios de Google, como Búsqueda, Anuncios, Chrome y Duet AI.
“Ya estamos comenzando a experimentar con Gemini en la Búsqueda, donde está haciendo que nuestra Experiencia Generativa de Búsqueda (SGE) sea más rápida para los usuarios, con una reducción de 40 por ciento en la latencia en inglés en Estados Unidos, junto con mejoras en la calidad”, reveló.
Para las empresas
A partir del 13 de diciembre, los desarrolladores y clientes empresariales podrán acceder a Gemini Pro a través de la API de Gemini en Google AI Studio o Google Cloud Vertex AI.
Google AI Studio es una herramienta para desarrolladores gratuita basada en la web que ayuda a los desarrolladores y clientes corporativos a crear prototipos y lanzar aplicaciones rápidamente con una clave API.
“Cuando llega el momento de una plataforma de IA totalmente administrada, Vertex AI permite la personalización de Gemini con control total de datos y se beneficia de funciones adicionales de Google Cloud para seguridad empresarial, privacidad y gobernanza y cumplimiento de datos”, expuso.
Los desarrolladores de Android también podrán crear con Gemini Nano, el modelo más eficiente para tareas en el dispositivo, a través de AICore, una nueva capacidad del sistema disponible en Android 14, a partir de los dispositivos Pixel 8 Pro. Regístrese para obtener una vista previa anticipada de AICore.
Géminis Ultra, próximamente
Gemini Ultra, su modelo más grande de IA capaz de hacer tareas altamente complejas, sigue en “exhaustivas comprobaciones” de confianza y seguridad, incluida la formación de equipos rojos por parte de partes externas confiables, y refinando aún más el modelo mediante ajustes y aprendizaje reforzado a partir de comentarios humanos (RLHF) antes de que esté disponible ampliamente.
“Como parte de este proceso, pondremos Gemini Ultra a disposición de clientes, desarrolladores, socios y expertos en seguridad y responsabilidad seleccionados para una experimentación temprana y comentarios antes de implementarlo para desarrolladores y clientes empresariales a principios del próximo año”, reveló la empresa.
A principios del próximo año, también lanzarán Bard Advanced, una nueva experiencia de IA de vanguardia que le brinda acceso a sus mejores modelos y capacidades, comenzando con Gemini Ultra.
“Estoy realmente emocionado por lo que está por venir y por las oportunidades que Gemini desbloqueará para personas de todo el mundo”, finalizó Sundar Pichai.
CHZ