El año 2023 será recordado como un punto de inflexión en la historia de la inteligencia artificial. La competencia entre gigantes y startups acabó con la llegada de Google Gemini.
La realidad es que esta gran empresa en 2023 está algo atrasada en este campo. A pesar de grandes lanzamientos como Google Bard, parece que la compañía tiene una última sorpresa reservada para el final.
– Venezuela Informa –
Gemini se presenta como una familia de modelos que prometen superar en muchos aspectos al famoso GPT-4. Esto es especialmente cierto al integrar múltiples formatos. Puede crear y procesar texto, imágenes y otros tipos de datos como gráficos y mapas.
Sin embargo, si bien estas herramientas pueden parecer impresionantes hoy en día, Google cree que están lejos de maximizar todo el potencial de la tecnología. Entonces en este artículo Analizaremos qué pretende conseguir el gigante de las búsquedas con Gemini, ¿cómo funciona? Y por qué afirman que será el futuro de la IA, informa el portal Computer Hoy.
Google ¿Qué es Géminis?
Géminis es El nuevo y potente modelo de inteligencia artificial de Google en formato GPT-4 no es directamente accesible como tal.Más bien, sirve como base que Google y otros desarrolladores pueden utilizar en última instancia para crear productos sobre él. Por ejemplo, GPT-4 sirve para construir el aún más poderoso ChatGPT. Con Géminis ocurre lo mismo.
– Venezuela Informa –
Según Dennis Hassabi, director ejecutivo y cofundador de Google DeepMind, “fue construido desde cero para ser multimodal. Esto significa que se pueden resumir, comprender, procesar y combinar diferentes tipos de datos sin problemas. Incluyendo texto, código, audio, imágenes y vídeo.” »
Puede entender no sólo texto. Pero también incluye imágenes, vídeo y audio. Como modelo multimodal, Gemini se describe como capaz de realizar tareas complejas en matemáticas, física y otros campos, así como realizar tareas complejas. Comprender y crear código de alta calidad en Múltiples lenguajes de programación.
Aunque esto por sí solo no es algo que llame mucho la atención. Porque en la actualidad existen modelos similares. Por lo tanto, la versatilidad de Gemini es un factor clave, ya que es más que un solo modelo y puede ejecutar de todo, desde centros de datos hasta teléfonos móviles.
Se lanzó el 6 de diciembre con una demostración que le mostrará la codificación. Explicar problemas de matemáticas. Encontrar similitudes entre dos imágenes. Convertir imágenes a código Comprender los emojis, etc. Aunque es cierto que existe cierto debate sobre en qué medida estas pruebas son falsas.
Habrá 3 modelos para elegir.
Google llama a Géminis el Un modelo flexible que puede ejecutar todo, desde centros de datos de Google hasta dispositivos móviles.Para lograr esta escalabilidad, Gemini se lanza en tres tamaños: Géminis Nano, Géminis Pro y Géminis Ultra.
1. Gemini Nano: El Gemini Nano está diseñado para ejecutarse específicamente en teléfonos inteligentes. El Google Pixel 8 está diseñado para ejecutarse en dispositivos que requieren un potente procesamiento de IA sin conexión. Conéctese a un servidor externo, como sugerir respuestas dentro de una aplicación de chat. o resumir el mensaje
La ventaja de que todo permanezca en su teléfono y no vaya a un servidor externo es la privacidad y seguridad de la que mucha gente habla cuando habla de estas herramientas de inteligencia artificial, sin embargo, no espere las mismas velocidades de respuesta. Y es cierto que consumen mucha batería y espacio de almacenamiento.
- Gemini Pro: Gemini Pro, que se ejecuta en los centros de datos de Google, está diseñado para impulsar la última versión del chatbot de inteligencia artificial de la compañía, Bard. Capaz de ofrecer tiempos de respuesta rápidos y comprender preguntas complejas. En este caso se elimina el modelo anterior, el PaLM 2, en favor del Gemini Pro.
- Gemini Ultra: aunque aún no está ampliamente disponible Google describe a Gemini Ultra como el modelo más capaz hasta el momento.Superando los “resultados actuales de última generación en 30 de 32 puntos de referencia académicos ampliamente utilizados en la investigación y el desarrollo de modelos de lenguaje a gran escala (LLM)”, está diseñado para tareas altamente complejas y se lanzará después de completar la fase de prueba actual.Previsto para principios de 2024.
– Venezuela Informa –