Tecnologia

La IA generativa ‘rescata’ a los asistentes de voz


OpenAI, la innovación en IA

El mes pasado, la startup sensación de la IA generativa, OpenAI, anunció el lanzamiento de su modelo GPT-4o, el cual es capaz de aceptar cualquier combinación de texto, audio e imagen, y generar cualquier combinación de salidas de texto, audio e imagen.

Una de las características más importantes es que este modelo se ofrecerá de forma gratuita, en contraste con los modelos anteriores de la empresa, además de ser “mucho más rápido”.

En este caso, las exploraciones de capacidades son diversas e incluyen desde narrativas visuales hasta juegos como “piedra, papel o tijera”. Además, también tiene alto rendimiento y velocidad en inteligencia de texto, razonamiento y codificación, estableciendo nuevos estándares en capacidades multilingües, de audio y visión.

Samsung quiere que Bixby renazca

En febrero, tras el lanzamiento de los dispositivos Galaxy S24, Samsung anunció la incorporación de la IA a su asistente Bixby,el cual tiene diferentes aplicaciones, como traducir en tiempo real, además de crear de resúmenes de páginas web, corregir la ortografía y organizar archivos con portadas de notas automatizadas.

En este caso, un aspecto importante es que desde que se lanzó el dispositivo las funciones de IA se aplicaron a todos los idiomas con los que funciona el asistente: chino, inglés (Estados Unidos, Reino Unido e India), francés, alemán, italiano, coreano, portugués (Brasil), español (España) y español (América Latina).

Alexa pendiente y Cortana descontinuada

A mediados de 2023, Amazon anunció que se subía a la era de la IA generativa, pero hasta ahora todas las funciones que se mostraron en aquel entonces aún no están disponibles a nivel mundial.

Por ejemplo, la empresa reveló una función llamada Character.ai, con la cual se podrá chatear con muchas personas famosas a través de un chatbot, esto incluye a personas vivas, que sean parte de la historia o bien personajes de ficción.

La compañía resaltó otras herramientas para personas que viven con una discapacidad a partir de dispositivos basados en IA como Eye Gaze, cuyo objetivo es manejar la pantalla de las tabletas de la marca únicamente con los ojos sin la necesidad de utilizar la voz o las manos en ningún momento. No obstante, estas funciones han tardado para estar disponibles.

Por otra parte, Windows anunció el retiro de su asistente de voz a partir de la primavera de 2023, una decisión que no gustó entre los usuarios de la empresa, pues fue parte relevante de la identidad del sistema operativo. En sustitución, Microsoft ha motivado el uso de otra herramienta, Copilot, la cual está basada en ChatGPT.



Source link

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button