top of page
Search

Los agentes de IA dan el salto: OpenAI habilita llamadas telefónicas y Google potencia Gemini Live

  • Writer: Candela Sofia
    Candela Sofia
  • Sep 2
  • 2 min read
La semana marcó un punto de quiebre para los “agentes” conversacionales: voz en tiempo real, integración con apps y un auge de agentes de compras que reconfigura el e‑commerce.

La carrera por agentes de IA entró en fase de implementación. OpenAI anunció una actualización sustancial de gpt‑realtime con un modelo de voz‑a‑voz más avanzado, soporte para llamadas SIP (para integrarse con telefonía corporativa), entrada de imágenes y compatibilidad con servidores MCP para orquestar herramientas. En la práctica, esto permite desplegar agentes que contestan teléfonos, entienden pantallas/fotos del usuario, consultan sistemas y ejecutan acciones, con latencias cercanas a la conversación humana.


Google amplió Gemini Live: más expresivo, más “consciente” del entorno visual y con integración profunda a Google Apps. Además, el ecosistema de Gemini API sumó novedades recientes (como URL context GA y un nuevo modelo de imagen en 2.5) que facilitan agentes multimodales con contexto web y edición/creación visual, útil para ventas y marketing. Para pymes y áreas comerciales, esto se traduce en asistentes que entienden PDFs, páginas, imágenes de producto y hojas de cálculo, y que operan dentro de Gmail, Drive, Calendar o Chat.


ree

El FT reportó a la vez el auge de agentes de compras que navegan sitios, comparan, llenan carritos y pueden finalizar pedidos. Para las marcas, la optimización ya no es solo para SEO tradicional: ahora hay que estructurar catálogos y políticas para que satisfagan consultas de chatbots (descripciones claras, atributos normalizados, tiempos de envío, devoluciones, sellos de garantía, fotos consistentes). Emergen proveedores que miden “share of answer” en bots, algo análogo al “share of search” en buscadores.


Implicaciones para América Latina:

  • Canal voz y WhatsApp: mercados con alta adopción de voz y mensajería pueden beneficiarse primero. Un agente de voz que responda en español neutro, integre pagos locales y conozca regulaciones mejora AHT y satisfacción de cliente.

  • Datos y catálogos: retailers y marketplaces regionales deben priorizar datos estructurados (GTIN, talles/medidas latinoamericanas, impuestos locales) y políticas de devoluciones claras para ser “elegibles” por agentes.

  • Gobernanza y privacidad: con agentes que escuchan, ven y llaman, las empresas deberán actualizar políticas de consentimiento, registros de auditoría y “guardrails”.


Checklist ejecutivo (primeros 60 días):

  1. Defina dos casos de uso con ROI directo (p. ej., agendamiento y posventa).

  2. Audite datos de producto y FAQs; conviértalos en esquemas legibles por agentes.

  3. Prototipe un agente de voz con SIP y métricas (tasa de resolución, AHT).

  4. Implemente guardrails y red teaming básicos.

  5. Prepare un panel de “share of answer” en agentes para categorías clave.

 
 
 

Comments


bottom of page