Cómo Crear Prompts para un Sistema de IA Conversacional

Última actualización 16 ene 2026 • 11 minutos de lectura

Crear prompts adecuados para un modelo de lenguaje grande en un sistema de IA Conversacional puede marcar la diferencia.

A split image with a dark, circular, tunnel-like structure with horizontal lights on the left, and a blue background with radiating black lines on the right.

A split image showing the interior of a circular parking garage on the left and a blue background with radiating black lines on the right.

Contacta con Ventas IA Conversacional

Hoy en día, el LLM se ha convertido en el corazón de los sistemas de IA conversacional. Específicamente, los LLMs permiten que la IA conversacional — originalmente construida alrededor de extensos árboles telefónicos — ofrezca funcionalidad dinámica y proporcione experiencias similares a las humanas. Sin embargo, los LLMs no son una solución mágica; requieren prompts especializados ya que no están ajustados por defecto al habla humana.

Los desarrolladores cometen un error común al crear prompts para LLMs en IA conversacional: reciclar el mismo enfoque que se usó para entrenar a empleados humanos. Esta estrategia, aunque parece sencilla, rara vez es fructífera. Los LLMs hacen suposiciones diferentes a las de los humanos típicos, y su tono y alcance por defecto no son adecuados para interacciones verbales.

Hoy, descubriremos lo que sabemos sobre cómo crear prompts para LLMs y construir sistemas de IA conversacional exitosos. También puedes leer una guía más completa y técnica sobre este tema en la documentación para desarrolladores de ElevenLabs.

El Sistema Antiguo

Antes de los LLMs, los sistemas de IA conversacional utilizaban extensos árboles lógicos que gestionaban las solicitudes basándose en entradas verbales. Este sistema era popular entre los números de atención al cliente (por ejemplo, líneas aéreas) y sistemas de pago (por ejemplo, servicios telefónicos de tarjetas de crédito).

Estos sistemas antiguos eran lentos, parecían robóticos y solo permitían entradas humanas muy limitadas. Es probable que hayas experimentado esto, gritando “SÍ” al teléfono para responder a un prompt. Esta mala experiencia llevó a la mayoría de los usuarios a intentar “vencer al sistema” para forzar una conversación con un agente humano.

Sin embargo, había una ventaja en estos árboles telefónicos: estaban contenidos. Había un número limitado de caminos que una conversación podía tomar, y los desarrolladores podían implementar fácilmente límites para ignorar entradas no permitidas. Esta restricción subraya los pros y contras de los LLMs: se expanden dramáticamente más allá de la naturaleza limitada de los árboles telefónicos, pero también son impredecibles, abriendo una caja de Pandora de problemas — como hacer promesas imposibles, enfadarse con los clientes o violar datos sensibles.

Las Brechas por Defecto

Si los LLMs se entrenan simplemente con un manual diseñado originalmente para humanos, tendrán un éxito mediocre debido a algunas brechas fundamentales. Entender estas brechas te ayudará a diseñar prompts para abordarlas:

Desajuste de Tono

Los LLMs se entrenan mediante aprendizaje por refuerzo, donde la retroalimentación humana incentiva a los LLMs a devolver respuestas estructuradas. Específicamente, las respuestas de los LLM tienden a ser verbosas y llenas de viñetas, bloques destacados y titulares.

Sin embargo, en el contexto de la IA conversacional, los LLMs necesitan emular la naturaleza concisa y directa de las interacciones verbales.

Brechas de Suposición

Los LLMs tienden a llenar cualquier desconocido con conocimiento inferido en lugar de hacer preguntas. Esto puede llevarlos a hacer suposiciones incorrectas que desorienten a los usuarios o lleven a errores costosos (por ejemplo, promesas de reembolsos). Más adelante, veremos cómo podemos usar una base de conocimiento y límites para evitar que los LLMs hagan promesas incorrectas y ejecuten acciones no permitidas.

Latencia

Los LLMs pueden invocar llamadas a funciones programáticamente, recopilando y escribiendo datos en nombre de los humanos. Aunque generalmente esta es una de las mayores ventajas de los LLMs, también significa que las instrucciones de entrenamiento anteriores, que permitían a los agentes de llamadas “ganar tiempo” mientras realizaban tareas, ya no son necesarias. Sin embargo, las llamadas a funciones tampoco son instantáneas, lo que significa que los LLMs deben advertir con precisión al usuario siempre que se espere un retraso (por ejemplo, “dame un momento para examinar tu caso”).

Configuraciones

Personalidad

Los LLMs son bastante exitosos al ajustar el tono para coincidir con un estilo. Un LLM podría configurarse para sonar amigable, humorístico, conciso, formal o una combinación de estilos. Este es un input importante al crear un prompt para un LLM.

Por ejemplo, los desarrolladores de una aplicación de IA conversacional de servicio al cliente diseñada para apoyar a clientes descontentos de aerolíneas podrían usar un prompt como:

Eres un agente de servicio al cliente amigable que habla en oraciones concisas, claras y empáticas.

American

Whispering

Mysterious

Gaming

Lively

Irish

Soothing

Audiobook

Nicole

Formato

Los LLMs necesitan recibir instrucciones explícitas sobre cómo responder. Para asegurarse de que no incluyan texto adicional, se debe proporcionar a los LLMs una estructura que encapsule la respuesta que se pasa al usuario.

Por ejemplo, se podría pedir a los LLMs que:

Responde exclusivamente con la cadena que debe leerse en voz alta al usuario

Esta estructura anima al LLM a proporcionar una respuesta diseñada para ser hablada en voz alta.

Sin embargo, los LLMs a veces pueden tropezar con cosas que podrían no diferir intuitivamente del contenido escrito. Un ejemplo común son los números: un LLM podría imprimir un código postal como 10023, lo que hará que el modelo de texto a voz diga, “diez mil veintitrés.” En su lugar, se debe indicar explícitamente al LLM que diga los números individualmente, señalando lo que significan, por ejemplo, “El código postal es uno cero cero dos tres.”

Temperatura

La temperatura es un parámetro crítico al configurar LLMs para IA conversacional. Una temperatura baja produce respuestas más enfocadas y deterministas, ideales para conversaciones orientadas a tareas, mientras que temperaturas más altas crean respuestas más creativas y variadas.

Una temperatura baja es ideal para sistemas de IA conversacional que prefieren respuestas consistentes (por ejemplo, una línea de servicio al cliente para reembolsos). Mientras tanto, para sistemas que quieren proporcionar una experiencia más atractiva y realista a los clientes (por ejemplo, un entrenador digital), una temperatura alta es mejor:

Temperatura Baja: Gracias por llamar al soporte de ElevenLabs. ¿En qué puedo ayudarte?
Temperatura Alta: ¡Hola hola! Has llegado al soporte de ElevenLabs—¡listos para resolver tus problemas técnicos! ¿Qué tienes en mente?

Bases de Conocimiento

Para sistemas de IA conversacional que acceden a grandes reservas de conocimiento, se debe utilizar una base de conocimiento para minimizar la longitud del prompt. En producción, esto se logra típicamente a través de una base de datos vectorial (como Pinecone o Elasticsearch) o el almacén de conocimiento directo del proveedor de LLM.

En general, las bases de conocimiento son esenciales para fundamentar las respuestas de los LLM en información factual y aprobada. Al construir un sistema de IA conversacional, debes proporcionar al LLM una base de conocimiento completa que contenga información precisa y actualizada sobre productos, servicios, políticas y procedimientos. Esto evita que el LLM imagine o invente información mientras fomenta respuestas consistentes y confiables en las conversaciones.

Proceso

Debido a que los LLMs a menudo invocan funciones en nombre del usuario, también necesitan saber qué entradas son necesarias explícitamente. Por ejemplo, si el trabajo de un LLM es ayudar a un usuario a programar una cita para un corte de pelo, necesitarán asegurarse de tener:

El nombre del usuario
La fecha y hora deseadas
La dirección del usuario
La preferencia de servicio del usuario

Una implementación ingenua podría resultar en que el LLM pida toda la información en un solo turno de la conversación. Esto está perfectamente bien como texto, pero en una conversación, puede ser abrumador:

Agente de Soporte: ¿Podrías proporcionarme tu nombre, tu dirección, cuándo te gustaría el servicio y qué servicio deseas?
Cliente: Mi nombre es Mathew y cualquier momento el miércoles por la tarde está bien. ¿Qué más pediste?

Debido a que la información generalmente se recopila de manera incremental a través de la conversación, se debe animar a los LLMs a obtener esta información de manera fragmentada. El resultado es una experiencia mucho más conversacional:

Agente de Soporte: ¿Podrías proporcionarme tu nombre?
Cliente: Mi nombre es Mathew Pregasen.
Agente de Soporte: Gracias Mathew. ¿Cuándo te gustaría hacer una cita?
Cliente: Cualquier momento el miércoles por la tarde está bien.
Agente de Soporte: Genial. Ahora, ¿puedo obtener tu dirección para encontrar la ubicación más cercana?
Cliente: 555 West Main Street
Agente de Soporte: Perfecto. Ahora, ¿qué servicio buscas?
Cliente: Estoy buscando un corte de pelo y si también puedes arreglar mi barba, sería genial.

Límites

Permisos

Al construir sistemas distribuidos, asumes que tu servidor fallará en algún momento. De igual manera, al construir sistemas de IA, debes asumir que tu LLM cometerá un error en algún momento. Para minimizar el impacto de ese error, debes dar a estos sistemas los permisos más bajos necesarios para el trabajo en cuestión. A continuación, algunos ejemplos de cómo puedes hacer esto:

Configurar correctamente los permisos de lectura/escritura: Si el LLM solo necesita leer información de una fuente de datos, asegúrate de que tenga una ruta de API de solo lectura.
Limitar el acceso a rutas de API: Si el LLM solo necesita acceso a ciertas rutas, asegúrate de que no pueda acceder a ninguna otra.
Escalaciones con intervención humana: Si se necesita realizar una acción de alto riesgo, considera un flujo de trabajo con intervención humana que requiera “aprobación del gerente” antes de ejecutar la acción.

Validación y Verificación

Al crear sistemas de agente de voz IA que toman acciones mediante el uso de herramientas, es útil construir un proceso de validación y verificación para asegurarte de que estás recopilando la información correcta de los usuarios. Hoy en día, cuando hablas con un agente humano, repiten cualquier información crítica que les das para verificar que la escucharon correctamente y que el cliente no se equivocó al hablar. Los LLMs podrían beneficiarse de un nivel similar de verificación de errores:

Agente de Soporte: Genial. Ahora, ¿puedo obtener tu dirección para encontrar la ubicación más cercana?
Cliente: 555 West Main Street
Agente de Soporte: He entendido cinco cinco cinco west main street. ¿Me he perdido algo?

Para la validación, cualquier información recibida del cliente debe verificarse contra la estructura típica de esa información. ¿El número de teléfono tiene el número correcto de dígitos? ¿La edad dada por el cliente está dentro de un rango razonable? ¿El cliente proporcionó una dirección válida?

Agente de Soporte: ¿Cuál sería un buen número de contacto para ti?
Cliente: 317-798-97289
Agente de Soporte: Creo que te he escuchado mal. He oído 11 números. ¿Podrías repetirlo de nuevo?

Dependiendo de tu caso de uso, puedes verificar toda la información recibida o solo la información que falló en la verificación. Además, puedes decidir verificar cada pieza de información a medida que llega o verificar todo al final.

Un Pensamiento Final

Crear prompts exitosos para un sistema de agente de IA implica equilibrar las configuraciones y límites adecuados para generar una experiencia que emule hablar con un humano con mayor eficiencia. El proceso no es tan trivial como usar materiales de entrenamiento antiguos para crear un prompt para un LLM; en cambio, los LLMs son herramientas que necesitan una estructura y estrategia especializadas para crear resultados predecibles y efectivos.

Descubre artículos del equipo de ElevenLabs

Agents Platform Stories

Agents Platform Stories

Revolut selects ElevenLabs Agents to bolster customer support

Reducing time to ticket resolution by 8x with multilingual conversational agents.

API Platform Stories

API Platform Stories

Yampa is scaling high-intensity outbound voice intelligence with ElevenLabs

Yampa leverages ElevenLabs Flash V2.5 to scale human-like outbound voice agents with ultra-low latency and massive concurrency.

Crea con audio con IA de la más alta calidad

Empieza gratis

¿Ya tienes una cuenta? Inicia sesión