IA aplicada
Chatbot IA vs reglas: cuándo conviene cada uno (con números reales)
Un chatbot por reglas bien hecho puede resolver el 70% de los casos a un cuarto del costo de uno con IA. Pero falla feo cuando los usuarios salen del guion. Te mostramos en qué casos conviene cada uno, cómo medirlo, y el modelo híbrido que está ganando.
"Necesitamos un chatbot con IA" es una de las frases más caras que escuchamos en reuniones de definición. No porque la IA esté mal — sino porque muchas veces el problema se resolvía igual o mejor con un chatbot por reglas que cuesta una fracción y entrega resultados predecibles. Y al revés: empresas que se quedan con un bot por reglas porque "ya funciona" y pierden 30-40% de conversiones por respuestas rígidas en situaciones donde un poco de IA habría salvado la conversación.
Después de implementar las dos versiones y todas las variantes intermedias en proyectos reales, este es el marco que usamos para decidir. Sin marketing.
Qué es cada cosa, sin vueltas
Chatbot por reglas
Un árbol de decisión finito. El usuario llega, el bot le muestra opciones (1: Estado de pedido, 2: Reclamos, 3: Hablar con humano), el usuario elige, el bot responde lo predefinido. Variantes más sofisticadas usan keywords ("si el mensaje contiene devolución, responder X") o slots para capturar datos ("decime tu número de pedido").
Fortalezas: barato, predecible, fácil de auditar, no inventa respuestas. Limitaciones: si el usuario sale del guion, se rompe.
Chatbot con IA (LLM)
Un modelo de lenguaje (típicamente GPT-5, Claude, o un modelo open-source más chico afinado al dominio) que recibe el mensaje del usuario, eventualmente consulta una base de conocimiento, y genera una respuesta en lenguaje natural. Variantes incluyen RAG (Retrieval-Augmented Generation, donde el modelo consulta documentos antes de responder) y agentes que ejecutan acciones (ver nuestro artículo sobre agentes).
Fortalezas: flexible, responde a preguntas que no estaban previstas, conversa con naturalidad. Limitaciones: más caro, menos predecible, puede alucinar si no está bien limitado.
Modelo híbrido (el que mejor funciona en práctica)
Reglas para los caminos de mayor volumen y crítica para el negocio (saludo, opciones principales, captura de datos estructurados), e IA para los casos que no encajan en el árbol o donde la conversación requiere flexibilidad. La derivación entre uno y otro es transparente para el usuario.
Este es el patrón que mejor ROI tiene en la mayoría de los casos B2C y B2B medianos. Más detalle abajo.
La decisión: cuatro variables que importan
Para elegir, mirá estas cuatro:
1. Volumen y previsibilidad de las consultas
Si el 80% de las consultas se resuelven con 10-15 respuestas distintas (típico en e-commerce de productos físicos, atención post-venta de servicios, agendamiento), un bot por reglas barre. Si las consultas son largas y variadas (consultoría, salud, soporte técnico complejo), las reglas se quedan cortas y empezás a perder usuarios.
Métrica práctica: tomá los últimos 500 mensajes que llegaron a tu canal y agrupalos manualmente. Si lográs cubrir 70%+ con 15 grupos, las reglas pueden funcionar. Si te quedan 100 grupos con 5 mensajes cada uno, IA.
2. Costo de un error
Un bot por reglas no inventa: si el usuario pregunta algo no contemplado, dice "no entiendo" o deriva a humano. Un bot con IA puede dar una respuesta plausible pero incorrecta (alucinación). Si tu dominio tiene consecuencias legales, financieras o de seguridad (banca, salud, derecho, productos regulados), IA pura es riesgoso sin guardrails serios. Para esos dominios, lo recomendado es híbrido con la IA muy acotada y todo lo crítico por reglas.
3. Idioma y tono
Si tu audiencia mezcla español neutro, modismos argentinos, errores de tipeo, o usa abreviaciones de WhatsApp, las reglas necesitan que escribas patterns para cada variante y te termina ganando la combinatoria. Un LLM bien afinado entiende todo eso nativamente. Lo mismo con consultas en inglés, portugués o spanglish.
4. Presupuesto y horizonte
Un chatbot por reglas para un caso B2C estándar cuesta USD 8.000-25.000 implementarlo y USD 200-500/mes mantenerlo (incluyendo canal WhatsApp Business, hosting, monitoreo). Un chatbot con IA productivo cuesta USD 20.000-80.000 inicial y USD 800-3.000/mes (incluyendo tokens del modelo, hosting, monitoreo, mantenimiento de la base de conocimiento). El híbrido suele costar lo mismo que el IA puro porque la complejidad de orquestación se compensa con menos llamadas al modelo.
Casos reales con números
Caso A: e-commerce de moda con bot por reglas
Volumen: ~3.000 mensajes/mes por WhatsApp. 85% son "¿cuándo llega mi pedido?", "quiero cambiar talla", "¿hacen envío a X?", "código de descuento". Implementamos bot por reglas con integración a Shopify y al sistema de logística. Costo: USD 15.000 inicial, USD 350/mes mantenimiento.
Resultado: derivación a humano cae del 100% al 22%. CSAT (satisfacción) se mantiene estable. ROI positivo a los 4 meses. Lección: para volumen alto + consultas repetitivas + dominio acotado, reglas le ganan a IA por lejos en relación valor/costo.
Caso B: empresa de servicios B2B con bot híbrido
Volumen: ~1.500 mensajes/mes entre web, WhatsApp y email. Muy variados: consultas pre-venta, soporte técnico, agendamiento, reclamos. Antes tenían un bot por reglas que resolvía solo el 35% y "queremos sumar IA".
Implementamos híbrido: reglas para flujos críticos (agendamiento de reunión, captura de datos del lead, escalamiento a comercial), IA con RAG sobre base de conocimiento para preguntas técnicas abiertas. Costo: USD 45.000 inicial, USD 1.400/mes.
Resultado: tasa de resolución sin humano sube de 35% a 68%. Tiempo promedio de respuesta a leads cae de 3 horas a 45 segundos. Conversión de lead a reunión sube 22 puntos. Lección: cuando las consultas son variadas pero los flujos críticos son acotados, híbrido gana.
Caso C: fintech con bot por reglas estricto
Volumen: ~8.000 mensajes/mes. Dominio: banca digital, productos financieros regulados. Intentaron primero un bot con IA pura y tuvieron dos incidentes de respuestas incorrectas sobre tasas de interés que terminaron en reclamos formales.
Re-implementaron como bot por reglas estricto, con derivación a humano en cualquier consulta no prevista, e IA solo para clasificar la intención y rutear (no para generar respuestas al usuario). Costo: USD 28.000 inicial, USD 700/mes.
Resultado: cero incidentes regulatorios en 14 meses. Tasa de auto-resolución 55% (más baja que con IA, pero predecible). Lección: en dominios regulados, predictibilidad vale más que cobertura.
Caso D: SaaS con bot 100% IA
Volumen: ~500 mensajes/mes, audiencia técnica internacional (consultas en español e inglés, modismos, errores de tipeo, consultas largas con código). Producto cambia frecuentemente, base de conocimiento se actualiza semanal.
Bot con IA puro sobre base de conocimiento auto-actualizada desde la docs del producto. Costo: USD 22.000 inicial, USD 1.100/mes.
Resultado: 75% de resolución sin humano. CSAT 4.4/5. Tiempo del equipo de soporte se reasigna a casos complejos y desarrollo de features. Lección: volumen bajo + consultas variadas + dominio en cambio constante = IA gana porque mantener reglas sería un costo permanente alto.
Cómo decidir en concreto
Decisión rápida basada en los 4 factores:
| Si tu caso es... | Elegí |
|---|---|
| Volumen alto + consultas repetitivas + dominio acotado + bajo costo de error | Reglas |
| Consultas variadas + flujos críticos identificables + dominio que cambia | Híbrido |
| Dominio regulado o crítico + accountability requerida | Reglas estrictas + IA solo para clasificación |
| Volumen medio/bajo + consultas muy variadas + dominio especializado o multilingüe | IA pura con guardrails |
| "No sé qué consultas voy a tener" | Reglas básicas primero, monitoreá 2 meses, después decidí |
Errores frecuentes en cada uno
Errores típicos en reglas:
- Árboles demasiado profundos (8+ niveles): el usuario se pierde y abandona.
- No tener escape claro a humano: el usuario queda atrapado en loops.
- Copy genérico que no suena a la marca: el bot se siente robot.
- No medir qué consultas no resolvió: imposible mejorarlo sin esa data.
Errores típicos en IA:
- Sin RAG y sin restricciones: el modelo inventa información del producto/empresa.
- Prompt único y largo en vez de prompts especializados por intent: respuestas inconsistentes.
- No registrar la conversación y la decisión del modelo: imposible debuggear cuando falla.
- No medir costo por conversación: la cuenta de tokens explota silenciosa.
Cómo arrancar bien
- Recolectá 2-4 semanas de datos reales. Mensajes reales que llegaron a tu canal actual (email, redes, formularios). Sin esa data, cualquier decisión es a ciegas.
- Clasificá manualmente los primeros 300-500 mensajes. Cuántos grupos distintos hay, cuántos mensajes por grupo, qué porcentaje del volumen cubren los top 10. Eso te dice cuánto puede cubrir un bot por reglas.
- Definí qué considerás éxito. Resolución sin humano? Tiempo de respuesta? CSAT? Conversión? Sin objetivo claro, no podés elegir ni medir.
- Empezá simple. Bot por reglas para el 80/20 de los casos, derivación a humano para el resto. Después de 4-8 semanas con datos reales, decidí si sumar IA mejora los números — o no.
- Si vas con IA o híbrido, definí guardrails. Qué puede decir, qué no puede decir, qué tiene que confirmar antes de actuar, qué tiene que escalar siempre. Sin guardrails, el riesgo es real.
En síntesis
No hay una respuesta universal. "IA es mejor" o "las reglas están obsoletas" son frases de venta, no de ingeniería. El bot correcto depende de tu volumen, tipo de consultas, tolerancia al error, y presupuesto. En la mayoría de los casos B2B y B2C medianos, un modelo híbrido bien hecho gana en relación valor/costo. En casos regulados, reglas estrictas. En casos de soporte técnico variado y multilingüe, IA pura. En lo masivo y repetitivo, reglas.
Lo importante: medí antes de elegir y medí después de implementar. El error más caro es elegir por moda y darse cuenta a los 6 meses de que no estaba moviendo el indicador que importaba.
En Pisol implementamos las tres variantes (reglas, IA, híbrido) según el caso. Si tenés un canal de atención y querés evaluar qué tipo de bot conviene, contanos qué volumen y tipo de consultas manejás y armamos un análisis con datos antes de proponer arquitectura.
Seguir leyendo