IA aplicada

Chatbot IA vs reglas: cuándo conviene cada uno (con números reales)

Un chatbot por reglas bien hecho puede resolver el 70% de los casos a un cuarto del costo de uno con IA. Pero falla feo cuando los usuarios salen del guion. Te mostramos en qué casos conviene cada uno, cómo medirlo, y el modelo híbrido que está ganando.

Por Ezequiel Naftali — CTO y Founder de Pisol · 09 Jul 2026 · 10 min lectura

"Necesitamos un chatbot con IA" es una de las frases más caras que escuchamos en reuniones de definición. No porque la IA esté mal — sino porque muchas veces el problema se resolvía igual o mejor con un chatbot por reglas que cuesta una fracción y entrega resultados predecibles. Y al revés: empresas que se quedan con un bot por reglas porque "ya funciona" y pierden 30-40% de conversiones por respuestas rígidas en situaciones donde un poco de IA habría salvado la conversación.

Después de implementar las dos versiones y todas las variantes intermedias en proyectos reales, este es el marco que usamos para decidir. Sin marketing.

Qué es cada cosa, sin vueltas

Chatbot por reglas

Un árbol de decisión finito. El usuario llega, el bot le muestra opciones (1: Estado de pedido, 2: Reclamos, 3: Hablar con humano), el usuario elige, el bot responde lo predefinido. Variantes más sofisticadas usan keywords ("si el mensaje contiene devolución, responder X") o slots para capturar datos ("decime tu número de pedido").

Fortalezas: barato, predecible, fácil de auditar, no inventa respuestas. Limitaciones: si el usuario sale del guion, se rompe.

Chatbot con IA (LLM)

Un modelo de lenguaje (típicamente GPT-5, Claude, o un modelo open-source más chico afinado al dominio) que recibe el mensaje del usuario, eventualmente consulta una base de conocimiento, y genera una respuesta en lenguaje natural. Variantes incluyen RAG (Retrieval-Augmented Generation, donde el modelo consulta documentos antes de responder) y agentes que ejecutan acciones (ver nuestro artículo sobre agentes).

Fortalezas: flexible, responde a preguntas que no estaban previstas, conversa con naturalidad. Limitaciones: más caro, menos predecible, puede alucinar si no está bien limitado.

Modelo híbrido (el que mejor funciona en práctica)

Reglas para los caminos de mayor volumen y crítica para el negocio (saludo, opciones principales, captura de datos estructurados), e IA para los casos que no encajan en el árbol o donde la conversación requiere flexibilidad. La derivación entre uno y otro es transparente para el usuario.

Este es el patrón que mejor ROI tiene en la mayoría de los casos B2C y B2B medianos. Más detalle abajo.

La decisión: cuatro variables que importan

Para elegir, mirá estas cuatro:

1. Volumen y previsibilidad de las consultas

Si el 80% de las consultas se resuelven con 10-15 respuestas distintas (típico en e-commerce de productos físicos, atención post-venta de servicios, agendamiento), un bot por reglas barre. Si las consultas son largas y variadas (consultoría, salud, soporte técnico complejo), las reglas se quedan cortas y empezás a perder usuarios.

Métrica práctica: tomá los últimos 500 mensajes que llegaron a tu canal y agrupalos manualmente. Si lográs cubrir 70%+ con 15 grupos, las reglas pueden funcionar. Si te quedan 100 grupos con 5 mensajes cada uno, IA.

2. Costo de un error

Un bot por reglas no inventa: si el usuario pregunta algo no contemplado, dice "no entiendo" o deriva a humano. Un bot con IA puede dar una respuesta plausible pero incorrecta (alucinación). Si tu dominio tiene consecuencias legales, financieras o de seguridad (banca, salud, derecho, productos regulados), IA pura es riesgoso sin guardrails serios. Para esos dominios, lo recomendado es híbrido con la IA muy acotada y todo lo crítico por reglas.

3. Idioma y tono

Si tu audiencia mezcla español neutro, modismos argentinos, errores de tipeo, o usa abreviaciones de WhatsApp, las reglas necesitan que escribas patterns para cada variante y te termina ganando la combinatoria. Un LLM bien afinado entiende todo eso nativamente. Lo mismo con consultas en inglés, portugués o spanglish.

4. Presupuesto y horizonte

Un chatbot por reglas para un caso B2C estándar cuesta USD 8.000-25.000 implementarlo y USD 200-500/mes mantenerlo (incluyendo canal WhatsApp Business, hosting, monitoreo). Un chatbot con IA productivo cuesta USD 20.000-80.000 inicial y USD 800-3.000/mes (incluyendo tokens del modelo, hosting, monitoreo, mantenimiento de la base de conocimiento). El híbrido suele costar lo mismo que el IA puro porque la complejidad de orquestación se compensa con menos llamadas al modelo.

Casos reales con números

Caso A: e-commerce de moda con bot por reglas

Volumen: ~3.000 mensajes/mes por WhatsApp. 85% son "¿cuándo llega mi pedido?", "quiero cambiar talla", "¿hacen envío a X?", "código de descuento". Implementamos bot por reglas con integración a Shopify y al sistema de logística. Costo: USD 15.000 inicial, USD 350/mes mantenimiento.

Resultado: derivación a humano cae del 100% al 22%. CSAT (satisfacción) se mantiene estable. ROI positivo a los 4 meses. Lección: para volumen alto + consultas repetitivas + dominio acotado, reglas le ganan a IA por lejos en relación valor/costo.

Caso B: empresa de servicios B2B con bot híbrido

Volumen: ~1.500 mensajes/mes entre web, WhatsApp y email. Muy variados: consultas pre-venta, soporte técnico, agendamiento, reclamos. Antes tenían un bot por reglas que resolvía solo el 35% y "queremos sumar IA".

Implementamos híbrido: reglas para flujos críticos (agendamiento de reunión, captura de datos del lead, escalamiento a comercial), IA con RAG sobre base de conocimiento para preguntas técnicas abiertas. Costo: USD 45.000 inicial, USD 1.400/mes.

Resultado: tasa de resolución sin humano sube de 35% a 68%. Tiempo promedio de respuesta a leads cae de 3 horas a 45 segundos. Conversión de lead a reunión sube 22 puntos. Lección: cuando las consultas son variadas pero los flujos críticos son acotados, híbrido gana.

Caso C: fintech con bot por reglas estricto

Volumen: ~8.000 mensajes/mes. Dominio: banca digital, productos financieros regulados. Intentaron primero un bot con IA pura y tuvieron dos incidentes de respuestas incorrectas sobre tasas de interés que terminaron en reclamos formales.

Re-implementaron como bot por reglas estricto, con derivación a humano en cualquier consulta no prevista, e IA solo para clasificar la intención y rutear (no para generar respuestas al usuario). Costo: USD 28.000 inicial, USD 700/mes.

Resultado: cero incidentes regulatorios en 14 meses. Tasa de auto-resolución 55% (más baja que con IA, pero predecible). Lección: en dominios regulados, predictibilidad vale más que cobertura.

Caso D: SaaS con bot 100% IA

Volumen: ~500 mensajes/mes, audiencia técnica internacional (consultas en español e inglés, modismos, errores de tipeo, consultas largas con código). Producto cambia frecuentemente, base de conocimiento se actualiza semanal.

Bot con IA puro sobre base de conocimiento auto-actualizada desde la docs del producto. Costo: USD 22.000 inicial, USD 1.100/mes.

Resultado: 75% de resolución sin humano. CSAT 4.4/5. Tiempo del equipo de soporte se reasigna a casos complejos y desarrollo de features. Lección: volumen bajo + consultas variadas + dominio en cambio constante = IA gana porque mantener reglas sería un costo permanente alto.

Cómo decidir en concreto

Decisión rápida basada en los 4 factores:

Si tu caso es...	Elegí
Volumen alto + consultas repetitivas + dominio acotado + bajo costo de error	Reglas
Consultas variadas + flujos críticos identificables + dominio que cambia	Híbrido
Dominio regulado o crítico + accountability requerida	Reglas estrictas + IA solo para clasificación
Volumen medio/bajo + consultas muy variadas + dominio especializado o multilingüe	IA pura con guardrails
"No sé qué consultas voy a tener"	Reglas básicas primero, monitoreá 2 meses, después decidí

Errores frecuentes en cada uno

Errores típicos en reglas:

Árboles demasiado profundos (8+ niveles): el usuario se pierde y abandona.
No tener escape claro a humano: el usuario queda atrapado en loops.
Copy genérico que no suena a la marca: el bot se siente robot.
No medir qué consultas no resolvió: imposible mejorarlo sin esa data.

Errores típicos en IA:

Sin RAG y sin restricciones: el modelo inventa información del producto/empresa.
Prompt único y largo en vez de prompts especializados por intent: respuestas inconsistentes.
No registrar la conversación y la decisión del modelo: imposible debuggear cuando falla.
No medir costo por conversación: la cuenta de tokens explota silenciosa.

Cómo arrancar bien

Recolectá 2-4 semanas de datos reales. Mensajes reales que llegaron a tu canal actual (email, redes, formularios). Sin esa data, cualquier decisión es a ciegas.
Clasificá manualmente los primeros 300-500 mensajes. Cuántos grupos distintos hay, cuántos mensajes por grupo, qué porcentaje del volumen cubren los top 10. Eso te dice cuánto puede cubrir un bot por reglas.
Definí qué considerás éxito. Resolución sin humano? Tiempo de respuesta? CSAT? Conversión? Sin objetivo claro, no podés elegir ni medir.
Empezá simple. Bot por reglas para el 80/20 de los casos, derivación a humano para el resto. Después de 4-8 semanas con datos reales, decidí si sumar IA mejora los números — o no.
Si vas con IA o híbrido, definí guardrails. Qué puede decir, qué no puede decir, qué tiene que confirmar antes de actuar, qué tiene que escalar siempre. Sin guardrails, el riesgo es real.

En síntesis

No hay una respuesta universal. "IA es mejor" o "las reglas están obsoletas" son frases de venta, no de ingeniería. El bot correcto depende de tu volumen, tipo de consultas, tolerancia al error, y presupuesto. En la mayoría de los casos B2B y B2C medianos, un modelo híbrido bien hecho gana en relación valor/costo. En casos regulados, reglas estrictas. En casos de soporte técnico variado y multilingüe, IA pura. En lo masivo y repetitivo, reglas.

Lo importante: medí antes de elegir y medí después de implementar. El error más caro es elegir por moda y darse cuenta a los 6 meses de que no estaba moviendo el indicador que importaba.

En Pisol implementamos las tres variantes (reglas, IA, híbrido) según el caso. Si tenés un canal de atención y querés evaluar qué tipo de bot conviene, contanos qué volumen y tipo de consultas manejás y armamos un análisis con datos antes de proponer arquitectura.

Seguir leyendo

Otros artículos

Modernización

Modernización de sistemas legacy: cuándo migrar, cuándo refactorizar, cuándo reescribir (con costos reales)

Reescribir un sistema legacy desde cero suele ser la decisión más cara y más riesgosa. Pero a veces es la única opción razonable. Te damos un marco con cinco estrategias, criterios para elegir, y casos reales: el que migró bien, el que se rompió, y el que mejor lo hizo no tocando nada.

+ Leer

Integraciones

Cómo integrar ERP con e-commerce sin que se rompa todo: arquitectura, patterns y errores comunes

La integración ERP–e-commerce es uno de los proyectos donde más empresas se quedan empantanadas. Te mostramos los cinco patterns más usados, cuándo conviene cada uno, los errores típicos que cuestan caro, y un checklist para arrancar bien.

+ Leer

Estrategia

Software a medida vs SaaS: cuándo conviene cada uno (con números)

La decisión entre comprar un SaaS o desarrollar a medida es una de las más caras que toma una empresa. Te damos un marco con cinco variables, casos reales con costos, y un patrón híbrido que está ganando: SaaS para lo commodity, custom para lo que te diferencia.

+ Leer

Qué es cada cosa, sin vueltas

Chatbot por reglas

Chatbot con IA (LLM)

Modelo híbrido (el que mejor funciona en práctica)

La decisión: cuatro variables que importan

1. Volumen y previsibilidad de las consultas

2. Costo de un error

3. Idioma y tono

4. Presupuesto y horizonte

Casos reales con números

Caso A: e-commerce de moda con bot por reglas

Caso B: empresa de servicios B2B con bot híbrido

Caso C: fintech con bot por reglas estricto

Caso D: SaaS con bot 100% IA

Cómo decidir en concreto

Errores frecuentes en cada uno

Cómo arrancar bien

En síntesis

Otros artículos

Modernización de sistemas legacy: cuándo migrar, cuándo refactorizar, cuándo reescribir (con costos reales)

Cómo integrar ERP con e-commerce sin que se rompa todo: arquitectura, patterns y errores comunes

Software a medida vs SaaS: cuándo conviene cada uno (con números)

Cotizá tu proyecto