Bot intel·ligent per a atenció a clients via WhatsApp

Context

Logic Solution volia millorar l’atenció inicial als clients potencials mitjançant un canal àgil, directe i automatitzat. L’objectiu era automatitzar el primer contacte amb els usuaris a través de WhatsApp, oferint respostes contextualitzades i facilitant la reserva de cites amb personal de l’empresa.

Objectius

  • Crear un xatbot connectat a WhatsApp capaç d’entendre i respondre consultes de manera natural.
  • Oferir respostes enriquides amb informació pròpia de l’empresa, mitjançant una arquitectura basada en RAG.
  • Consultar l’agenda per gestionar la reserva de cites automàticament.
  • Assegurar que el sistema fos escalable, modular i desplegable a Google Cloud.

Requisits

  • Integració directa amb WhatsApp Business API.
  • Capacitat de resposta mitjançant un model LLM.
  • Accés a informació específica pròpia (documentació interna).
  • Sincronització amb Google Calendar o un calendari similar per consultar disponibilitat i crear esdeveniments.
  • Arquitectura desplegable inicialment a Google Cloud Platform.
  • Costos raonables, mantenibilitat i facilitat de desplegament.

Implementació

El projecte es va desplegar inicialment a Google Cloud, amb components clarament definits per garantir escalabilitat, manteniment senzill i una experiència d’usuari fluïda.

Es va desenvolupar el motor del bot amb Cloud Functions i Firebase, utilitzant GPT-4 mini via API per oferir respostes contextuals basades en llenguatge natural. Aquesta combinació proporcionava temps de resposta àgils i flexibilitat per escalar segons la demanda.

Per enriquir les respostes del model, es va implementar una arquitectura RAG (Retrieval-Augmented Generation). Els documents rellevants s’emmagatzemaven a Cloud Storage, on s’organitzaven i versionaven segons els diferents contextos de negoci. Un sistema automàtic basat en Pub/Sub detectava nous fitxers o modificacions dels existents i generava els embeddings necessaris per mantenir la base de coneixement sempre actualitzada i alineada amb el contingut de l’empresa.

A més, es va integrar el sistema amb l’agenda d’un usuari predefinit, fet que afegia una capa addicional d’utilitat pràctica. Gràcies a l’API de Microsoft Azure, el bot era capaç de comunicar-se directament amb els serveis de calendari de l’usuari, sense intermediaris manuals ni retards.

Això li permetia consultar en temps real la disponibilitat horària, proposar directament al client franges convenients en funció de l’agenda, gestionar la confirmació en base a les respostes rebudes i, finalment, crear automàticament la cita al calendari del responsable assignat. Tot aquest procés es realitzava de manera fluïda, tancant el cercle entre la consulta i l’acció sense necessitat d’intervenció humana.

Aquesta funcionalitat va suposar un gran avenç en l’automatització de processos comercials, eliminant la necessitat d’intervenció humana en les primeres fases del contacte.

Un cop validat amb èxit en l’entorn de Google Cloud Platform, es va procedir a replicar tot el sistema a AWS. L’arquitectura funcional es va mantenir equivalent, adaptant els components als serveis equivalents d’AWS com Lambda, S3, EventBridge i DynamoDB, garantint la portabilitat i l’adaptabilitat del sistema a diferents entorns cloud.

Conclusions

El sistema va complir tots els objectius funcionals: va oferir una experiència fluïda i àgil als usuaris de WhatsApp, amb respostes contextualitzades i amb la possibilitat de concertar cites automàticament.

Ara bé, a mesura que el sistema es va estabilitzar, es va observar que la complexitat i el cost associats a la infraestructura RAG no estaven justificats per la simplicitat i el volum dels documents usats per respondre les consultes.

Tot i això, la decisió d’implantar un RAG va resultar molt valuosa des del punt de vista tècnic: va ser una oportunitat real d’implementar i operar un sistema RAG en un entorn productiu, cosa que va aportar coneixement pràctic sobre la seva dificultat, latència, manteniment i cost.

Possibles millores

  • Mecanismes de monitorització i control de qualitat més refinats per identificar preguntes que podrien no estar ben resoltes.
  • Possibilitat d’estendre el sistema a altres canals (Telegram, Teams, web) mitjançant una arquitectura modular multicanal.
  • Integració amb CRM per registrar automàticament les interaccions i alimentar accions comercials posteriors.
  • Corregir l’estil (negreta, enllaços…) del text que genera el bot.
  • Donar més la sensació que estàs parlant amb una persona.

Leave a comment

Your email address will not be published. Required fields are marked *