Behöver ert företag hjälp med att implementera AI? Kontakta oss och få prisoffert här →
AI Skolan
January 22, 2026

WhatsApp + Google Docs: snabba support-svar

Rickard Andersson Partner, Nodenordic.se

Din WhatsApp-inkorg rör sig snabbt. Sedan dyker ett röstmeddelande upp. Någon skickar en suddig produktbild. En annan kund skriver på roman urdu. Plötsligt blir “snabbsvar” en copy-paste-maraton och mycket gissningar.

Automatisering av WhatsApp-support slår först mot supportansvariga, eftersom de äger svarstiden. Men e-handelsoperatörer och ägare av tjänsteföretag känner också av det. Resultatet är enkelt: kunder får konsekventa svar på sekunder, även när meddelandet inte är ren text.

Det här arbetsflödet kopplar WhatsApp till din kunskapsbas i Google Docs, lägger till AI som kan läsa bilder och transkribera röstmeddelanden och svarar automatiskt. Du ser vad det löser, vad det levererar och vad du behöver för att köra det stabilt.

Så här fungerar automatiseringen

Hela n8n-flödet, från trigger till slutligt resultat:

n8n Workflow Template: WhatsApp + Google Docs: snabba support-svar

Problemet: WhatsApp-support blir snabbt omöjlig att skala

WhatsApp är toppen för kunder eftersom det är friktionsfritt. För ditt team innebär det ständiga kontextbyten. Ena minuten är det “Vad är er returpolicy?”, nästa är det ett 40 sekunder långt röstmeddelande med tre frågor i samma klipp, och sedan en bild med “Är det här rätt storlek?” Om du är beroende av att människor kommer ihåg policys, priser och undantag får du långsamma svar, inkonsekventa besked och en supportkö som växer vid sämsta möjliga tillfälle (efter arbetstid, helger, lanseringar). Ärligt talat är den mentala belastningen den verkliga kostnaden.

Friktionen byggs på. Här är var det fallerar i verklig vardagssupport.

  • Röstmeddelanden och bilder tvingar fram ett manuellt “avkodningssteg” innan någon ens kan börja svara.
  • Två agenter svarar olika på samma fråga, vilket leder till återbetalningar, diskussioner och skärmdumpar med “men ert team sa…”
  • Att uppdatera standardsvar fungerar inte när era policys finns i någons huvud i stället för i en enda källa som gäller.
  • Flerspråkiga chattar saktar ner allt, eftersom översättning och att hålla en artig ton tar tid och fokus.

Lösningen: autosvar från din kunskapsbas i Google Docs

Det här arbetsflödet gör WhatsApp till en alltid-på-supportkanal som backas upp av din kunskapsbas i Google Docs. Det startar när ett kundmeddelande träffar din WhatsApp-webhook i n8n. Flödet avgör vilken typ av meddelande det är (text, röstmeddelande eller bild) och konverterar sedan allt till korrekt formaterad text: röst transkriberas, bilder beskrivs och ren text formateras. Den texten skickas till en AI-agent som svarar som en professionell supportmedarbetare, hämtar fakta från ditt innehåll i Google Docs och behåller kontext per telefonnummer så att kunden slipper upprepa sig. Till sist skickas svaret tillbaka till WhatsApp automatiskt.

Arbetsflödet börjar med ett inkommande WhatsApp-meddelande och en snabb klassificering. Därifrån laddas media ner vid behov och bearbetas med AI (transkribering för ljud, bildanalys för bilder). AI-agenten använder sedan din Google Docs-referens för att skapa ett konsekvent, varumärkesanpassat svar och skickar tillbaka det inom några sekunder.

Det du får: automatisering vs. resultat

Exempel: så här kan det se ut

Säg att din inkorg får cirka 40 WhatsApp-meddelanden per dag, och att ungefär 10 av dem är röstmeddelanden eller bilder. Manuellt tar de där 10 meddelandena ofta runt 5 minuter styck (lyssna, tolka, kolla dokumentet, översätta, svara), så du bränner nästan en timme bara på de “svåra” meddelandena. Med det här arbetsflödet triggas kundens meddelande direkt, transkribering eller bildläsning sker i bakgrunden, och svaret skickas tillbaka automatiskt på under en minut. Det är ungefär en timme tillbaka de flesta dagar, och svaren blir konsekventa.

Det här behöver du

  • n8n-instans (testa n8n Cloud gratis)
  • Alternativ för egen drift om du föredrar det (Hostinger fungerar bra)
  • WhatsApp Business API för att ta emot och skicka meddelanden
  • Google Docs API för att söka i ditt kunskapsbasdokument
  • OpenAI API-nyckel (hämta den i din OpenAI-dashboard)

Kunskapsnivå: Medel. Du kopplar API:er, sätter behörigheter och testar några meddelandetyper end-to-end.

Vill du inte sätta upp det här själv? Prata med en automationsexpert (gratis 15-minuters konsultation).

Så här fungerar det

Ett WhatsApp-meddelande triggar arbetsflödet. n8n tar emot det inkommande meddelandet via din WhatsApp-webhook, kopplad till ett verifierat företagsnummer.

Arbetsflödet standardiserar meddelandet till text. En klassificerare routar meddelandet efter typ. Om det är ett röstmeddelande hämtas ljudfilen och transkriberas med OpenAI. Om det är en bild hämtas filen och analyseras med ett AI-visionssteg så att frågan blir “ren text” som agenten kan svara på.

AI-agenten genererar supportsvar. Agenten använder en OpenRouter-chatmodell och ett Google Docs-verktyg för att slå upp dina senaste policys, priser och vanliga frågor. Konversationsminne kopplas per telefonnummer, vilket innebär att följdfrågor inte nollställer tråden.

Svaret skickas tillbaka till WhatsApp. Det slutliga meddelandet formateras för WhatsApp och levereras automatiskt, så kunden får ett snabbt svar utan att vänta på att en människa ska bli ledig.

Du kan enkelt ändra kunskapsbasens struktur för att stödja nya produktlinjer eller en annan tonalitet utifrån dina behov. Se hela implementationsguiden nedan för anpassningsalternativ.

Steg-för-steg-guide för implementering

Steg 1: konfigurera WhatsApp-triggern

Börja med att konfigurera WhatsApp-webhooken som tar emot inkommande kundmeddelanden.

  1. Lägg till noden Incoming WhatsApp Hook som din trigger.
  2. Ställ in Updatesmessages.
  3. Inloggningsuppgifter krävs: Anslut era whatsAppTriggerApi-inloggningsuppgifter i Incoming WhatsApp Hook.

Körningen startar i Incoming WhatsApp Hook och routas vidare till Classify Input Format.

Steg 2: klassificera typen av inkommande meddelande

Routa inkommande WhatsApp-meddelanden till bearbetningsspår för text, bild eller ljud med hjälp av switch-logiken.

  1. Lägg till noden Classify Input Format efter Incoming WhatsApp Hook.
  2. Konfigurera regeln Voice så att den kontrollerar {{$json.messages[0].audio}} med operatorn Exists.
  3. Konfigurera regeln Image så att den kontrollerar {{$json.messages[0].image}} med operatorn Exists.
  4. Konfigurera regeln Text så att den kontrollerar {{$json.messages[0].text.body}} med operatorn Exists.

Noden Classify Input Format routar till Fetch Audio Link, Fetch Image Link eller Text Message Formatter baserat på meddelandetyp.

Steg 3: bearbeta text-, bild- och ljudinmatningar

Konfigurera indata-specifika pipelines som omvandlar varje meddelandetyp till en enhetlig text-payload.

  1. I Text Message Formatter ställer ni in tilldelningsvärdet för text till {{ $('Incoming WhatsApp Hook').item.json.messages[0].text.body }}.
  2. För ljud: konfigurera Fetch Audio Link med Resource media, Operation mediaUrlGet och Media Get ID {{ $('Incoming WhatsApp Hook').item.json.messages[0].audio.id }}.
  3. Koppla Fetch Audio LinkRetrieve Audio File och ställ in URL till {{$json.url}}, med Authentication genericCredentialType och Generic Auth Type httpHeaderAuth.
  4. Koppla Retrieve Audio FileAudio Transcription och ställ in Resource till audio och Operation till transcribe.
  5. I Audio Text Formatter ställer ni in tilldelningsvärdet för text till {{$json.text}}.
  6. För bilder: konfigurera Fetch Image Link med Resource media, Operation mediaUrlGet och Media Get ID {{ $('Incoming WhatsApp Hook').item.json.messages[0].image.id }}.
  7. Koppla Fetch Image LinkRetrieve Image File och ställ in URL till {{$json.url}}, med Authentication genericCredentialType och Generic Auth Type httpHeaderAuth.
  8. Koppla Retrieve Image FileImage Content Review och ställ in Resource till image, Operation till analyze, Input Type till base64 och Text till Describe the image in detail..
  9. I Image Text Composer ställer ni in tilldelningsvärdet för text till # The user provided the following image and text. ## IMAGE CONTENT: {{ $json.content }} ## USER MESSAGE: {{ $('Incoming WhatsApp Hook').item.json.messages[0].image.caption || "Describe the image" }}.

Inloggningsuppgifter krävs: Anslut era whatsAppApi-inloggningsuppgifter i Fetch Audio Link och Fetch Image Link.

Inloggningsuppgifter krävs: Anslut era httpHeaderAuth-inloggningsuppgifter i Retrieve Audio File och Retrieve Image File.

Inloggningsuppgifter krävs: Anslut era openAiApi-inloggningsuppgifter i Audio Transcription och Image Content Review.

⚠️ Vanlig fallgrop: Om WhatsApps media-URL går ut snabbt, testa workflowet direkt efter att ni har skickat ett ljud- eller bildmeddelande.

Steg 4: konfigurera AI-orkestreringslagret

Konfigurera AI-agenten, minnet, språkmodellen och dokumentverktyget som används för att generera korrekta svar.

  1. I Support AI Orchestrator ställer ni in Text till {{$json.text}} och behåller Prompt Type som define.
  2. Säkerställ att systemprompten i Support AI Orchestrator innehåller dynamiska värden som {{ $('Incoming WhatsApp Hook').item.json.contacts[0].profile.name }} och {{ $now.toString() }}.
  3. Koppla Conversation Memory till Support AI Orchestrator via porten AI Memory och ställ in Session Key till {{ $('Incoming WhatsApp Hook').item.json.messages[0].from }} med Context Window Length 20.
  4. Koppla Fetch Docs Reference till Support AI Orchestrator som ett AI Tool och ställ in Operation till get med Document URL [YOUR_ID].
  5. Koppla OpenRouter Chat Engine till Support AI Orchestrator som AI Language Model och ställ in Model till anthropic/claude-sonnet-4.

Inloggningsuppgifter krävs: Anslut era openRouterApi-inloggningsuppgifter för anslutningen OpenRouter Chat EngineSupport AI Orchestrator.

Inloggningsuppgifter krävs: Anslut era googleDocsOAuth2Api-inloggningsuppgifter för verktygsanslutningen Fetch Docs ReferenceSupport AI Orchestrator.

Tips: Conversation Memory och Fetch Docs Reference är AI-undernoder. Hantera deras inloggningsuppgifter och anslutningar från Support AI Orchestrator, inte direkt på undernoderna.

Steg 5: konfigurera leverans av WhatsApp-svar

Skicka det AI-genererade svaret tillbaka till WhatsApp-användaren.

  1. Lägg till Send WhatsApp Reply efter Support AI Orchestrator.
  2. Ställ in Operation till send och Text Body till {{$json.output}}.
  3. Ställ in Phone Number ID till [YOUR_ID].
  4. Ställ in Recipient Phone Number till {{ $('Incoming WhatsApp Hook').item.json.messages[0].from }}.
  5. Inloggningsuppgifter krävs: Anslut era whatsAppApi-inloggningsuppgifter i Send WhatsApp Reply.

⚠️ Vanlig fallgrop: Ersätt [YOUR_ID] i Send WhatsApp Reply och Fetch Docs Reference med ert faktiska WhatsApp Business Phone Number ID och Google Doc-URL.

Steg 6: testa och aktivera ert workflow

Validera varje gren (text, bild, ljud) och aktivera workflowet för produktionsanvändning.

  1. Klicka på Execute Workflow och skicka ett WhatsApp-testmeddelande med text för att trigga Text Message FormatterSupport AI OrchestratorSend WhatsApp Reply.
  2. Skicka en bild och bekräfta att flödet Fetch Image LinkRetrieve Image FileImage Content ReviewImage Text ComposerSupport AI Orchestrator slutförs med ett svar.
  3. Skicka ett röstmeddelande och bekräfta att flödet Fetch Audio LinkRetrieve Audio FileAudio TranscriptionAudio Text FormatterSupport AI Orchestrator slutförs med ett svar.
  4. Verifiera lyckad körning genom att kontrollera att Send WhatsApp Reply returnerar ett meddelande till avsändaren.
  5. Växla workflowet till Active när alla grenar svarar korrekt.
🔒

Lås upp fullständig steg-för-steg-guide

Få den kompletta implementeringsguiden + nedladdningsbar mall

Vanliga fallgropar

  • Inloggningsuppgifter för WhatsApp Business API kan löpa ut eller kräva specifika behörigheter. Om något slutar fungera, kontrollera först inställningarna i din Meta-utvecklarapp och webhook-prenumerationer.
  • Om du använder Wait-noder eller extern rendering varierar processtiderna. Öka väntetiden om noder längre fram misslyckas på grund av tomma svar.
  • Standardprompter i AI-noder är generiska. Lägg in din varumärkesröst tidigt, annars kommer du att redigera output för alltid.

Vanliga frågor

Hur lång tid tar det att sätta upp den här automatiseringen för WhatsApp-support?

Räkna med cirka 2–3 timmar om dina API-konton är klara.

Behöver jag kunna koda för att automatisera WhatsApp-support?

Nej. Du kommer mest att koppla konton och klistra in API-nycklar i n8n-autentiseringsuppgifter.

Är n8n gratis att använda för det här arbetsflödet för automatisering av WhatsApp-support?

Ja. n8n har ett gratis alternativ för egen drift och en gratis provperiod på n8n Cloud. Cloud-planer börjar på 20 USD/månad för högre volymer. Du behöver också räkna in OpenAI API-kostnader för transkribering och bildanalys, plus OpenRouter-modellanvändning för chatagenten.

Var kan jag hosta n8n för att köra den här automatiseringen?

Två alternativ: n8n Cloud (hanterad, enklast att komma igång) eller egen drift på en VPS. För egen drift är Hostinger VPS prisvärd och klarar n8n bra. Egen drift ger obegränsade körningar men kräver grundläggande serverhantering.

Kan jag anpassa det här arbetsflödet för automatisering av WhatsApp-support för att lägga till fler språk?

Ja. Du justerar AI-agentens systemprompt för att lägga till språkregler och du kan bygga ut logiken för språkdetektering på samma ställe där du i dag hanterar engelska och roman urdu. Många team anpassar också strukturen i Google Docs (tydliga FAQ-rubriker hjälper) och lägger till en regel för “överlämning till människa” när agenten inte är säker.

Varför misslyckas min WhatsApp Business API-anslutning i det här arbetsflödet?

Oftast beror det på utgångna autentiseringsuppgifter eller ett webhook-/prenumerationsproblem i din Meta-app. Skapa en ny token, bekräfta att telefonnumret fortfarande är anslutet och kontrollera webhook-behörigheter igen. Om det bara faller på meddelanden med media är det ofta nedladdningsanropet som är boven (fel URL, saknat auth-header eller att medialänken redan har löpt ut).

Hur många meddelanden kan den här automatiseringen för WhatsApp-support hantera?

Många, men det beror på var du kör n8n och dina API-gränser.

Är den här automatiseringen för WhatsApp-support bättre än att använda Zapier eller Make?

För WhatsApp-support med mycket media är n8n oftast ett bättre val eftersom du kan grena logik fritt, behålla konversationsminne och köra egen drift för hög volym utan att betala per litet delsteg. Zapier och Make kan fungera, men AI-flöden i många steg (ladda ner media, transkribera, analysera, fråga kunskapsbasen, svara) blir dyra och svårare att underhålla. n8n gör det också enklare att byta modell senare om du vill. Nackdelen är mer komplex uppsättning, särskilt kring WhatsApp Business API. Prata med en automationsexpert om du vill ha hjälp att välja.

När det här väl rullar blir ditt Google-dokument hjärnan och WhatsApp blir receptionen. Sätt upp det, finjustera tonen och låt arbetsflödet hantera de repetitiva frågorna medan du fokuserar på undantagen.

Kontakta oss

Hör av dig, så diskuterar vi hur just din verksamhet kan dra nytta av alla fantastiska möjligheter som AI skapar.

×

Använd mall

Få direkt tillgång till denna n8n-arbetsflödes JSON-fil

Launch login modal Launch register modal