Din WhatsApp-inkorg rör sig snabbt. Sedan dyker ett röstmeddelande upp. Någon skickar en suddig produktbild. En annan kund skriver på roman urdu. Plötsligt blir “snabbsvar” en copy-paste-maraton och mycket gissningar.
Automatisering av WhatsApp-support slår först mot supportansvariga, eftersom de äger svarstiden. Men e-handelsoperatörer och ägare av tjänsteföretag känner också av det. Resultatet är enkelt: kunder får konsekventa svar på sekunder, även när meddelandet inte är ren text.
Det här arbetsflödet kopplar WhatsApp till din kunskapsbas i Google Docs, lägger till AI som kan läsa bilder och transkribera röstmeddelanden och svarar automatiskt. Du ser vad det löser, vad det levererar och vad du behöver för att köra det stabilt.
Så här fungerar automatiseringen
Hela n8n-flödet, från trigger till slutligt resultat:
n8n Workflow Template: WhatsApp + Google Docs: snabba support-svar
flowchart LR
subgraph sg0["Incoming WhatsApp Hook Flow"]
direction LR
n0["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/whatsapp.svg' width='40' height='40' /></div><br/>Incoming WhatsApp Hook"]
n1@{ icon: "mdi:robot", form: "rounded", label: "Support AI Orchestrator", pos: "b", h: 48 }
n2@{ icon: "mdi:memory", form: "rounded", label: "Conversation Memory", pos: "b", h: 48 }
n3@{ icon: "mdi:swap-horizontal", form: "rounded", label: "Classify Input Format", pos: "b", h: 48 }
n4["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/whatsapp.svg' width='40' height='40' /></div><br/>Fetch Image Link"]
n5["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/httprequest.dark.svg' width='40' height='40' /></div><br/>Retrieve Image File"]
n6@{ icon: "mdi:robot", form: "rounded", label: "Image Content Review", pos: "b", h: 48 }
n7@{ icon: "mdi:swap-vertical", form: "rounded", label: "Image Text Composer", pos: "b", h: 48 }
n8@{ icon: "mdi:swap-vertical", form: "rounded", label: "Text Message Formatter", pos: "b", h: 48 }
n9["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/whatsapp.svg' width='40' height='40' /></div><br/>Fetch Audio Link"]
n10["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/httprequest.dark.svg' width='40' height='40' /></div><br/>Retrieve Audio File"]
n11@{ icon: "mdi:robot", form: "rounded", label: "Audio Transcription", pos: "b", h: 48 }
n12@{ icon: "mdi:swap-vertical", form: "rounded", label: "Audio Text Formatter", pos: "b", h: 48 }
n13["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/whatsapp.svg' width='40' height='40' /></div><br/>Send WhatsApp Reply"]
n14@{ icon: "mdi:cog", form: "rounded", label: "Fetch Docs Reference", pos: "b", h: 48 }
n15@{ icon: "mdi:brain", form: "rounded", label: "OpenRouter Chat Engine", pos: "b", h: 48 }
n1 --> n13
n12 --> n1
n6 --> n7
n9 --> n10
n4 --> n5
n2 -.-> n1
n10 --> n11
n5 --> n6
n3 --> n9
n3 --> n4
n3 --> n8
n8 --> n1
n11 --> n12
n0 --> n3
n7 --> n1
n15 -.-> n1
n14 -.-> n1
end
%% Styling
classDef trigger fill:#e8f5e9,stroke:#388e3c,stroke-width:2px
classDef ai fill:#e3f2fd,stroke:#1976d2,stroke-width:2px
classDef aiModel fill:#e8eaf6,stroke:#3f51b5,stroke-width:2px
classDef decision fill:#fff8e1,stroke:#f9a825,stroke-width:2px
classDef database fill:#fce4ec,stroke:#c2185b,stroke-width:2px
classDef api fill:#fff3e0,stroke:#e65100,stroke-width:2px
classDef code fill:#f3e5f5,stroke:#7b1fa2,stroke-width:2px
classDef disabled stroke-dasharray: 5 5,opacity: 0.5
class n0 trigger
class n1,n6,n11 ai
class n15 aiModel
class n2 ai
class n3 decision
class n5,n10 api
classDef customIcon fill:none,stroke:none
class n0,n4,n5,n9,n10,n13 customIcon
Problemet: WhatsApp-support blir snabbt omöjlig att skala
WhatsApp är toppen för kunder eftersom det är friktionsfritt. För ditt team innebär det ständiga kontextbyten. Ena minuten är det “Vad är er returpolicy?”, nästa är det ett 40 sekunder långt röstmeddelande med tre frågor i samma klipp, och sedan en bild med “Är det här rätt storlek?” Om du är beroende av att människor kommer ihåg policys, priser och undantag får du långsamma svar, inkonsekventa besked och en supportkö som växer vid sämsta möjliga tillfälle (efter arbetstid, helger, lanseringar). Ärligt talat är den mentala belastningen den verkliga kostnaden.
Friktionen byggs på. Här är var det fallerar i verklig vardagssupport.
- Röstmeddelanden och bilder tvingar fram ett manuellt “avkodningssteg” innan någon ens kan börja svara.
- Två agenter svarar olika på samma fråga, vilket leder till återbetalningar, diskussioner och skärmdumpar med “men ert team sa…”
- Att uppdatera standardsvar fungerar inte när era policys finns i någons huvud i stället för i en enda källa som gäller.
- Flerspråkiga chattar saktar ner allt, eftersom översättning och att hålla en artig ton tar tid och fokus.
Lösningen: autosvar från din kunskapsbas i Google Docs
Det här arbetsflödet gör WhatsApp till en alltid-på-supportkanal som backas upp av din kunskapsbas i Google Docs. Det startar när ett kundmeddelande träffar din WhatsApp-webhook i n8n. Flödet avgör vilken typ av meddelande det är (text, röstmeddelande eller bild) och konverterar sedan allt till korrekt formaterad text: röst transkriberas, bilder beskrivs och ren text formateras. Den texten skickas till en AI-agent som svarar som en professionell supportmedarbetare, hämtar fakta från ditt innehåll i Google Docs och behåller kontext per telefonnummer så att kunden slipper upprepa sig. Till sist skickas svaret tillbaka till WhatsApp automatiskt.
Arbetsflödet börjar med ett inkommande WhatsApp-meddelande och en snabb klassificering. Därifrån laddas media ner vid behov och bearbetas med AI (transkribering för ljud, bildanalys för bilder). AI-agenten använder sedan din Google Docs-referens för att skapa ett konsekvent, varumärkesanpassat svar och skickar tillbaka det inom några sekunder.
Det du får: automatisering vs. resultat
| Vad det här arbetsflödet automatiserar | Resultat du får |
|---|---|
|
|
Exempel: så här kan det se ut
Säg att din inkorg får cirka 40 WhatsApp-meddelanden per dag, och att ungefär 10 av dem är röstmeddelanden eller bilder. Manuellt tar de där 10 meddelandena ofta runt 5 minuter styck (lyssna, tolka, kolla dokumentet, översätta, svara), så du bränner nästan en timme bara på de “svåra” meddelandena. Med det här arbetsflödet triggas kundens meddelande direkt, transkribering eller bildläsning sker i bakgrunden, och svaret skickas tillbaka automatiskt på under en minut. Det är ungefär en timme tillbaka de flesta dagar, och svaren blir konsekventa.
Det här behöver du
- n8n-instans (testa n8n Cloud gratis)
- Alternativ för egen drift om du föredrar det (Hostinger fungerar bra)
- WhatsApp Business API för att ta emot och skicka meddelanden
- Google Docs API för att söka i ditt kunskapsbasdokument
- OpenAI API-nyckel (hämta den i din OpenAI-dashboard)
Kunskapsnivå: Medel. Du kopplar API:er, sätter behörigheter och testar några meddelandetyper end-to-end.
Vill du inte sätta upp det här själv? Prata med en automationsexpert (gratis 15-minuters konsultation).
Så här fungerar det
Ett WhatsApp-meddelande triggar arbetsflödet. n8n tar emot det inkommande meddelandet via din WhatsApp-webhook, kopplad till ett verifierat företagsnummer.
Arbetsflödet standardiserar meddelandet till text. En klassificerare routar meddelandet efter typ. Om det är ett röstmeddelande hämtas ljudfilen och transkriberas med OpenAI. Om det är en bild hämtas filen och analyseras med ett AI-visionssteg så att frågan blir “ren text” som agenten kan svara på.
AI-agenten genererar supportsvar. Agenten använder en OpenRouter-chatmodell och ett Google Docs-verktyg för att slå upp dina senaste policys, priser och vanliga frågor. Konversationsminne kopplas per telefonnummer, vilket innebär att följdfrågor inte nollställer tråden.
Svaret skickas tillbaka till WhatsApp. Det slutliga meddelandet formateras för WhatsApp och levereras automatiskt, så kunden får ett snabbt svar utan att vänta på att en människa ska bli ledig.
Du kan enkelt ändra kunskapsbasens struktur för att stödja nya produktlinjer eller en annan tonalitet utifrån dina behov. Se hela implementationsguiden nedan för anpassningsalternativ.
Steg-för-steg-guide för implementering
Steg 1: konfigurera WhatsApp-triggern
Börja med att konfigurera WhatsApp-webhooken som tar emot inkommande kundmeddelanden.
- Lägg till noden Incoming WhatsApp Hook som din trigger.
- Ställ in Updates på
messages. - Inloggningsuppgifter krävs: Anslut era
whatsAppTriggerApi-inloggningsuppgifter i Incoming WhatsApp Hook.
Körningen startar i Incoming WhatsApp Hook och routas vidare till Classify Input Format.
Steg 2: klassificera typen av inkommande meddelande
Routa inkommande WhatsApp-meddelanden till bearbetningsspår för text, bild eller ljud med hjälp av switch-logiken.
- Lägg till noden Classify Input Format efter Incoming WhatsApp Hook.
- Konfigurera regeln Voice så att den kontrollerar
{{$json.messages[0].audio}}med operatorn Exists. - Konfigurera regeln Image så att den kontrollerar
{{$json.messages[0].image}}med operatorn Exists. - Konfigurera regeln Text så att den kontrollerar
{{$json.messages[0].text.body}}med operatorn Exists.
Noden Classify Input Format routar till Fetch Audio Link, Fetch Image Link eller Text Message Formatter baserat på meddelandetyp.
Steg 3: bearbeta text-, bild- och ljudinmatningar
Konfigurera indata-specifika pipelines som omvandlar varje meddelandetyp till en enhetlig text-payload.
- I Text Message Formatter ställer ni in tilldelningsvärdet för text till
{{ $('Incoming WhatsApp Hook').item.json.messages[0].text.body }}. - För ljud: konfigurera Fetch Audio Link med Resource
media, OperationmediaUrlGetoch Media Get ID{{ $('Incoming WhatsApp Hook').item.json.messages[0].audio.id }}. - Koppla Fetch Audio Link → Retrieve Audio File och ställ in URL till
{{$json.url}}, med AuthenticationgenericCredentialTypeoch Generic Auth TypehttpHeaderAuth. - Koppla Retrieve Audio File → Audio Transcription och ställ in Resource till
audiooch Operation tilltranscribe. - I Audio Text Formatter ställer ni in tilldelningsvärdet för text till
{{$json.text}}. - För bilder: konfigurera Fetch Image Link med Resource
media, OperationmediaUrlGetoch Media Get ID{{ $('Incoming WhatsApp Hook').item.json.messages[0].image.id }}. - Koppla Fetch Image Link → Retrieve Image File och ställ in URL till
{{$json.url}}, med AuthenticationgenericCredentialTypeoch Generic Auth TypehttpHeaderAuth. - Koppla Retrieve Image File → Image Content Review och ställ in Resource till
image, Operation tillanalyze, Input Type tillbase64och Text tillDescribe the image in detail.. - I Image Text Composer ställer ni in tilldelningsvärdet för text till
# The user provided the following image and text. ## IMAGE CONTENT: {{ $json.content }} ## USER MESSAGE: {{ $('Incoming WhatsApp Hook').item.json.messages[0].image.caption || "Describe the image" }}.
Inloggningsuppgifter krävs: Anslut era whatsAppApi-inloggningsuppgifter i Fetch Audio Link och Fetch Image Link.
Inloggningsuppgifter krävs: Anslut era httpHeaderAuth-inloggningsuppgifter i Retrieve Audio File och Retrieve Image File.
Inloggningsuppgifter krävs: Anslut era openAiApi-inloggningsuppgifter i Audio Transcription och Image Content Review.
⚠️ Vanlig fallgrop: Om WhatsApps media-URL går ut snabbt, testa workflowet direkt efter att ni har skickat ett ljud- eller bildmeddelande.
Steg 4: konfigurera AI-orkestreringslagret
Konfigurera AI-agenten, minnet, språkmodellen och dokumentverktyget som används för att generera korrekta svar.
- I Support AI Orchestrator ställer ni in Text till
{{$json.text}}och behåller Prompt Type somdefine. - Säkerställ att systemprompten i Support AI Orchestrator innehåller dynamiska värden som
{{ $('Incoming WhatsApp Hook').item.json.contacts[0].profile.name }}och{{ $now.toString() }}. - Koppla Conversation Memory till Support AI Orchestrator via porten AI Memory och ställ in Session Key till
{{ $('Incoming WhatsApp Hook').item.json.messages[0].from }}med Context Window Length20. - Koppla Fetch Docs Reference till Support AI Orchestrator som ett AI Tool och ställ in Operation till
getmed Document URL[YOUR_ID]. - Koppla OpenRouter Chat Engine till Support AI Orchestrator som AI Language Model och ställ in Model till
anthropic/claude-sonnet-4.
Inloggningsuppgifter krävs: Anslut era openRouterApi-inloggningsuppgifter för anslutningen OpenRouter Chat Engine på Support AI Orchestrator.
Inloggningsuppgifter krävs: Anslut era googleDocsOAuth2Api-inloggningsuppgifter för verktygsanslutningen Fetch Docs Reference på Support AI Orchestrator.
Tips: Conversation Memory och Fetch Docs Reference är AI-undernoder. Hantera deras inloggningsuppgifter och anslutningar från Support AI Orchestrator, inte direkt på undernoderna.
Steg 5: konfigurera leverans av WhatsApp-svar
Skicka det AI-genererade svaret tillbaka till WhatsApp-användaren.
- Lägg till Send WhatsApp Reply efter Support AI Orchestrator.
- Ställ in Operation till
sendoch Text Body till{{$json.output}}. - Ställ in Phone Number ID till
[YOUR_ID]. - Ställ in Recipient Phone Number till
{{ $('Incoming WhatsApp Hook').item.json.messages[0].from }}. - Inloggningsuppgifter krävs: Anslut era
whatsAppApi-inloggningsuppgifter i Send WhatsApp Reply.
⚠️ Vanlig fallgrop: Ersätt [YOUR_ID] i Send WhatsApp Reply och Fetch Docs Reference med ert faktiska WhatsApp Business Phone Number ID och Google Doc-URL.
Steg 6: testa och aktivera ert workflow
Validera varje gren (text, bild, ljud) och aktivera workflowet för produktionsanvändning.
- Klicka på Execute Workflow och skicka ett WhatsApp-testmeddelande med text för att trigga Text Message Formatter → Support AI Orchestrator → Send WhatsApp Reply.
- Skicka en bild och bekräfta att flödet Fetch Image Link → Retrieve Image File → Image Content Review → Image Text Composer → Support AI Orchestrator slutförs med ett svar.
- Skicka ett röstmeddelande och bekräfta att flödet Fetch Audio Link → Retrieve Audio File → Audio Transcription → Audio Text Formatter → Support AI Orchestrator slutförs med ett svar.
- Verifiera lyckad körning genom att kontrollera att Send WhatsApp Reply returnerar ett meddelande till avsändaren.
- Växla workflowet till Active när alla grenar svarar korrekt.
Vanliga fallgropar
- Inloggningsuppgifter för WhatsApp Business API kan löpa ut eller kräva specifika behörigheter. Om något slutar fungera, kontrollera först inställningarna i din Meta-utvecklarapp och webhook-prenumerationer.
- Om du använder Wait-noder eller extern rendering varierar processtiderna. Öka väntetiden om noder längre fram misslyckas på grund av tomma svar.
- Standardprompter i AI-noder är generiska. Lägg in din varumärkesröst tidigt, annars kommer du att redigera output för alltid.
Vanliga frågor
Räkna med cirka 2–3 timmar om dina API-konton är klara.
Nej. Du kommer mest att koppla konton och klistra in API-nycklar i n8n-autentiseringsuppgifter.
Ja. n8n har ett gratis alternativ för egen drift och en gratis provperiod på n8n Cloud. Cloud-planer börjar på 20 USD/månad för högre volymer. Du behöver också räkna in OpenAI API-kostnader för transkribering och bildanalys, plus OpenRouter-modellanvändning för chatagenten.
Två alternativ: n8n Cloud (hanterad, enklast att komma igång) eller egen drift på en VPS. För egen drift är Hostinger VPS prisvärd och klarar n8n bra. Egen drift ger obegränsade körningar men kräver grundläggande serverhantering.
Ja. Du justerar AI-agentens systemprompt för att lägga till språkregler och du kan bygga ut logiken för språkdetektering på samma ställe där du i dag hanterar engelska och roman urdu. Många team anpassar också strukturen i Google Docs (tydliga FAQ-rubriker hjälper) och lägger till en regel för “överlämning till människa” när agenten inte är säker.
Oftast beror det på utgångna autentiseringsuppgifter eller ett webhook-/prenumerationsproblem i din Meta-app. Skapa en ny token, bekräfta att telefonnumret fortfarande är anslutet och kontrollera webhook-behörigheter igen. Om det bara faller på meddelanden med media är det ofta nedladdningsanropet som är boven (fel URL, saknat auth-header eller att medialänken redan har löpt ut).
Många, men det beror på var du kör n8n och dina API-gränser.
För WhatsApp-support med mycket media är n8n oftast ett bättre val eftersom du kan grena logik fritt, behålla konversationsminne och köra egen drift för hög volym utan att betala per litet delsteg. Zapier och Make kan fungera, men AI-flöden i många steg (ladda ner media, transkribera, analysera, fråga kunskapsbasen, svara) blir dyra och svårare att underhålla. n8n gör det också enklare att byta modell senare om du vill. Nackdelen är mer komplex uppsättning, särskilt kring WhatsApp Business API. Prata med en automationsexpert om du vill ha hjälp att välja.
När det här väl rullar blir ditt Google-dokument hjärnan och WhatsApp blir receptionen. Sätt upp det, finjustera tonen och låt arbetsflödet hantera de repetitiva frågorna medan du fokuserar på undantagen.
Kontakta oss
Hör av dig, så diskuterar vi hur just din verksamhet kan dra nytta av alla fantastiska möjligheter som AI skapar.