Din inkorg blir inte rörig för att du är lat. Den blir rörig för att så fort du är borta från din laptop förvandlas ”jag svarar senare” till en bortglömd tråd, en missad introduktion eller en uppföljning som kommer två dagar för sent.
Den här WhatsApp Gmail-automationen gör som mest nytta när du är i rörelse: en konsult mellan kundsamtal, en liten byråägare som jonglerar godkännanden eller en grundare som både säljer och levererar samtidigt. Du kan skicka, skapa utkast eller söka i Gmail med ett snabbt WhatsApp-meddelande eller en röstanteckning och sedan få en tydlig bekräftelse tillbaka.
Nedan ser du exakt vad workflowet gör, vad du behöver och hur logiken fungerar så att du kan lita på det innan du förlitar dig på det.
Så fungerar den här automatiseringen
Här är hela workflowet du kommer att sätta upp:
n8n Workflow Template: WhatsApp + Gmail: röstnotiser till skickade mejl snabbt
flowchart LR
subgraph sg0["WhatsApp Incoming Flow"]
direction LR
n0@{ icon: "mdi:robot", form: "rounded", label: "Mail Orchestrator", pos: "b", h: 48 }
n1@{ icon: "mdi:message-outline", form: "rounded", label: "Dispatch Gmail Message", pos: "b", h: 48 }
n2@{ icon: "mdi:message-outline", form: "rounded", label: "Generate Gmail Draft", pos: "b", h: 48 }
n3@{ icon: "mdi:brain", form: "rounded", label: "Chat Model Engine", pos: "b", h: 48 }
n4["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/whatsapp.svg' width='40' height='40' /></div><br/>WhatsApp Incoming Trigger"]
n5@{ icon: "mdi:swap-horizontal", form: "rounded", label: "Route by Message Type", pos: "b", h: 48 }
n6["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/httprequest.dark.svg' width='40' height='40' /></div><br/>External File Fetch"]
n7@{ icon: "mdi:robot", form: "rounded", label: "Audio Transcription AI", pos: "b", h: 48 }
n8@{ icon: "mdi:swap-vertical", form: "rounded", label: "Map Text Fields", pos: "b", h: 48 }
n9@{ icon: "mdi:swap-vertical", form: "rounded", label: "Expand Message Items", pos: "b", h: 48 }
n10@{ icon: "mdi:swap-vertical", form: "rounded", label: "Assign Message Type", pos: "b", h: 48 }
n11["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/whatsapp.svg' width='40' height='40' /></div><br/>Send WhatsApp Text"]
n12@{ icon: "mdi:memory", form: "rounded", label: "Session Memory Buffer", pos: "b", h: 48 }
n13["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/whatsapp.svg' width='40' height='40' /></div><br/>WhatsApp Media Lookup"]
n14@{ icon: "mdi:robot", form: "rounded", label: "Voice Synthesis AI", pos: "b", h: 48 }
n15["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/code.svg' width='40' height='40' /></div><br/>Transform Audio MIME"]
n16@{ icon: "mdi:swap-horizontal", form: "rounded", label: "Audio Branch Check", pos: "b", h: 48 }
n17["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/whatsapp.svg' width='40' height='40' /></div><br/>Upload WhatsApp Media"]
n18["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/whatsapp.svg' width='40' height='40' /></div><br/>Send WhatsApp Audio"]
n19@{ icon: "mdi:database", form: "rounded", label: "Retrieve Contact Email", pos: "b", h: 48 }
n16 --> n14
n16 --> n11
n15 --> n17
n7 --> n10
n5 --> n13
n5 --> n8
n14 --> n15
n19 -.-> n0
n9 --> n5
n1 -.-> n0
n8 --> n10
n0 --> n16
n2 -.-> n0
n10 --> n0
n6 --> n7
n12 -.-> n0
n4 --> n9
n3 -.-> n0
n13 --> n6
n17 --> n18
end
%% Styling
classDef trigger fill:#e8f5e9,stroke:#388e3c,stroke-width:2px
classDef ai fill:#e3f2fd,stroke:#1976d2,stroke-width:2px
classDef aiModel fill:#e8eaf6,stroke:#3f51b5,stroke-width:2px
classDef decision fill:#fff8e1,stroke:#f9a825,stroke-width:2px
classDef database fill:#fce4ec,stroke:#c2185b,stroke-width:2px
classDef api fill:#fff3e0,stroke:#e65100,stroke-width:2px
classDef code fill:#f3e5f5,stroke:#7b1fa2,stroke-width:2px
classDef disabled stroke-dasharray: 5 5,opacity: 0.5
class n4 trigger
class n0,n7,n14 ai
class n3 aiModel
class n12 ai
class n5,n16 decision
class n19 database
class n6 api
class n15 code
class n12 disabled
classDef customIcon fill:none,stroke:none
class n4,n6,n11,n13,n15,n17,n18 customIcon
Varför det här spelar roll: skicka mejl när du inte sitter vid skrivbordet
Gmail är där affärer drivs framåt, projekt får fart igen och relationer hålls varma. Men mejl är också klumpigt på mobilen när du behöver söka kontext, komma ihåg vem ”Claire från förra månaden” är och skriva något som låter som du (inte som en stressad text som knappats in med tummen). Röstanteckningar hjälper, tills du fastnar i att spela upp dem, transkribera detaljer manuellt och ändå kopiera allt till ett ordentligt mejl. Multiplicera det med ett par uppföljningar om dagen så blir det en tyst skatt på din tid och ditt fokus. Ärligt talat är den svåraste delen den mentala belastningen: du har för många halvfärdiga meddelanden i huvudet.
Friktionen byggs upp på några förutsägbara ställen.
- Du tappar tid på att leta upp rätt tråd i Gmail på telefonen och skriver sedan om sådant du redan vet att du behöver säga.
- Röstanteckningar blir inte handling av sig själva, så ”snabbt meddelande senare” blir en backlogg till fredag.
- Kontaktuppgifter finns på för många ställen, vilket gör att du börjar tveka på adresser, titlar och företagsnamn mitt i ett svar.
- Även när du skickar mejlet undrar du fortfarande om det verkligen gick iväg till rätt person.
Det du bygger: ett WhatsApp-baserat ”e-postkommandocenter” för Gmail
Det här workflowet låter dig använda WhatsApp som en smart fjärrkontroll för Gmail. Du skickar ett meddelande (skrivet eller en röstanteckning) som låter naturligt, som ”skicka en uppföljning till Claire” eller ”skapa ett utkast som bekräftar i morgon kl 17”. Om det är ljud hämtar workflowet mediafilen och transkriberar den med OpenAI Whisper. Sedan läser en AI-agent av intentionen, tar in lätt kontext (inklusive valfritt sessionsminne och kontaktuppslag i Airtable) och väljer rätt Gmail-åtgärd: sök, skapa utkast eller skicka. Till sist svarar den dig i WhatsApp med en tydlig bekräftelse, antingen som text eller som ett genererat röstsvar.
Workflowet startar med att webhooken i WhatsApp Business Cloud tar emot ditt meddelande. Därifrån routar den efter meddelandetyp, översätter ljud till text vid behov och lämnar instruktionen till e-postorkestratorn. Gmail gör jobbet och WhatsApp är där du får ”klart”-bekräftelsen tillbaka.
Det du bygger
| Vad som automatiseras | Vad du uppnår |
|---|---|
|
|
Förväntade resultat
Säg att du skickar 10 uppföljningar i veckan när du inte sitter vid skrivbordet. Manuellt kanske du lägger cirka 10 minuter per styck: hitta tråden, leta kontext, skriva noggrant och sedan dubbelkolla att det skickades. Det är ungefär 100 minuter i veckan. Med det här workflowet kan du spela in en 20 sekunder lång WhatsApp-röstanteckning, vänta en minut på transkribering och utkast, och sedan svara ”skicka” (eller låta den skicka direkt). I praktiken får de flesta tillbaka ungefär en timme i veckan, och uppföljningarna sker i tid.
Innan du börjar
- n8n-instans (prova n8n Cloud gratis)
- Alternativ för egen hosting om du föredrar det (Hostinger fungerar bra)
- WhatsApp Business Cloud för att ta emot och skicka WhatsApp-meddelanden
- Gmail eller Google Workspace för att söka, skapa utkast och skicka mejl
- OpenAI API-nyckel (hämta den i din OpenAI-dashboard)
- Airtable-konto för att slå upp kontakter och logga minne
Kunskapsnivå: Medel. Du kopplar API:er (Meta, Google, OpenAI) och testar några riktiga meddelanden hela vägen.
Vill du att någon bygger detta åt dig? Prata med en automatiseringsexpert (gratis 15-minuters konsultation).
Steg för steg
Ett WhatsApp-meddelande triggar allt. Webhooken i WhatsApp Business Cloud tar emot din inkommande text eller röstanteckning och expanderar sedan meddelandeposter så att workflowet kan hantera varje meddelande korrekt.
Röstanteckningar blir instruktioner. Om meddelandet är ljud slår workflowet upp media, laddar ner det via en HTTP-förfrågan och transkriberar det med OpenAI Whisper så att resten av flödet kan behandla det som vanlig text.
En AI-agent routar Gmail-åtgärden. ”E-postorkestratorn” använder en OpenAI-chatmodell plus en sessionsminnesbuffer, och den kan också hämta en e-postadress från Airtable när ditt meddelande bara innehåller ett namn. Sedan väljer den rätt Gmail-verktyg: sök, skapa utkast eller skicka.
Du får en bekräftelse tillbaka i WhatsApp. Workflowet skickar dig ett svar på vanlig svenska, och om du föredrar ljudbekräftelser kan den syntetisera ett röstsvar, ladda upp det till WhatsApp och skicka det som ett röstmeddelande.
Du kan enkelt ändra bekräftelsestilen (text vs röst) så att den passar din vardag. Se hela implementationsguiden nedan för anpassningsalternativ.
Steg-för-steg-guide för implementering
Steg 1: konfigurera WhatsApp-triggern
Konfigurera inkommande WhatsApp-webhook så att nya meddelanden kommer in i arbetsflödet.
- Lägg till och konfigurera WhatsApp Incoming Trigger med Updates satt till
messages. - Autentiseringsuppgifter krävs: Anslut era
whatsAppTriggerApi-autentiseringsuppgifter för WhatsApp Incoming Trigger. - Verifiera att noden är ansluten till Expand Message Items som första bearbetningssteg.
Steg 2: routa inkommande meddelanden efter typ
Dela upp inkommande data och routa text kontra ljudinnehåll till rätt bearbetningsspår.
- I Expand Message Items ställer ni in Field to Split Out till
={{ $json.field }}. - I Route by Message Type behåller ni regeln för ljud med
={{ $('WhatsApp Incoming Trigger').item.json.messages[0].type }}lika medaudio. - Behåll regeln för text med
={{ $('WhatsApp Incoming Trigger').item.json.messages[0].type }}lika medtext. - Anslut ljud-utgången till WhatsApp Media Lookup och text-utgången till Map Text Fields.
Steg 3: mappa innehåll och bygg AI-indata
Normalisera text eller transkriberat ljud till en gemensam struktur för AI-agenten.
- I Map Text Fields ställer ni in tilldelningsvärdet för text till
={{ $('WhatsApp Incoming Trigger').item.json.messages[0].text.body }}. - I Assign Message Type ställer ni in message_type till
={{ $json.text }}. - Bekräfta att flödet från Audio Transcription AI till Assign Message Type är anslutet för ljudspåret.
Steg 4: konfigurera AI-orkestrering och verktyg
Konfigurera agenten, språkmodellen och AI-verktygen som används för att utforma eller skicka e-post.
- I Mail Orchestrator ställer ni in Text till
={{ $json.message_type }}och behåller den definierade systemprompten. - Anslut Chat Model Engine som språkmodell med Model satt till
gpt-4-turbo-preview. - Autentiseringsuppgifter krävs: Anslut era
openAiApi-autentiseringsuppgifter i Chat Model Engine. - Säkerställ att Dispatch Gmail Message använder sendTo
={{ $fromAI("emailAddress") }}, message={{ $fromAI("emailBody") }}och subject={{ $fromAI("subject") }}. - Säkerställ att Generate Gmail Draft har resource satt till
draft, emailType satt tillhtmloch värden mappade via={{ $fromAI("emailBody") }}och={{ $fromAI("subject") }}. - Autentiseringsuppgifter krävs: Anslut era
gmailOAuth2-autentiseringsuppgifter för både Dispatch Gmail Message och Generate Gmail Draft. - Konfigurera Retrieve Contact Email med era base- och tabell-ID:n och behåll Filter By Formula som
={{ /*n8n-auto-generated-fromAI-override*/ $fromAI('Filter_By_Formula', ``, 'string') }}. - Autentiseringsuppgifter krävs: Anslut era
airtableTokenApi-autentiseringsuppgifter för Retrieve Contact Email. - Observera att Dispatch Gmail Message, Generate Gmail Draft och Retrieve Contact Email är AI-verktyg—autentiseringsuppgifter ska läggas till på dessa verktygsnoder, medan Chat Model Engine tillhandahåller modellen för Mail Orchestrator.
={{ $('Assign Message Type').item.json.message_type }}.Steg 5: konfigurera ljudbearbetning och WhatsApp-svar
Hantera ljudmeddelanden, konvertera dem och skicka tillbaka antingen ljud- eller textsvar.
- I WhatsApp Media Lookup ställer ni in Media Get ID till
={{ $json.audio.id }}. - I External File Fetch ställer ni in URL till
={{ $json.url }}och behåller Authentication sompredefinedCredentialTypemedwhatsAppApi. - Autentiseringsuppgifter krävs: Anslut era
whatsAppApi-autentiseringsuppgifter för WhatsApp Media Lookup och External File Fetch. - I Audio Transcription AI behåller ni Resource satt till
audiooch Operation satt tilltranscribe; anslutopenAiApi-autentiseringsuppgifter. - I Voice Synthesis AI ställer ni in Input till
={{ $json.output }}och Voice tillnova; anslutopenAiApi-autentiseringsuppgifter. - I Transform Audio MIME behåller ni den medföljande JavaScript-koden för att ändra
audio/mp3tillaudio/mpeg. - I Upload WhatsApp Media och Send WhatsApp Audio ersätter ni
[YOUR_ID]för phoneNumberId och recipientPhoneNumber. - I Send WhatsApp Text ställer ni in Text Body till
={{ $json.output }}och ersätter[YOUR_ID]-värden.
Steg 6: testa och aktivera ert arbetsflöde
Validera både ljud- och textflöden och aktivera sedan arbetsflödet för produktion.
- Klicka på Execute Workflow och skicka ett WhatsApp-testmeddelande i text för att trigga WhatsApp Incoming Trigger.
- Bekräfta att Map Text Fields → Assign Message Type → Mail Orchestrator körs och att ett svar skickas via Send WhatsApp Text.
- Skicka ett WhatsApp-ljudmeddelande och verifiera flödet: WhatsApp Media Lookup → External File Fetch → Audio Transcription AI → Assign Message Type → Mail Orchestrator → Voice Synthesis AI → Transform Audio MIME → Upload WhatsApp Media → Send WhatsApp Audio.
- Kontrollera Gmail-åtgärder genom att bekräfta att Dispatch Gmail Message skickar ett e-postmeddelande eller att Generate Gmail Draft skapar ett utkast baserat på AI-utdata.
- När allt fungerar, växla arbetsflödet till Active för kontinuerlig drift.
Felsökningstips
- Inloggningsuppgifter för WhatsApp Business Cloud kan löpa ut eller vara kopplade till fel Meta-app. Om det skapar fel, kontrollera först webhook- och tokeninställningar i din Meta Developer Console.
- Om du använder Wait-liknande beteende (transkribering, röstsyntes eller externa hämtningar) varierar bearbetningstiderna. Öka väntetiden eller lägg till ett retry om nedströmssteg misslyckas på grund av saknat ljud eller tom transkribering.
- Standardprompter i AI-noder är generiska. Lägg in din tonalitet och dina sändregler tidigt (ton, signatur, när det ska bli utkast vs skickas), annars kommer du att redigera output för alltid.
Snabba svar
Cirka 30–60 minuter om dina konton är redo.
Nej. Du kopplar mest konton och klistrar in inloggningsuppgifter. Den enda ”tekniska” delen är att testa några exempelmeddelanden för att bekräfta att routningen fungerar.
Ja. n8n har ett gratis alternativ för egen hosting och en gratis provperiod på n8n Cloud. Cloud-planer börjar på 20 USD/månad för högre volym. Du behöver också räkna in OpenAI API-användning för transkribering och chatsvar, samt eventuella kostnader för WhatsApp Cloud-meddelanden från Meta.
Två alternativ: n8n Cloud (hanterat, enklast att sätta upp) eller egen hosting på en VPS. För egen hosting är Hostinger VPS prisvärd och hanterar n8n bra. Egen hosting ger dig obegränsat antal körningar men kräver grundläggande serveradministration.
Ja, och det bör du. Du kan byta kontaktkälla genom att ersätta Airtable-steget ”Retrieve Contact Email” med Google Sheets eller en CRM-uppslagning och sedan behålla samma AI-routning. Vanliga anpassningar är att tvinga ”endast utkast” för säkerhet, lägga till en obligatorisk godkännandefras som ”SKICKA DET” och ändra WhatsApp-bekräftelsen så att den alltid är text i stället för röst.
Oftast beror det på en felaktig eller utgången access token i dina WhatsApp-inloggningsuppgifter, eller att webhooken inte prenumererar på rätt meddelandehändelser i Meta. Det kan också bero på att HTTPS saknas på din n8n-webhook-URL, vilket WhatsApp inte accepterar. Om mediameddelanden misslyckas men text fungerar är stegen för mediauppslag och filhämtning första stället att titta.
För de flesta små team: gott om. I n8n Cloud är du främst begränsad av planens månatliga körningar, medan egen hosting begränsas av dina serverresurser. I praktiken är transkribering och AI-svar flaskhalsen, så om du förväntar dig många röstanteckningar bör du planera för en kö och högre OpenAI-användning.
Ofta, ja, eftersom det här inte är en enkel tvåstegszap. Du har förgreningar (text vs ljud), verktygsliknande åtgärder (sök vs utkast vs skicka) och ett minneslager, vilket n8n hanterar snyggt utan att prissättningen blir en obehaglig överraskning. Zapier eller Make kan fortfarande fungera om du bara behöver ”WhatsApp-meddelande → skapa Gmail-utkast” utan AI-agentens beslut. Om tillförlitlighet och skyddsräcken är viktigt vill du ha den extra logiken. Om snabb uppsättning är viktig och ditt användningsfall är litet kan Zapier räcka. Prata med en automatiseringsexpert om du är osäker på vad som passar.
När detta väl är igång slutar uppföljningarna att staplas i huvudet. Du skickar instruktionen, får bekräftelsen och går vidare med din dag.
Kontakta oss
Hör av dig, så diskuterar vi hur just din verksamhet kan dra nytta av alla fantastiska möjligheter som AI skapar.