Behöver ert företag hjälp med att implementera AI? Kontakta oss och få prisoffert här →
AI Skolan
januari 22, 2026

WhatsApp + Gmail: röstnotiser till skickade mejl snabbt

Rickard Andersson Partner, Nodenordic.se

Din inkorg blir inte rörig för att du är lat. Den blir rörig för att så fort du är borta från din laptop förvandlas ”jag svarar senare” till en bortglömd tråd, en missad introduktion eller en uppföljning som kommer två dagar för sent.

Den här WhatsApp Gmail-automationen gör som mest nytta när du är i rörelse: en konsult mellan kundsamtal, en liten byråägare som jonglerar godkännanden eller en grundare som både säljer och levererar samtidigt. Du kan skicka, skapa utkast eller söka i Gmail med ett snabbt WhatsApp-meddelande eller en röstanteckning och sedan få en tydlig bekräftelse tillbaka.

Nedan ser du exakt vad workflowet gör, vad du behöver och hur logiken fungerar så att du kan lita på det innan du förlitar dig på det.

Så fungerar den här automatiseringen

Här är hela workflowet du kommer att sätta upp:

n8n Workflow Template: WhatsApp + Gmail: röstnotiser till skickade mejl snabbt

Varför det här spelar roll: skicka mejl när du inte sitter vid skrivbordet

Gmail är där affärer drivs framåt, projekt får fart igen och relationer hålls varma. Men mejl är också klumpigt på mobilen när du behöver söka kontext, komma ihåg vem ”Claire från förra månaden” är och skriva något som låter som du (inte som en stressad text som knappats in med tummen). Röstanteckningar hjälper, tills du fastnar i att spela upp dem, transkribera detaljer manuellt och ändå kopiera allt till ett ordentligt mejl. Multiplicera det med ett par uppföljningar om dagen så blir det en tyst skatt på din tid och ditt fokus. Ärligt talat är den svåraste delen den mentala belastningen: du har för många halvfärdiga meddelanden i huvudet.

Friktionen byggs upp på några förutsägbara ställen.

  • Du tappar tid på att leta upp rätt tråd i Gmail på telefonen och skriver sedan om sådant du redan vet att du behöver säga.
  • Röstanteckningar blir inte handling av sig själva, så ”snabbt meddelande senare” blir en backlogg till fredag.
  • Kontaktuppgifter finns på för många ställen, vilket gör att du börjar tveka på adresser, titlar och företagsnamn mitt i ett svar.
  • Även när du skickar mejlet undrar du fortfarande om det verkligen gick iväg till rätt person.

Det du bygger: ett WhatsApp-baserat ”e-postkommandocenter” för Gmail

Det här workflowet låter dig använda WhatsApp som en smart fjärrkontroll för Gmail. Du skickar ett meddelande (skrivet eller en röstanteckning) som låter naturligt, som ”skicka en uppföljning till Claire” eller ”skapa ett utkast som bekräftar i morgon kl 17”. Om det är ljud hämtar workflowet mediafilen och transkriberar den med OpenAI Whisper. Sedan läser en AI-agent av intentionen, tar in lätt kontext (inklusive valfritt sessionsminne och kontaktuppslag i Airtable) och väljer rätt Gmail-åtgärd: sök, skapa utkast eller skicka. Till sist svarar den dig i WhatsApp med en tydlig bekräftelse, antingen som text eller som ett genererat röstsvar.

Workflowet startar med att webhooken i WhatsApp Business Cloud tar emot ditt meddelande. Därifrån routar den efter meddelandetyp, översätter ljud till text vid behov och lämnar instruktionen till e-postorkestratorn. Gmail gör jobbet och WhatsApp är där du får ”klart”-bekräftelsen tillbaka.

Det du bygger

Förväntade resultat

Säg att du skickar 10 uppföljningar i veckan när du inte sitter vid skrivbordet. Manuellt kanske du lägger cirka 10 minuter per styck: hitta tråden, leta kontext, skriva noggrant och sedan dubbelkolla att det skickades. Det är ungefär 100 minuter i veckan. Med det här workflowet kan du spela in en 20 sekunder lång WhatsApp-röstanteckning, vänta en minut på transkribering och utkast, och sedan svara ”skicka” (eller låta den skicka direkt). I praktiken får de flesta tillbaka ungefär en timme i veckan, och uppföljningarna sker i tid.

Innan du börjar

  • n8n-instans (prova n8n Cloud gratis)
  • Alternativ för egen hosting om du föredrar det (Hostinger fungerar bra)
  • WhatsApp Business Cloud för att ta emot och skicka WhatsApp-meddelanden
  • Gmail eller Google Workspace för att söka, skapa utkast och skicka mejl
  • OpenAI API-nyckel (hämta den i din OpenAI-dashboard)
  • Airtable-konto för att slå upp kontakter och logga minne

Kunskapsnivå: Medel. Du kopplar API:er (Meta, Google, OpenAI) och testar några riktiga meddelanden hela vägen.

Vill du att någon bygger detta åt dig? Prata med en automatiseringsexpert (gratis 15-minuters konsultation).

Steg för steg

Ett WhatsApp-meddelande triggar allt. Webhooken i WhatsApp Business Cloud tar emot din inkommande text eller röstanteckning och expanderar sedan meddelandeposter så att workflowet kan hantera varje meddelande korrekt.

Röstanteckningar blir instruktioner. Om meddelandet är ljud slår workflowet upp media, laddar ner det via en HTTP-förfrågan och transkriberar det med OpenAI Whisper så att resten av flödet kan behandla det som vanlig text.

En AI-agent routar Gmail-åtgärden. ”E-postorkestratorn” använder en OpenAI-chatmodell plus en sessionsminnesbuffer, och den kan också hämta en e-postadress från Airtable när ditt meddelande bara innehåller ett namn. Sedan väljer den rätt Gmail-verktyg: sök, skapa utkast eller skicka.

Du får en bekräftelse tillbaka i WhatsApp. Workflowet skickar dig ett svar på vanlig svenska, och om du föredrar ljudbekräftelser kan den syntetisera ett röstsvar, ladda upp det till WhatsApp och skicka det som ett röstmeddelande.

Du kan enkelt ändra bekräftelsestilen (text vs röst) så att den passar din vardag. Se hela implementationsguiden nedan för anpassningsalternativ.

Steg-för-steg-guide för implementering

Steg 1: konfigurera WhatsApp-triggern

Konfigurera inkommande WhatsApp-webhook så att nya meddelanden kommer in i arbetsflödet.

  1. Lägg till och konfigurera WhatsApp Incoming Trigger med Updates satt till messages.
  2. Autentiseringsuppgifter krävs: Anslut era whatsAppTriggerApi-autentiseringsuppgifter för WhatsApp Incoming Trigger.
  3. Verifiera att noden är ansluten till Expand Message Items som första bearbetningssteg.

Om verifieringen av webhooken misslyckas, kontrollera att WhatsApp-appens callback-URL matchar den som visas i WhatsApp Incoming Trigger.

Steg 2: routa inkommande meddelanden efter typ

Dela upp inkommande data och routa text kontra ljudinnehåll till rätt bearbetningsspår.

  1. I Expand Message Items ställer ni in Field to Split Out till ={{ $json.field }}.
  2. I Route by Message Type behåller ni regeln för ljud med ={{ $('WhatsApp Incoming Trigger').item.json.messages[0].type }} lika med audio.
  3. Behåll regeln för text med ={{ $('WhatsApp Incoming Trigger').item.json.messages[0].type }} lika med text.
  4. Anslut ljud-utgången till WhatsApp Media Lookup och text-utgången till Map Text Fields.

⚠️ Vanlig fallgrop: Om värdena för meddelandetyp inte matchar exakt, routar switchen ingenting. Validera payload-strukturen från WhatsApp Incoming Trigger.

Steg 3: mappa innehåll och bygg AI-indata

Normalisera text eller transkriberat ljud till en gemensam struktur för AI-agenten.

  1. I Map Text Fields ställer ni in tilldelningsvärdet för text till ={{ $('WhatsApp Incoming Trigger').item.json.messages[0].text.body }}.
  2. I Assign Message Type ställer ni in message_type till ={{ $json.text }}.
  3. Bekräfta att flödet från Audio Transcription AI till Assign Message Type är anslutet för ljudspåret.

Samma nod Assign Message Type används av både text- och ljudspåret, vilket håller nedströmslogiken konsekvent.

Steg 4: konfigurera AI-orkestrering och verktyg

Konfigurera agenten, språkmodellen och AI-verktygen som används för att utforma eller skicka e-post.

  1. I Mail Orchestrator ställer ni in Text till ={{ $json.message_type }} och behåller den definierade systemprompten.
  2. Anslut Chat Model Engine som språkmodell med Model satt till gpt-4-turbo-preview.
  3. Autentiseringsuppgifter krävs: Anslut era openAiApi-autentiseringsuppgifter i Chat Model Engine.
  4. Säkerställ att Dispatch Gmail Message använder sendTo ={{ $fromAI("emailAddress") }}, message ={{ $fromAI("emailBody") }} och subject ={{ $fromAI("subject") }}.
  5. Säkerställ att Generate Gmail Draft har resource satt till draft, emailType satt till html och värden mappade via ={{ $fromAI("emailBody") }} och ={{ $fromAI("subject") }}.
  6. Autentiseringsuppgifter krävs: Anslut era gmailOAuth2-autentiseringsuppgifter för både Dispatch Gmail Message och Generate Gmail Draft.
  7. Konfigurera Retrieve Contact Email med era base- och tabell-ID:n och behåll Filter By Formula som ={{ /*n8n-auto-generated-fromAI-override*/ $fromAI('Filter_By_Formula', ``, 'string') }}.
  8. Autentiseringsuppgifter krävs: Anslut era airtableTokenApi-autentiseringsuppgifter för Retrieve Contact Email.
  9. Observera att Dispatch Gmail Message, Generate Gmail Draft och Retrieve Contact Email är AI-verktyg—autentiseringsuppgifter ska läggas till på dessa verktygsnoder, medan Chat Model Engine tillhandahåller modellen för Mail Orchestrator.

⚠️ Vanlig fallgrop: Noden Session Memory Buffer är inaktiverad; om ni aktiverar den, anslut autentiseringsuppgifter på Chat Model Engine (parent) och behåll sessionKey som ={{ $('Assign Message Type').item.json.message_type }}.

Steg 5: konfigurera ljudbearbetning och WhatsApp-svar

Hantera ljudmeddelanden, konvertera dem och skicka tillbaka antingen ljud- eller textsvar.

  1. I WhatsApp Media Lookup ställer ni in Media Get ID till ={{ $json.audio.id }}.
  2. I External File Fetch ställer ni in URL till ={{ $json.url }} och behåller Authentication som predefinedCredentialType med whatsAppApi.
  3. Autentiseringsuppgifter krävs: Anslut era whatsAppApi-autentiseringsuppgifter för WhatsApp Media Lookup och External File Fetch.
  4. I Audio Transcription AI behåller ni Resource satt till audio och Operation satt till transcribe; anslut openAiApi-autentiseringsuppgifter.
  5. I Voice Synthesis AI ställer ni in Input till ={{ $json.output }} och Voice till nova; anslut openAiApi-autentiseringsuppgifter.
  6. I Transform Audio MIME behåller ni den medföljande JavaScript-koden för att ändra audio/mp3 till audio/mpeg.
  7. I Upload WhatsApp Media och Send WhatsApp Audio ersätter ni [YOUR_ID] för phoneNumberId och recipientPhoneNumber.
  8. I Send WhatsApp Text ställer ni in Text Body till ={{ $json.output }} och ersätter [YOUR_ID]-värden.

⚠️ Vanlig fallgrop: Om Upload WhatsApp Media misslyckas, verifiera MIME-konverteringen i Transform Audio MIME och att binärdata finns.

Steg 6: testa och aktivera ert arbetsflöde

Validera både ljud- och textflöden och aktivera sedan arbetsflödet för produktion.

  1. Klicka på Execute Workflow och skicka ett WhatsApp-testmeddelande i text för att trigga WhatsApp Incoming Trigger.
  2. Bekräfta att Map Text FieldsAssign Message TypeMail Orchestrator körs och att ett svar skickas via Send WhatsApp Text.
  3. Skicka ett WhatsApp-ljudmeddelande och verifiera flödet: WhatsApp Media LookupExternal File FetchAudio Transcription AIAssign Message TypeMail OrchestratorVoice Synthesis AITransform Audio MIMEUpload WhatsApp MediaSend WhatsApp Audio.
  4. Kontrollera Gmail-åtgärder genom att bekräfta att Dispatch Gmail Message skickar ett e-postmeddelande eller att Generate Gmail Draft skapar ett utkast baserat på AI-utdata.
  5. När allt fungerar, växla arbetsflödet till Active för kontinuerlig drift.

En lyckad körning visar utdata i Send WhatsApp Text eller Send WhatsApp Audio och motsvarande Gmail-åtgärder initierade av Mail Orchestrator.
🔒

Lås upp fullständig steg-för-steg-guide

Få den kompletta implementeringsguiden + nedladdningsbar mall

Felsökningstips

  • Inloggningsuppgifter för WhatsApp Business Cloud kan löpa ut eller vara kopplade till fel Meta-app. Om det skapar fel, kontrollera först webhook- och tokeninställningar i din Meta Developer Console.
  • Om du använder Wait-liknande beteende (transkribering, röstsyntes eller externa hämtningar) varierar bearbetningstiderna. Öka väntetiden eller lägg till ett retry om nedströmssteg misslyckas på grund av saknat ljud eller tom transkribering.
  • Standardprompter i AI-noder är generiska. Lägg in din tonalitet och dina sändregler tidigt (ton, signatur, när det ska bli utkast vs skickas), annars kommer du att redigera output för alltid.

Snabba svar

Hur lång är uppsättningstiden för den här WhatsApp Gmail-automationen?

Cirka 30–60 minuter om dina konton är redo.

Krävs det kodning för den här röst-till-e-post-automationen?

Nej. Du kopplar mest konton och klistrar in inloggningsuppgifter. Den enda ”tekniska” delen är att testa några exempelmeddelanden för att bekräfta att routningen fungerar.

Är n8n gratis att använda för det här workflowet för WhatsApp Gmail-automation?

Ja. n8n har ett gratis alternativ för egen hosting och en gratis provperiod på n8n Cloud. Cloud-planer börjar på 20 USD/månad för högre volym. Du behöver också räkna in OpenAI API-användning för transkribering och chatsvar, samt eventuella kostnader för WhatsApp Cloud-meddelanden från Meta.

Var kan jag hosta n8n för att köra den här automatiseringen?

Två alternativ: n8n Cloud (hanterat, enklast att sätta upp) eller egen hosting på en VPS. För egen hosting är Hostinger VPS prisvärd och hanterar n8n bra. Egen hosting ger dig obegränsat antal körningar men kräver grundläggande serveradministration.

Kan jag anpassa det här workflowet för WhatsApp Gmail-automation för andra användningsfall?

Ja, och det bör du. Du kan byta kontaktkälla genom att ersätta Airtable-steget ”Retrieve Contact Email” med Google Sheets eller en CRM-uppslagning och sedan behålla samma AI-routning. Vanliga anpassningar är att tvinga ”endast utkast” för säkerhet, lägga till en obligatorisk godkännandefras som ”SKICKA DET” och ändra WhatsApp-bekräftelsen så att den alltid är text i stället för röst.

Varför misslyckas min WhatsApp Business Cloud-anslutning i det här workflowet?

Oftast beror det på en felaktig eller utgången access token i dina WhatsApp-inloggningsuppgifter, eller att webhooken inte prenumererar på rätt meddelandehändelser i Meta. Det kan också bero på att HTTPS saknas på din n8n-webhook-URL, vilket WhatsApp inte accepterar. Om mediameddelanden misslyckas men text fungerar är stegen för mediauppslag och filhämtning första stället att titta.

Vilken volym kan det här workflowet för WhatsApp Gmail-automation hantera?

För de flesta små team: gott om. I n8n Cloud är du främst begränsad av planens månatliga körningar, medan egen hosting begränsas av dina serverresurser. I praktiken är transkribering och AI-svar flaskhalsen, så om du förväntar dig många röstanteckningar bör du planera för en kö och högre OpenAI-användning.

Är den här WhatsApp Gmail-automationen bättre än att använda Zapier eller Make?

Ofta, ja, eftersom det här inte är en enkel tvåstegszap. Du har förgreningar (text vs ljud), verktygsliknande åtgärder (sök vs utkast vs skicka) och ett minneslager, vilket n8n hanterar snyggt utan att prissättningen blir en obehaglig överraskning. Zapier eller Make kan fortfarande fungera om du bara behöver ”WhatsApp-meddelande → skapa Gmail-utkast” utan AI-agentens beslut. Om tillförlitlighet och skyddsräcken är viktigt vill du ha den extra logiken. Om snabb uppsättning är viktig och ditt användningsfall är litet kan Zapier räcka. Prata med en automatiseringsexpert om du är osäker på vad som passar.

När detta väl är igång slutar uppföljningarna att staplas i huvudet. Du skickar instruktionen, får bekräftelsen och går vidare med din dag.

Kontakta oss

Hör av dig, så diskuterar vi hur just din verksamhet kan dra nytta av alla fantastiska möjligheter som AI skapar.

×

Använd mall

Få direkt tillgång till denna n8n-arbetsflödes JSON-fil

Få prisoffert redan idag!
Få prisoffert redan idag!

Berätta vad ni behöver hjälp med så hör vi av oss inom en arbetsdag!

Få prisoffert redan idag!
Få prisoffert redan idag!

Berätta vad ni behöver hjälp med så hör vi av oss inom en arbetsdag!

Launch login modal Launch register modal