Behöver ert företag hjälp med att implementera AI? Kontakta oss och få prisoffert här →
AI Skolan
januari 22, 2026

WhatsApp + Google Gemini: direkt kampanjbilder

Rickard Andersson Partner, Nodenordic.se

Du har en idé till en kampanjbild. Sedan kommer slitet: öppna ett verktyg, skriva om prompten tre gånger, exportera filen och skicka tillbaka den till teamet. Det är inte “svårt” arbete. Det är den typen av arbete som i tysthet stjäl en timme.

Marknadschefer känner av det här när de försöker hålla högt tempo i kampanjer. En småföretagare känner av det när allt måste göras själv. Och om du driver en byrå med många kunder vet du redan smärtan i “kan vi få en version till?”. Den här WhatsApp Gemini images-automationen gör ett enda WhatsApp-meddelande till en snygg bild du faktiskt kan använda.

Du får se hur arbetsflödet tar din grova idé, uppgraderar den till en stark prompt, genererar bilden med Google Gemini och skickar den färdiga filen direkt tillbaka till WhatsApp.

Så här fungerar den här automationen

Hela n8n-flödet, från trigger till slutresultat:

n8n Workflow Template: WhatsApp + Google Gemini: direkt kampanjbilder

Problemet: kampanjbilder fastnar i “verktygsbyten”

Kampanjbilder ska gå snabbt. I praktiken fastnar de mellan chattar, kreativa verktyg och feedbackloopar av typen “bara en liten justering till”. Någon släpper ett grovt koncept i WhatsApp, du kopierar det till en bildgenerator, resultatet är nära men inte i linje med varumärket, så du skriver om prompten. Nu laddar du ner filer, döper om versioner och försöker minnas vilken som var “den bra”. Multiplicera det med några kampanjer (eller några kunder) och du har skapat en pålitlig tidstjuv.

Det går fort att bygga upp. Här faller det oftast:

  • Varje ny bild kräver att prompten skrivs om, vilket gör att en “snabb förfrågan” blir en mini-skrivuppgift.
  • Varumärkeskonsistensen glider eftersom alla promptar olika, även när intentionen är god.
  • Filhanteringen blir rörig, särskilt när du tar fram flera variationer per idé.
  • Farten dör när du måste lämna WhatsApp, öppna andra verktyg och sedan komma tillbaka för att leverera resultatet.

Lösningen: WhatsApp-meddelande → Gemini-bild → fil tillbaka i chatten

Det här flödet gör WhatsApp till en enkel “beställningslåda” för AI-bilder. Du skickar ett meddelande som beskriver vad du vill ha (även om det är kort och stökigt). n8n fångar meddelandet direkt och använder sedan Gemini 2.5 Pro för att utveckla din grova idé till en detaljerad, bildklar prompt som har större chans att ge något användbart på första försöket. Därefter anropar flödet Gemini 2.0 Flash API för bildgenerering via en HTTP-förfrågan, tar emot bilden som Base64-data och konverterar den till en riktig fil. Till sist skickar den tillbaka bildfilen till samma WhatsApp-chatt, så att du kan vidarebefordra den, spara den eller be om en ny variation utan att byta app.

Flödet startar när ett WhatsApp-meddelande når ditt kopplade nummer. Gemini förbättrar prompten och genererar sedan bilden. Slutresultatet är en bildfil som är redo att delas, levererad direkt tillbaka i tråden du redan använder.

Det du får: automation vs. resultat

Exempel: så här ser det ut i praktiken

Säg att du behöver 5 kampanjbilder för en helgrean. Manuellt tar en “enkel” cykel oftast 10 minuter för att skriva om prompts och generera varje bild, plus ytterligare 5 minuter för att exportera, namnge filer och skicka tillbaka dem i chatten. Det är ungefär 75 minuter. Med det här flödet kan du skicka 5 WhatsApp-meddelanden på några minuter totalt, sedan vänta på genereringen och få tillbaka varje bild som en fil i tråden. Realistiskt sett lägger du runt 10 minuter aktiv tid istället för över en timme.

Det du behöver

  • n8n-instans (prova n8n Cloud gratis)
  • Alternativ för egen hosting om du föredrar det (Hostinger fungerar bra)
  • WhatsApp Business Cloud för att ta emot och skicka WhatsApp-meddelanden.
  • Google Gemini för att utveckla prompts och generera bilder.
  • Google Gemini API-nyckel (hämta den från Google AI Studio).

Kunskapsnivå: Medel. Du kopplar WhatsApp + Gemini-uppgifter och klistrar in en API-nyckel i inställningarna för HTTP-förfrågan.

Vill du inte sätta upp detta själv? Prata med en automationsexpert (kostnadsfri konsultation i 15 minuter).

Så fungerar det

Ett WhatsApp-meddelande triggar allt. När någon skickar en text till ditt kopplade WhatsApp-nummer fångar n8n meddelandet och skickar in det i flödet.

Din idé “översätts” till en bättre prompt. Gemini 2.5 Pro tar den korta beskrivningen och gör om den till en detaljerad prompt med stil (den typen som brukar ge bilder av högre kvalitet med färre omtag). En strukturerad prompt-tolkare håller resultatet strukturerat och förutsägbart.

Bilden genereras via ett API-anrop. n8n skickar den förbättrade prompten till Gemini 2.0 Flash-bildendpointen med en HTTP-förfrågan och tar sedan emot resultatet som Base64-bilddata.

Den färdiga filen skickas tillbaka till WhatsApp. Flödet konverterar Base64-resultatet till en faktisk bildfil och svarar i samma chatt, så att den är redo att sparas, vidarebefordras eller granskas.

Du kan enkelt justera prompt-stilen så att den matchar ditt varumärkes tonalitet utifrån dina behov. Se hela implementationsguiden nedan för anpassningsalternativ.

Steg-för-steg-guide för implementering

Steg 1: konfigurera triggern Incoming WhatsApp Hook

Ställ in arbetsflödet så att det startar när ett WhatsApp-meddelande tas emot.

  1. Lägg till och välj noden Incoming WhatsApp Hook som din trigger.
  2. Verifiera att webhooken är redo att ta emot inkommande WhatsApp-meddelanden (noden använder webhook-ID:t som skapats av n8n).
  3. Koppla Incoming WhatsApp Hook till Compose Prompt Text så att det matchar körflödet.

Om ni testar: skicka ett WhatsApp-meddelande till det anslutna numret efter att ni har sparat arbetsflödet för att bekräfta att triggern utlöses.

Steg 2: sätt upp AI-promptkedjan

Generera bildprompttexten med hjälp av AI-kedjan och dess anslutna modell och parser.

  1. Öppna Compose Prompt Text och definiera hur inkommande WhatsApp-innehåll omvandlas till en bildprompt.
  2. Säkerställ att Gemini Pro Chat Model är ansluten till Compose Prompt Text som språkmodell.
  3. Säkerställ att Structured Prompt Parser är ansluten till Compose Prompt Text som output-parser.
  4. Kom ihåg att AI-undernoder som Structured Prompt Parser använder autentiseringsuppgifter från den överordnade kedjan – lägg till autentiseringsuppgifter på Gemini Pro Chat Model, inte på parsern.

⚠️ Common Pitfall: Om AI-modellen inte returnerar strukturerad output kan parsern misslyckas. Håll output-formatet konsekvent med era parserinställningar.

Steg 3: bygg förfrågan för bildgenerering

Skicka prompten till ert API för bildgenerering.

  1. Öppna Create Image Request och konfigurera HTTP-förfrågan till er endpoint för bildgenerering.
  2. Mappa promptutdata från Compose Prompt Text till request body eller query-parametrar.
  3. Bekräfta att Create Image Request är kopplad till Format Image File för att fortsätta flödet.

Steg 4: formatera och skicka tillbaka bilden till WhatsApp

Konvertera API-svaret till en fil och skicka den som ett WhatsApp-svar.

  1. Konfigurera Format Image File för att konvertera bildsvaret till ett filobjekt som lämpar sig för leverans via WhatsApp.
  2. Öppna Dispatch Image Reply och ställ in den att skicka den konverterade filen tillbaka till den ursprungliga WhatsApp-avsändaren.
  3. Verifiera att kopplingsordningen matchar körflödet: Create Image RequestFormat Image FileDispatch Image Reply.

Steg 5: granska Flowpast-varumärkesnotisen (valfritt)

Den fästa notisen är informativ och påverkar inte körningen.

  1. Behåll Flowpast Branding som en visuell referens för dokumentation och ägarskap.

Steg 6: testa och aktivera ert arbetsflöde

Verifiera hela flödet från början till slut och aktivera sedan arbetsflödet för användning i produktion.

  1. Klicka på Execute Workflow och skicka ett testmeddelande i WhatsApp för att trigga Incoming WhatsApp Hook.
  2. Bekräfta att en lyckad körning visar data som passerar genom Compose Prompt Text, Create Image Request, Format Image File och Dispatch Image Reply.
  3. När ni är nöjda, växla arbetsflödet till Active för att aktivera kontinuerlig drift.
🔒

Lås upp fullständig steg-för-steg-guide

Få den kompletta implementeringsguiden + nedladdningsbar mall

Vanliga fallgropar

  • WhatsApp Business Cloud-uppgifter kan löpa ut eller kräva specifika behörigheter. Om något slutar fungera: kontrollera först inställningarna i din Meta-app och tokenstatus.
  • Om du använder Wait-noder eller extern rendering varierar processtiderna. Öka väntetiden om nedströmsnoder misslyckas på grund av tomma svar.
  • Standardprompter i AI-noder är generiska. Lägg in din varumärkeston tidigt, annars kommer du att redigera utdata i all evighet.

Vanliga frågor

Hur lång tid tar det att sätta upp den här WhatsApp Gemini images-automationen?

Cirka 30 minuter om din WhatsApp Business- och Gemini-nyckel är redo.

Behöver jag kunna koda för att automatisera WhatsApp Gemini images?

Nej. Du kommer mest att klistra in en API-nyckel och koppla din WhatsApp-inloggning i n8n.

Är n8n gratis att använda för det här WhatsApp Gemini images-flödet?

Ja. n8n har ett gratis alternativ för egen hosting och en gratis provperiod på n8n Cloud. Cloud-planer börjar på 20 USD/månad för högre volymer. Du behöver också räkna in användningen av Google Gemini API, som oftast är låg för prompt-utveckling och bildgenerering men beror på volym.

Var kan jag hosta n8n för att köra den här automationen?

Två alternativ: n8n Cloud (hanterat, enklast att komma igång) eller egen hosting på en VPS. För egen hosting är Hostinger VPS prisvärt och klarar n8n bra. Egen hosting ger obegränsat antal körningar men kräver grundläggande serverhantering.

Kan jag anpassa det här WhatsApp Gemini images-flödet för en specifik varumärkesstil?

Ja, och det bör du. Den enklaste vinsten är att uppdatera instruktionerna i Gemini-noden “Compose Prompt Text” så att den alltid inkluderar dina varumärkesfärger, ljuspreferenser, kompositionsregler och begränsningar för “gör inte så här”. Vill du ha mer kontroll kan du justera den strukturerade utdata-parsern så att flödet ger konsekventa fält som stil, bildförhållande och negativa prompts. Då får du repeterbara resultat, inte bara turträffar.

Varför misslyckas min WhatsApp Business Cloud-anslutning i det här flödet?

Oftast beror det på en utgången Meta access token eller fel behörigheter i WhatsApp Business Cloud-appen. Skapa en ny token, bekräfta att telefonnumret är det som är kopplat till WhatsApp Trigger och spara om inloggningen i n8n. Om det bara fallerar under intensiva perioder kan det även bero på rate limits, så minska hur ofta du genererar bilder. Kontrollera också att svars-noden skickar en fil (binärdata) och inte den råa Base64-texten.

Hur många bilder kan den här WhatsApp Gemini images-automationen hantera?

I n8n Cloud beror det på din månatliga körningsgräns; om du hostar själv finns ingen hård gräns utöver din server och API-begränsningar.

Är den här WhatsApp Gemini images-automationen bättre än att använda Zapier eller Make?

Ofta, ja. Det här flödet bygger på några saker som är krångliga (eller dyra) i enklare automationsverktyg: att göra AI-utdata till strukturerad data, att anropa ett bild-API med egna parametrar och att konvertera Base64 till en riktig fil för leverans i WhatsApp. n8n ger dig också mer kontroll över förgreningar och omförsök, vilket spelar roll när ett API svarar långsamt eller ger tillfälliga fel. Zapier eller Make kan fortfarande fungera om du bara vill ha ett grundläggande “meddelande in, bild ut”-proof of concept och inte har något emot mindre kontroll. Om du vill ha hjälp att välja, prata med en automationsexpert.

Sätt upp det här en gång och din WhatsApp-tråd blir det snabbaste sättet att förvandla en grov idé till en användbar kampanjbild. Ärligt talat är det en lättnad.

Kontakta oss

Hör av dig, så diskuterar vi hur just din verksamhet kan dra nytta av alla fantastiska möjligheter som AI skapar.

×

Använd mall

Få direkt tillgång till denna n8n-arbetsflödes JSON-fil

Launch login modal Launch register modal