Behöver ert företag hjälp med att implementera AI? Kontakta oss och få prisoffert här →
AI Skolan
januari 22, 2026

Telegram + Google gemini: bilder direkt i chatten

Rickard Andersson Partner, Nodenordic.se

Du öppnar Telegram för att fånga en snabb idé, och sedan tappar du 20 minuter på att hoppa mellan AI-verktyg, promptdokumentation och nedladdningar bara för att få fram en enda användbar bild.

Innehållsmarknadsförare känner det när deadlines staplas. En social media manager känner det när godkännanden kommer sent. Och om du driver ett småföretag är det samma visa: automatisering av Telegram-bilder gör “grov idé” till en “delningsklar bild” utan att lämna chatten.

Det här arbetsflödet tar ett Telegram-meddelande, använder Google Gemini för att förbättra prompten, genererar bilden via Pollinations och skickar den färdiga bilden tillbaka till dig. Du får se hur det fungerar, vad du behöver och vad du kan justera.

Så fungerar automatiseringen

Här är hela arbetsflödet du kommer att sätta upp:

n8n Workflow Template: Telegram + Google gemini: bilder direkt i chatten

Varför det här spelar roll: snabba bilder utan verktygshoppande

De flesta “snabba bildönskemål” är inte särskilt snabba. Du börjar med en halvformulerad idé, klistrar in den i ett AI-verktyg, får något som inte matchar varumärket, skriver om prompten, genererar igen, laddar ner, döper om och laddar till sist upp den tillbaka i en chatt eller ett innehållsdokument. Gör du det några gånger om dagen har du i det tysta bränt ungefär 2 timmar på arbete som inte är kreativt. Det värsta är kontextbytena. Du tappar tråden, godkännanden blir försenade och du får göra om bilder eftersom första versionen inte var konsekvent med din stil.

Det summerar snabbt. Så här faller det isär i riktiga team.

  • Idéer kommer in i Telegram, men själva bildgenereringen sker någon annanstans, så förfrågningar missas eller blir försenade.
  • Promptkvaliteten varierar från person till person, vilket gör att “samma kampanj” ser ut som tre olika varumärken.
  • Nedladdningar blir en röra eftersom filer saknar namn, dupliceras eller sparas på fel ställe.
  • Du gör manuell QA på sämsta sätt: generera om, ladda upp igen och förklara ändringarna i chatten.

Det du bygger: Telegram till Gemini till bild, automatiskt

Det här arbetsflödet gör Telegram till din “bildbeställningsdisk”. En användare skickar ett meddelande till din bot (allt från ett grovt koncept till en detaljerad brief). n8n plockar upp det, applicerar dina standardinställningar (som stilhintar, storlek och formatering) och kör sedan idén genom en Gemini-driven promptagent för att göra den mer specifik och mer visuellt tydlig. Därefter bygger n8n den slutliga payloaden och skickar den till Pollinations för att rendera bilden. När Pollinations returnerar resultatet skickar arbetsflödet bilden direkt tillbaka till Telegram som ett foto, och det kan även spara en lokal kopia för arkivering. Resultatet är enkelt: mindre fram-och-tillbaka, färre flikar och konsekvent bättre prompter utan att du behöver en “promptexpert” för varje förfrågan.

Arbetsflödet startar från ett Telegram-meddelande. Gemini uppgraderar det meddelandet till en starkare bildprompt som du kan återanvända. Pollinations genererar själva bilden och Telegram får den färdiga filen så att den går att dela direkt.

Det du bygger

Förväntade resultat

Säg att du behöver 5 visuella assets per dag för inlägg, stories eller snabba promo-mockups. Manuellt är det oftast runt 10 minuter per bild när du räknar in promptjusteringar, omgenereringar, nedladdning, omdöpning och uppladdning igen, alltså ungefär 50 minuter per dag. Med det här arbetsflödet skickar du förfrågan i Telegram (cirka en minut), väntar på genereringen och bilden kommer tillbaka i samma chatt. Du får vanligtvis tillbaka större delen av den timmen, och processen känns lugnare.

Innan du börjar

  • n8n-instans (prova n8n Cloud gratis)
  • Alternativ för egen hosting om du föredrar det (Hostinger fungerar bra)
  • Telegram-bot för att ta emot förfrågningar och svara med bilder
  • Google Gemini API för att generera bildprompter med högre kvalitet
  • Gemini API-nyckel (hämta den från Google AI Studio eller Cloud Console)

Svårighetsgrad: Nybörjare. Du kopplar konton, klistrar in en API-nyckel och justerar några textfält.

Vill du att någon bygger detta åt dig? Prata med en automatiseringsexpert (gratis 15-minuters konsultation).

Steg för steg

Ett Telegram-meddelande startar allt. Telegram Trigger lyssnar efter nya meddelanden som skickas till din bot, så förfrågningar fångas där teamet redan arbetar.

Inställningar och formatering appliceras. n8n mappar dina standardvärden (som bildstorlek, stilnoter och hur du vill att förfrågan ska tolkas) så att varje prompt startar från samma baslinje.

Gemini uppgraderar prompten. En promptskapande agent använder Google Gemini för att göra “gör en banner för vårt webinar” till något mer specifikt, visuellt och konsekvent med din riktning. Sedan sanerar arbetsflödet utdata och förbereder det för rendering.

Pollinations genererar bilden, sedan tar Telegram emot den. n8n skickar ett HTTP-anrop till Pollinations, tar emot det renderade resultatet och publicerar det direkt tillbaka i chatten som ett Telegram-foto. Om du aktiverar lagring skriver det också bildfilen till disk för senare återanvändning.

Du kan enkelt ändra promptstrukturen så att den matchar ditt varumärkes tonalitet utifrån dina behov. Se den fullständiga implementationsguiden nedan för anpassningsalternativ.

Steg-för-steg-guide för implementation

Steg 1: Konfigurera Telegram-triggern

Konfigurera den inkommande Telegram-triggern som startar arbetsflödet och matar in meddelandet i pipelinen.

  1. Lägg till och öppna Telegram Message Trigger.
  2. Inloggningsuppgifter krävs: Anslut era telegramApi-inloggningsuppgifter.
  3. Låt Updates vara satt till message.
  4. Valfritt: Om ni planerar att använda chatt-webhooks senare, notera att Chat Message Listener för närvarande är inaktiverad och kopplar till Map Input Settings.

Om ni aktiverar Chat Message Listener, bekräfta att dess webhook-URL är registrerad och att den är ansluten till Map Input Settings på samma sätt som Telegram Message Trigger.

Steg 2: Anslut indata-inställningar

Mappa det inkommande meddelandet och fasta bildinställningar till en ren JSON-struktur.

  1. Öppna Map Input Settings.
  2. Ställ in model till flux.
  3. Ställ in width till 1080 och height till 1920.
  4. Ställ in chat till {{ $json.message.text }}.
  5. Säkerställ att Telegram Message Trigger (och valfritt Chat Message Listener) är ansluten till Map Input Settings.

Steg 3: Konfigurera AI-promptgeneratorn

Använd Gemini för att skapa strukturerade bildprompter och skicka dem vidare i arbetsflödet.

  1. Öppna Gemini Chat Engine och ställ in Model Name till models/gemini-2.0-flash.
  2. Inloggningsuppgifter krävs: Anslut era googlePalmApi-inloggningsuppgifter.
  3. Öppna Prompt Crafting Agent och ställ in Text till {{ $json.chat }}.
  4. Låt Prompt Type vara satt till define och aktivera Has Output Parser.
  5. Bekräfta att Gemini Chat Engine är ansluten som språkmodell för Prompt Crafting Agent.

⚠️ Vanlig fallgrop: Lägg inte till inloggningsuppgifter direkt i Prompt Crafting Agent—inloggningsuppgifterna måste läggas till i Gemini Chat Engine, som driver agenten.

Steg 4: Normalisera utdata och bygg bildförfrågan

Rensa AI-utdata till en lista med prompter och bygg sedan payloaden för bildförfrågan.

  1. Öppna Sanitize JSON Output och behåll JavaScript Code som den är för att extrahera image_prompt från AI-svaret.
  2. Öppna Build Image Payload och behåll JavaScript Code som mappar image_prompt till en request body med dimensioner från Map Input Settings.
  3. Verifiera att Sanitize JSON Output är ansluten till Build Image Payload, och därefter till Generate File Label.
  4. Öppna Generate File Label och behåll filnamnslogiken så att varje item får images_001.png, images_002.png osv.

Steg 5: Konfigurera bildrendering och parallella utdata

Skicka render-förfrågan och leverera utdata parallellt till lagring och Telegram.

  1. Öppna Image Render Request och ställ in URL till https://image.pollinations.ai/prompt/{{ $json.body.prompt }}.
  2. Ställ in JSON Query till { "width": {{ $('Map Input Settings').item.json.width }}, "height": {{ $('Map Input Settings').item.json.height }}, "model": "{{ $('Map Input Settings').item.json.model }}", "seed": 42, "nologo": true }.
  3. Låt Send Query vara aktiverat och ställ in Specify Query till json.
  4. Verifiera att Image Render Request skickar utdata till både Write Image to Storage och Send Telegram Photo parallellt.
  5. Öppna Write Image to Storage och ställ in File Name till /files/{{ $('Generate File Label').item.json.fileName }} (obs: den här noden är inaktiverad som standard).
  6. Öppna Send Telegram Photo och ställ in Chat ID till ert Telegram-ID, med Operation som sendPhoto och Binary Data aktiverat.
  7. Inloggningsuppgifter krävs: Anslut era telegramApi-inloggningsuppgifter till Send Telegram Photo.

Om ni vill ha lokal filutdata, aktivera Write Image to Storage och säkerställ att runtime-miljön har skrivrättigheter till /files.

Steg 6: Testa och aktivera ert arbetsflöde

Kör ett manuellt test, verifiera utdata och aktivera sedan automatiseringen.

  1. Klicka på Execute Workflow och skicka ett Telegram-meddelande till er bot med en exempelprompt.
  2. Bekräfta att Prompt Crafting Agent returnerar ett strukturerat svar och att Sanitize JSON Output skapar image_prompt-items.
  3. Verifiera att Image Render Request returnerar ett bildsvar och att Send Telegram Photo levererar ett foto till er chatt.
  4. Om aktiverat, bekräfta att Write Image to Storage skriver filen till /files/.
  5. Slå på arbetsflödet till Active för att aktivera användning i produktion.
🔒

Lås upp fullständig steg-för-steg-guide

Få den kompletta implementeringsguiden + nedladdningsbar mall

Tips för felsökning

  • Telegram-inloggningsuppgifter kan vara korrekta men ändå misslyckas om din bots sekretessinställningar blockerar meddelanden i grupper. Kontrollera BotFather-inställningar och dina Telegram-credentials i n8n först.
  • Om du använder Wait-noder eller extern rendering varierar processtiderna. Öka väntetiden om nedströmsnoder misslyckas på grund av tomma svar.
  • Standardprompter i AI-noder är generiska. Lägg in din varumärkesröst tidigt, annars kommer du att redigera utdata för alltid.

Snabba svar

Hur lång tid tar det att sätta upp den här automatiseringen för Telegram-bilder?

Cirka 10–15 minuter om din Telegram-bot och Gemini-nyckel är redo.

Krävs kodning för den här uppgiften med automatisering av Telegram-bilder?

Nej. Du klistrar in credentials och justerar ett par textfält. Arbetsflödeslogiken är redan byggd.

Är n8n gratis att använda för det här arbetsflödet för automatisering av Telegram-bilder?

Ja. n8n har ett gratis alternativ för egen hosting och en gratis provperiod på n8n Cloud. Cloud-planer startar på 20 USD/månad för högre volym. Du behöver också räkna in användning av Google Gemini API (det ingår viss gratis användning, men fakturering måste vara aktiverad).

Var kan jag hosta n8n för att köra den här automatiseringen?

Två alternativ: n8n Cloud (hanterat, enklast uppsättning) eller egen hosting på en VPS. För egen hosting är Hostinger VPS prisvärt och hanterar n8n bra. Egen hosting ger dig obegränsade körningar men kräver grundläggande serveradministration.

Kan jag anpassa det här arbetsflödet för automatisering av Telegram-bilder för olika användningsfall?

Ja, och det bör du. De flesta anpassar Prompt Crafting Agent så att den alltid inkluderar varumärkets stilnoter, produktdetaljer eller “gör/gör inte”-regler. Du kan också ändra steget Map Input Settings för att styra bildstorlek och standardvärden. Om du inte vill spara filer lokalt, inaktivera noden Write Image to Storage och håll allt i Telegram.

Varför misslyckas min Telegram-anslutning i det här arbetsflödet?

Oftast är det en ogiltig bot-token eller att fel Telegram-credentials är valda i n8n. Det kan också hända när boten läggs till i en grupp men inte kan läsa meddelanden på grund av sekretessinställningar. Om triggern fungerar men sändningen misslyckas, bekräfta att chatt-ID:t är giltigt och att boten har behörighet att posta foton.

Vilken volym kan det här arbetsflödet för automatisering av Telegram-bilder hantera?

Det beror främst på hur snabbt bildrenderingen svarar och hur belastad din n8n-instans är. På n8n Cloud beror din månatliga körningsgräns på din plan, medan egen hosting inte har något fast tak (din server är begränsningen). I praktiken börjar många team med några dussin förfrågningar per dag och skalar upp när prompterna sitter.

Är den här automatiseringen för Telegram-bilder bättre än att använda Zapier eller Make?

Ofta, ja. Det här flödet tjänar på att ha flera “tänk”- och bearbetningssteg, och n8n hanterar förgreningar och anpassad logik utan att varje litet steg blir ett prissättningsproblem. Du kan också köra egen hosting, vilket spelar roll när användningen växer. Zapier eller Make kan fortfarande fungera bra för väldigt enkla tvåstegs-zaps, men promptformning plus bildrendering blir ofta pilligt. Om du vill ha den snabbaste vägen till “det bara funkar”, prata med en automatiseringsexpert så pekar vi dig mot rätt verktyg för din situation.

När det här väl rullar slutar bildförfrågningar vara ett störningsmoment och blir i stället ett enkelt chattmeddelande. Sätt upp det en gång, och låt sedan arbetsflödet ta hand om det repetitiva.

Kontakta oss

Hör av dig, så diskuterar vi hur just din verksamhet kan dra nytta av alla fantastiska möjligheter som AI skapar.

×

Använd mall

Få direkt tillgång till denna n8n-arbetsflödes JSON-fil

Få prisoffert redan idag!
Få prisoffert redan idag!

Berätta vad ni behöver hjälp med så hör vi av oss inom en arbetsdag!

Få prisoffert redan idag!
Få prisoffert redan idag!

Berätta vad ni behöver hjälp med så hör vi av oss inom en arbetsdag!

Launch login modal Launch register modal