Ditt team ber om ”en snabb bild” i Telegram, och på något sätt blir det 12 meddelanden fram och tillbaka, tre dåliga generationer och en person som i tysthet fixar prompten. Det är den verkliga kostnaden av att inte ha Telegram-bildautomatisering på plats.
Marknadschefer märker det när de behövde visuellt material till inlägg redan igår. Byråägare märker det när kunder vill ha ”en version till” och din designer redan är fullbokad. Och om du driver ett litet team märker du det eftersom det är du som får städa upp.
Det här flödet gör ett Telegram-meddelande till en förfinad prompt (via Gemini) och en genererad bild (via Hugging Face), och skickar sedan bilden direkt tillbaka i samma chatt. Nedan ser du hur det fungerar, vad det ersätter och vad du ska se upp med.
Så fungerar automatiseringen
Se hur detta löser problemet:
n8n Workflow Template: Telegram + Gemini: AI-bilder direkt i chatten
flowchart LR
subgraph sg0["Incoming Telegram Start Flow"]
direction LR
n0["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/telegram.svg' width='40' height='40' /></div><br/>Incoming Telegram Start"]
n1@{ icon: "mdi:robot", form: "rounded", label: "Agent Orchestrator", pos: "b", h: 48 }
n2@{ icon: "mdi:brain", form: "rounded", label: "Gemini Chat Engine", pos: "b", h: 48 }
n3["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/telegram.svg' width='40' height='40' /></div><br/>Telegram Image Reply"]
n4["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/httprequest.dark.svg' width='40' height='40' /></div><br/>External API Call"]
n5["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/httprequest.dark.svg' width='40' height='40' /></div><br/>Fetch Image File"]
n1 --> n4
n0 --> n1
n2 -.-> n1
n4 --> n5
n5 --> n3
end
%% Styling
classDef trigger fill:#e8f5e9,stroke:#388e3c,stroke-width:2px
classDef ai fill:#e3f2fd,stroke:#1976d2,stroke-width:2px
classDef aiModel fill:#e8eaf6,stroke:#3f51b5,stroke-width:2px
classDef decision fill:#fff8e1,stroke:#f9a825,stroke-width:2px
classDef database fill:#fce4ec,stroke:#c2185b,stroke-width:2px
classDef api fill:#fff3e0,stroke:#e65100,stroke-width:2px
classDef code fill:#f3e5f5,stroke:#7b1fa2,stroke-width:2px
classDef disabled stroke-dasharray: 5 5,opacity: 0.5
class n0 trigger
class n1 ai
class n2 aiModel
class n4,n5 api
classDef customIcon fill:none,stroke:none
class n0,n3,n4,n5 customIcon
Utmaningen: snabba bildförfrågningar blir långsamma, röriga trådar
”Kan du generera en bild på en cyberpunk-katt med solglasögon?” ser enkelt ut tills du försöker få ett bra resultat snabbt. Någon skriver en kort prompt, resultatet blir märkligt och nu gissar ni vad som ska ändras. Lägg till några kollegor som flikar in och Telegram-tråden blir en rörig beslutslogg utan någon tydlig ”slutlig” asset. Än värre: personen som kan prompting blir flaskhalsen, så varje förfrågan hamnar i kö. Den mentala belastningen smyger sig också på. Du växlar hela tiden mellan chatt, AI-verktyg och nedladdningar, och laddar sedan upp filer igen som om det vore 2012.
Det adderas snabbt. Här är var det fallerar i riktiga team.
- Enkla prompts ger inkonsekventa resultat, vilket gör att du bränner tid på ”prompt-debuggning” i stället för att få ut innehåll.
- Folk genererar bilder i olika verktyg, så filer hamnar utspridda på enheter och i chattar.
- Godkännanden drar ut på tiden eftersom ingen är säker på vilken version som är den senaste.
- Manuell nedladdning och uppladdning är småsaker, men du gör det hela dagen.
Lösningen: leverans från Telegram till bild med promptförfining
Det här n8n-flödet gör Telegram till din lätta ”bildbeställningsdisk”. En användare skickar ett meddelande till din bot (till exempel ”/image en futuristisk stadsvy”). Flödet skickar direkt texten genom ett AI-steg (Gemini som standard) som skriver om prompten till något som bildmodeller förstår bättre: tydligare motiv, stilhintar, ljus, komposition och lite mindre tvetydighet. Sedan skickar n8n den förbättrade prompten till Hugging Faces API för bildgenerering (flödet stödjer modeller som black-forest-labs/FLUX.1-schnell). När bilden är genererad hämtar flödet bildfilen och postar den tillbaka i samma Telegram-chatt. Inget flik-hoppande. Inga ”var sparade du den?”-diskussioner. Den största vinsten är att bästa praxis för prompting blir automatiskt i stället för något som bara några få kan.
Flödet startar med en Telegram-trigger. Gemini förfinar prompten, därefter genererar en HTTP-förfrågan bilden via Hugging Face och en sista HTTP-förfrågan hämtar bildfilen. Telegram får den färdiga bilden som ett strukturerat svar, redo för feedback eller godkännande.
Vad som förändras: före vs. efter
| Detta elimineras | Effekten du kommer att se |
|---|---|
|
|
Effekt i verkligheten
Säg att ditt team genererar 10 bilder i veckan för annonser, landningssidor och sociala kanaler. Manuellt tar varje förfrågan ofta cirka 10 minuter med promptjusteringar och sedan ytterligare 5 minuter för att ladda ner, döpa om och ladda upp i Telegram igen, så du hamnar lätt på 2–3 timmar per vecka. Med det här flödet är den ”manuella” delen att skicka ett Telegram-meddelande och invänta svaret, så det blir närmare en minut per förfrågan plus automatiserad processtid. Det är ett par timmar tillbaka varje vecka, utan att ändra hur teamet redan kommunicerar.
Krav
- n8n-instans (testa n8n Cloud gratis)
- Alternativ för egen hosting om du föredrar det (Hostinger fungerar bra)
- Telegram för att ta emot prompts och skicka bilder.
- Google Gemini för promptförfining och konsekvens.
- Hugging Face API-token (hämta den i inställningarna för ditt Hugging Face-konto).
Kunskapsnivå: Nybörjare. Du klistrar in tokens i n8n-noder och testar boten i Telegram.
Behöver du hjälp att implementera detta? Prata med en automationsexpert (gratis 15-minuters konsultation).
Flödets steg
Telegram-meddelande startar flödet. Din bot lyssnar efter inkommande meddelanden (ofta ett enkelt kommando som ”/image …”) och fångar texten som förfrågan.
Gemini städar upp prompten. Flödet skickar användarens beskrivning i vanligt språk till Gemini och får tillbaka en mer detaljerad, modellvänlig prompt som brukar ge bättre bilder utan extra handpåläggning.
Hugging Face genererar bilden. n8n använder en HTTP-förfrågan för att anropa bildgenererings-endpointen (Together API via Hugging Face free tier i den här mallen) med den förfinade prompten och vald modell.
Telegram får den slutliga filen. Flödet hämtar bildens binärdata och svarar i chatten med den genererade bilden, så att teamet kan godkänna eller be om en ny version direkt.
Du kan enkelt byta bildmodell för att matcha din stil, eller ersätta Gemini med OpenAI beroende på din stack. Se hela implementeringsguiden nedan för anpassningsalternativ.
Steg-för-steg-guide för implementation
Steg 1: Konfigurera Telegram-triggern
Konfigurera startpunkten för workflowet så att automatiseringen startar när ett Telegram-meddelande tas emot.
- Lägg till och öppna Incoming Telegram Start.
- Bekräfta att triggern är aktiverad och ansluten till er Telegram-bot.
Steg 2: Anslut Telegram som primär tjänst
Säkerställ att Telegram-inloggningsuppgifter finns tillgängliga både för att ta emot och skicka meddelanden.
- Öppna Telegram Image Reply och förbered åtgärden för att skicka tillbaka en bild till chatten.
- Verifiera att noden är ansluten efter Fetch Image File i huvudflödet.
Steg 3: Konfigurera Agent Orchestrator och AI-modell
Konfigurera agenten och dess språkmodell så att den kan tolka inkommande Telegram-förfrågningar.
- Öppna Agent Orchestrator och bekräfta att den är ansluten från Incoming Telegram Start.
- Säkerställ att Gemini Chat Engine är kopplad till Agent Orchestrator via anslutningen för AI-språkmodell.
Steg 4: Konfigurera externt API-anrop och bildhämtning
Konfigurera HTTP-förfrågningarna som genererar och hämtar bilden som ska skickas till Telegram.
- Öppna External API Call och ställ in request-detaljerna för endpointen för bildgenerering.
- Öppna Fetch Image File och konfigurera den för att ladda ned bilden som returneras av External API Call.
- Bekräfta att körflödet följer Agent Orchestrator → External API Call → Fetch Image File → Telegram Image Reply.
Steg 5: Konfigurera leverans av utdata
Slutför svaret som skickas tillbaka till Telegram-användaren.
- I Telegram Image Reply, mappa bildfilens data som kommer från Fetch Image File till det utgående meddelandet.
- Bekräfta att noden är placerad sist i flödet och endast är ansluten från Fetch Image File.
Steg 6: Testa och aktivera ert workflow
Kör ett fullständigt test för att validera Telegram-triggern, AI-bearbetningen, externa API-anrop och bildsvaret.
- Klicka på Execute Workflow och skicka ett testmeddelande till er Telegram-bot för att trigga Incoming Telegram Start.
- Bekräfta att Agent Orchestrator bearbetar meddelandet och skickar vidare förfrågan till External API Call.
- Verifiera att Fetch Image File laddar ned bilden korrekt och att Telegram Image Reply skickar tillbaka den till chatten.
- När allt fungerar, växla workflowet till Active för att aktivera användning i produktion.
Se upp med
- Telegram-botens inloggningsuppgifter kan gå ut eller klistras in i fel nod. Om något slutar fungera, kontrollera Telegram-noderna i n8n först och bekräfta att token fortfarande fungerar i @BotFather.
- Om du använder Wait-noder eller extern rendering varierar processtiderna. Öka väntetiden om efterföljande noder fallerar på tomma svar.
- Standardprompter i AI-noder är generiska. Lägg in din varumärkesröst tidigt, annars kommer du att redigera resultat för alltid.
Vanliga frågor
Cirka 20 minuter om du redan har dina tokens.
Ja. Du kommer främst att klistra in en Telegram-bot-token och en Hugging Face-token i rätt n8n-noder.
Ja. n8n har ett gratisalternativ för egen hosting och en gratis provperiod på n8n Cloud. Cloud-planer börjar på 20 USD/månad för högre volymer. Du behöver också räkna in Hugging Face-användning (den här mallen är utformad kring free tier).
Två alternativ: n8n Cloud (hanterat, enklaste uppsättningen) eller egen hosting på en VPS. För egen hosting är Hostinger VPS prisvärd och hanterar n8n bra. Egen hosting ger dig obegränsade exekveringar men kräver grundläggande serverhantering.
Du kan byta ut Gemini mot OpenAI genom att ersätta Gemini-chatmodellnoden i delen ”Gemini chat engine” i flödet, medan du behåller resten oförändrat. Många team ändrar också modellnamnet i Hugging Face i HTTP-förfrågan ”External API Call” för att matcha en föredragen stil. Om du vill ha bättre konsekvens kan du lägga till en kort rad om ”varumärkesstil” (färger, känsla, kompositionsregler) i instruktionerna för promptförfining, så att varje förfrågan startar från samma baslinje. Du kan också routa färdiga bilder till Discord eller logga förfrågningar i Google Sheets eftersom de integrationerna redan ingår i mallens ekosystem.
Oftast beror det på en ogiltig eller roterad bot-token. Uppdatera inloggningsuppgifterna i noderna Telegram Trigger och Telegram Reply och skicka sedan ett nytt testmeddelande till boten. Om det fortfarande fallerar, bekräfta att boten faktiskt kan ta emot meddelanden (vissa bots är felkonfigurerade eller blockerade) och kontrollera att din n8n-instans kan nå Telegrams API från ditt nätverk.
På en typisk n8n Cloud-plan begränsas du främst av månatliga exekveringar och hur snabbt bild-API:t svarar.
För AI-bildgenerering är n8n oftast ett smidigare val eftersom du kan styra promptförfining, förgreningar och filhantering utan att fastna i planbegränsningar. Du har också möjlighet att köra egen hosting, vilket är viktigt när du genererar bilder ofta. Zapier och Make kan fungera, men flerstegsflöden med filer och omförsök blir dyra eller pilliga. n8n:s HTTP-förfrågningar gör det enkelt att anropa Hugging Face och sedan hämta binärdata på ett stabilt sätt. Prata med en automationsexpert om du vill ha hjälp att välja utifrån volym och teamets arbetssätt.
Du håller konversationen i Telegram och flödet hanterar de irriterande delarna i bakgrunden. Sätt upp det en gång, så slutar bildförfrågningar kapa din dag.
Kontakta oss
Hör av dig, så diskuterar vi hur just din verksamhet kan dra nytta av alla fantastiska möjligheter som AI skapar.