Dina Telegram-DM:ar saktar inte ner bara för att du är upptagen. Du svarar på samma frågor, letar efter gammal kontext och lyckas ändå missa meddelanden när det blir stressigt.
Den här uppsättningen för Telegram Gemini-svar slår hårdast mot support- och säljleads, men marknadsförare som kör kampanjer och grundare som hanterar inkommande förfrågningar känner av det också. Målet är enkelt: snabba svar som är konsekventa, även när meddelandet är en bild.
Du får se exakt hur det här n8n-workflowet routar DM:ar, behåller korttidsminne genom en konversation och svarar direkt med Google Gemini.
Så här fungerar automationen
Här är hela workflowet du kommer att sätta upp:
n8n Workflow Template: Telegram + Google gemini: snabba svar på dm
flowchart LR
subgraph sg0["Telegram Flow"]
direction LR
n0@{ icon: "mdi:robot", form: "rounded", label: "Knowledge Base Agent", pos: "b", h: 48 }
n1@{ icon: "mdi:memory", form: "rounded", label: "Simple Memory", pos: "b", h: 48 }
n2@{ icon: "mdi:swap-vertical", form: "rounded", label: "Map image prompt", pos: "b", h: 48 }
n3@{ icon: "mdi:swap-vertical", form: "rounded", label: "Map text prompt", pos: "b", h: 48 }
n4@{ icon: "mdi:swap-horizontal", form: "rounded", label: "Route Types", pos: "b", h: 48 }
n5@{ icon: "mdi:brain", form: "rounded", label: "Google Gemini Chat Model", pos: "b", h: 48 }
n6@{ icon: "mdi:robot", form: "rounded", label: "Analyze image", pos: "b", h: 48 }
n7["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/telegram.svg' width='40' height='40' /></div><br/>Telegram Trigger"]
n8["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/telegram.svg' width='40' height='40' /></div><br/>Get a file"]
n9["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/telegram.svg' width='40' height='40' /></div><br/>Send a text message"]
n8 --> n6
n4 --> n3
n4 --> n8
n6 --> n2
n1 -.-> n0
n3 --> n0
n2 --> n0
n7 --> n4
n0 --> n9
n5 -.-> n0
end
%% Styling
classDef trigger fill:#e8f5e9,stroke:#388e3c,stroke-width:2px
classDef ai fill:#e3f2fd,stroke:#1976d2,stroke-width:2px
classDef aiModel fill:#e8eaf6,stroke:#3f51b5,stroke-width:2px
classDef decision fill:#fff8e1,stroke:#f9a825,stroke-width:2px
classDef database fill:#fce4ec,stroke:#c2185b,stroke-width:2px
classDef api fill:#fff3e0,stroke:#e65100,stroke-width:2px
classDef code fill:#f3e5f5,stroke:#7b1fa2,stroke-width:2px
classDef disabled stroke-dasharray: 5 5,opacity: 0.5
class n7 trigger
class n0,n6 ai
class n5 aiModel
class n1 ai
class n4 decision
classDef customIcon fill:none,stroke:none
class n7,n8,n9 customIcon
Varför det här spelar roll: långsamma, inkonsekventa DM-svar
DM:ar ser oskyldiga ut tills du drunknar i dem. En person frågar om pris, en annan skickar en skärmdump med ett fel och någon annan svarar på ett meddelande du knappt minns att du skickade. Om du svarar manuellt går du antingen för långsamt (och tappar leaden) eller för snabbt (och det blir fel). Det värsta är kontextbytena: du stoppar det riktiga jobbet, gräver fram historiken, skriver ett genomtänkt svar och gör om samma sak 10 minuter senare.
Det bygger upp snabbt. Här är var det fallerar i riktiga team.
- Svarskvaliteten varierar beroende på vem som är online, vilket gör att kunder får blandade signaler om policyer, prissättning eller tidsplaner.
- Bildmeddelanden är en tidstjuv eftersom någon måste öppna dem, tolka dem och skriva ett svar från grunden.
- Du tappar kontexten när det blir fram och tillbaka, så folk behöver upprepa sig och blir irriterade.
- Viktiga DM:ar begravs under lanseringar, supportsprång eller resdagar när du inte kan sitta i Telegram hela dagen.
Det du bygger: en AI som svarar på DM:ar med minne (text + bilder)
Det här workflowet gör din Telegram-bot till en snabb förstalinjeresurs för direktmeddelanden. En användare skickar ett DM till din bot och n8n kontrollerar direkt vilken typ av meddelande det är. Om det är text bygger workflowet en strukturerad prompt och skickar den till en AI-agent som kan behålla korttidskontext genom konversationen. Om det är en bild hämtar workflowet Telegram-filen, ber Gemini granska bildinnehållet och komponera sedan en prompt som inkluderar vad bilden visar. I båda fallen genererar AI-agenten ett Telegram-anpassat svar och skickar tillbaka det direkt, utan att du ens öppnar chatten.
Workflowet börjar med en Telegram-trigger och routar meddelanden efter typ. Gemini hanterar både chatsvar och bildförståelse, medan en minnesbuffer håller de senaste 20 meddelandena tillgängliga så att svaren inte känns “utan tillstånd”. Till sist skickar n8n det formaterade svaret tillbaka i samma DM-tråd.
Det du bygger
| Det som automatiseras | Det du uppnår |
|---|---|
|
|
Förväntade resultat
Säg att du får ungefär 30 DM:ar per dag och att cirka en tredjedel innehåller en bild (skärmdumpar, kvitton, felmeddelanden). Manuellt tar även “snabba” svar kanske 5 minuter styck när du läser, kollar kontext och svarar, så det blir ungefär 2 till 3 timmar per dag. Med det här workflowet lägger du cirka 10 minuter på att sätta upp ramar och granska edge cases, medan boten hanterar rutinfrågor och bildförklaringar automatiskt. De flesta team får tillbaka ett par timmar redan första dagen.
Innan du börjar
- n8n-instans (prova n8n Cloud gratis)
- Alternativ för self-hosting om du föredrar det (Hostinger fungerar bra)
- Telegram för att ta emot och skicka DM:ar via en bot
- Google Gemini API för att generera svar och analysera bilder
- Telegram bot-token (hämta den från @BotFather)
Svårighetsnivå: Nybörjare. Du kopplar konton, klistrar in API-nycklar och justerar ett par prompts.
Vill du att någon bygger detta åt dig? Prata med en automationsexpert (gratis 15-minuters konsultation).
Steg för steg
Ett Telegram-DM triggar workflowet. Noden Telegram Trigger kör igång så fort din bot tar emot ett nytt meddelande, så svaren kan bli nära nog omedelbara.
Meddelandet routas efter typ. En Switch-nod kontrollerar om innehållet är ren text eller en bild. Det avgör vilken prompt som byggs härnäst, så att Gemini får rätt kontext i stället för en rörig “en prompt som passar allt”.
Bilder hämtas och granskas. Om DM:et innehåller en bild hämtar n8n Telegram-filen och skickar den sedan till Geminis nod för bildförståelse för att beskriva vad som finns i den (fel, UI-element, dokument, vad användaren än skickade).
En AI-agent skriver svaret med minne. Workflowet skickar den slutliga prompten till en kontextmedveten agent som stöds av ett minnesbufferfönster, som håller de senaste 20 meddelandena tillgängliga så att svaret förblir sammanhängande i en fram-och-tillbaka-konversation.
Svaret skickas till samma chatt. Noden för att skicka i Telegram skickar ett formaterat svar som fungerar bra i Telegram och inte kräver att du kopierar och klistrar in något.
Du kan enkelt anpassa promptarna efter din ton, eller styra vissa nyckelord till en eskaleringsväg med människa. Se hela implementationsguiden nedan för anpassningsalternativ.
Steg-för-steg-guide för implementering
Steg 1: Konfigurera Telegram-triggern
Konfigurera arbetsflödets startpunkt så att er bot tar emot Telegram-meddelanden.
- Lägg till och öppna Telegram Incoming Trigger.
- Ställ in Updates på
message. - Bekräfta att noden är ansluten till Route Message Type som nästa steg.
Steg 2: Rutta meddelandetyper och hämta bilder
Dela upp flödet så att textmeddelanden och bildmeddelanden hanteras på rätt sätt.
- Öppna Route Message Type och verifiera att den första regeln kontrollerar Left Value
={{ $json.message.text }}med operatorn string exists. - Verifiera att den andra regeln kontrollerar Left Value
={{ $json.message.photo[2] }}med operatorn object exists. - Bekräfta att utgången märkt Text går till Compose Text Prompt, och att utgången märkt Image går till Retrieve Telegram File.
- I Retrieve Telegram File, ställ in Resource på
fileoch File ID på={{ $json.message.photo[2].file_id }}. - Credential Required: Anslut era
telegramApi-uppgifter i Retrieve Telegram File.
[2] finns i inkommande Telegram-payload; annars justerar ni indexet så att det matchar er bots mediastorlekar.Steg 3: Analysera bilder och skapa prompts
Förbered ren text för AI:n genom att bygga promptsträngar från användarens text eller bildanalys.
- Öppna Inspect Image Content och ställ in Resource på
image, Input Type påbinaryoch Operation påanalyze. - Ställ in Model på
models/gemini-2.5-flash. - Credential Required: Anslut era
googlePalmApi-uppgifter i Inspect Image Content. - I Compose Image Prompt, lägg till en strängtilldelning med namnet text med värdet
=User image description: {{ $json.content.parts[0].text }} User image caption: {{ $('Telegram Incoming Trigger').item.json.message.caption }}. - I Compose Text Prompt, lägg till en strängtilldelning med namnet text med värdet
={{ $json.messages[0].text.body }}.
Steg 4: Sätt upp AI-agenten och minnet
Konfigurera AI-assistenten så att den svarar på antingen text- eller bildprompts och behåller kontexten i konversationen.
- Öppna Context Response Agent och ställ in Text till
=Use these Descriptions to reply with a message to the user according to his question simply, shortly, and make sure he understand the thing he attaches: "" {{ $json.text }} "" I need your output message to be well spaced and formatted and look as attractive as possible for a telegram response!. - Säkerställ att både Compose Text Prompt och Compose Image Prompt är anslutna till Context Response Agent.
- Öppna Session Memory Buffer och ställ in Session Key till
=memory_{{ $('Telegram Incoming Trigger').item.json.message.message_id }}med Context Window Length satt till20. - Bekräfta att Session Memory Buffer är länkat till Context Response Agent via anslutningen ai_memory.
- Öppna Gemini Chat Engine och anslut den till Context Response Agent som ai_languageModel.
- Credential Required: Anslut era
googlePalmApi-uppgifter i Gemini Chat Engine.
Steg 5: Konfigurera Telegram-svaret
Skicka det AI-genererade svaret tillbaka till den Telegram-chatt där det kom ifrån.
- Öppna Dispatch Telegram Reply och ställ in Text till
={{ $json.output }}. - Ställ in Chat ID till
={{ $('Telegram Incoming Trigger').item.json.message.chat.id }}. - Credential Required: Anslut era
telegramApi-uppgifter i Dispatch Telegram Reply.
Steg 6: Testa och aktivera ert arbetsflöde
Validera hela flödet för både text- och bildmeddelanden och aktivera sedan automatiseringen.
- Klicka på Execute Workflow och skicka ett textmeddelande till er Telegram-bot för att testa flödet Route Message Type → Compose Text Prompt → Context Response Agent.
- Skicka en bild med en bildtext för att testa flödet Retrieve Telegram File → Inspect Image Content → Compose Image Prompt → Context Response Agent.
- Bekräfta att ett korrekt formaterat svar kommer via Dispatch Telegram Reply.
- Växla arbetsflödet till Active för att köra det kontinuerligt i produktion.
Tips för felsökning
- Telegram-autentisering kan fallera om bot-token har återskapats. Om svaren plötsligt slutar, verifiera token i @BotFather och uppdatera den i n8n:s Telegram-autentiseringsuppgifter.
- Om bildsvar är tomma är filhämtningen oftast boven. Kontrollera utdata från noden “Retrieve Telegram File” för att bekräfta att du faktiskt laddar ner en fil och inte bara får metadata.
- Gemini API-anrop kan ge fel på grund av kvotgränser eller saknade behörigheter på nyckeln. Öppna din Google AI API-konsol, bekräfta fakturering/kvot och testa sedan Gemini-chatten och noderna för bildgranskning igen.
Snabba svar
Cirka 30 minuter om din bot-token och Gemini-nyckel är klara.
Nej. Du kopplar främst konton och justerar prompts efter ditt användningsfall.
Ja. n8n har ett gratis self-hosted-alternativ och en gratis provperiod på n8n Cloud. Cloud-planer startar på 20 USD/månad för högre volym. Du behöver också räkna med kostnader för användning av Google Gemini API, som beror på hur många DM:ar och bildanalyser du kör.
Två alternativ: n8n Cloud (hanterat, enklast att sätta upp) eller self-hosting på en VPS. För self-hosting är Hostinger VPS prisvärd och hanterar n8n bra. Self-hosting ger dig obegränsade körningar men kräver grundläggande serverhantering.
Ja, och det bör du. De flesta anpassningar sker i stegen “Compose Text Prompt” och “Compose Image Prompt”, plus instruktionerna i “Context Response Agent” som talar om för boten hur den ska bete sig. Vanliga justeringar är att lägga till dina FAQ:er, sätta ramar (återbetalningspolicy, tillgänglighet, prisregler) och routa vissa nyckelord till en människa i stället för boten.
Oftast beror det på en ogiltig eller utbytt bot-token. Skapa om eller kopiera token igen från @BotFather, uppdatera Telegram-autentiseringsuppgifterna i n8n och testa sedan Telegram Trigger och svars-noden igen. Om det fungerar i en nod men inte i den andra, bekräfta att båda noderna använder samma autentiseringspost.
Om du self-hostar finns ingen körningsgräns (det beror främst på din server och Gemini-kvoten). På n8n Cloud beror gränsen på din plans månatliga körningar, och du kan uppgradera om boten får hög belastning.
Ofta, ja, eftersom det här inte är en enkel “meddelande in, meddelande ut”-zap. Du routar mellan text- och bildflöden, hämtar filer och behåller kontext med ett minnesfönster, vilket är svårare (och ibland dyrt) att göra snyggt i Zapier. n8n ger dig också mer kontroll över hur prompts byggs, vilket spelar roll när du bryr dig om konsekvens. Om du self-hostar betalar du inte per uppgift på samma sätt, så hög DM-volym blir mindre läskig. Samtidigt: om du bara behöver ett grundläggande autosvar utan minne och utan bildhantering kan Zapier eller Make gå snabbare att klicka ihop. Prata med en automationsexpert om du vill ha hjälp att välja.
När det här väl är igång slutar dina DM:ar vara ett konstant avbrott och börjar fungera som en organiserad intagskanal. Workflowet hanterar de repetitiva frågorna och de stökiga bildförklaringarna, så att du kan fokusera på de samtal som faktiskt behöver dig.
Kontakta oss
Hör av dig, så diskuterar vi hur just din verksamhet kan dra nytta av alla fantastiska möjligheter som AI skapar.