Telegram + Google gemini: snabba svar på dm

Dina Telegram-DM:ar saktar inte ner bara för att du är upptagen. Du svarar på samma frågor, letar efter gammal kontext och lyckas ändå missa meddelanden när det blir stressigt.

Den här uppsättningen för Telegram Gemini-svar slår hårdast mot support- och säljleads, men marknadsförare som kör kampanjer och grundare som hanterar inkommande förfrågningar känner av det också. Målet är enkelt: snabba svar som är konsekventa, även när meddelandet är en bild.

Du får se exakt hur det här n8n-workflowet routar DM:ar, behåller korttidsminne genom en konversation och svarar direkt med Google Gemini.

Så här fungerar automationen

Här är hela workflowet du kommer att sätta upp:

n8n Workflow Template: Telegram + Google gemini: snabba svar på dm

Click to explore

flowchart LR

    subgraph sg0["Telegram Flow"]
        direction LR
        n0@{ icon: "mdi:robot", form: "rounded", label: "Knowledge Base Agent", pos: "b", h: 48 }
        n1@{ icon: "mdi:memory", form: "rounded", label: "Simple Memory", pos: "b", h: 48 }
        n2@{ icon: "mdi:swap-vertical", form: "rounded", label: "Map image prompt", pos: "b", h: 48 }
        n3@{ icon: "mdi:swap-vertical", form: "rounded", label: "Map text prompt", pos: "b", h: 48 }
        n4@{ icon: "mdi:swap-horizontal", form: "rounded", label: "Route Types", pos: "b", h: 48 }
        n5@{ icon: "mdi:brain", form: "rounded", label: "Google Gemini Chat Model", pos: "b", h: 48 }
        n6@{ icon: "mdi:robot", form: "rounded", label: "Analyze image", pos: "b", h: 48 }
        n7["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/telegram.svg' width='40' height='40' /></div><br/>Telegram Trigger"]
        n8["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/telegram.svg' width='40' height='40' /></div><br/>Get a file"]
        n9["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/telegram.svg' width='40' height='40' /></div><br/>Send a text message"]
        n8 --> n6
        n4 --> n3
        n4 --> n8
        n6 --> n2
        n1 -.-> n0
        n3 --> n0
        n2 --> n0
        n7 --> n4
        n0 --> n9
        n5 -.-> n0
    end

    %% Styling
    classDef trigger fill:#e8f5e9,stroke:#388e3c,stroke-width:2px
    classDef ai fill:#e3f2fd,stroke:#1976d2,stroke-width:2px
    classDef aiModel fill:#e8eaf6,stroke:#3f51b5,stroke-width:2px
    classDef decision fill:#fff8e1,stroke:#f9a825,stroke-width:2px
    classDef database fill:#fce4ec,stroke:#c2185b,stroke-width:2px
    classDef api fill:#fff3e0,stroke:#e65100,stroke-width:2px
    classDef code fill:#f3e5f5,stroke:#7b1fa2,stroke-width:2px
    classDef disabled stroke-dasharray: 5 5,opacity: 0.5
    class n7 trigger
    class n0,n6 ai
    class n5 aiModel
    class n1 ai
    class n4 decision
    classDef customIcon fill:none,stroke:none
    class n7,n8,n9 customIcon

Varför det här spelar roll: långsamma, inkonsekventa DM-svar

DM:ar ser oskyldiga ut tills du drunknar i dem. En person frågar om pris, en annan skickar en skärmdump med ett fel och någon annan svarar på ett meddelande du knappt minns att du skickade. Om du svarar manuellt går du antingen för långsamt (och tappar leaden) eller för snabbt (och det blir fel). Det värsta är kontextbytena: du stoppar det riktiga jobbet, gräver fram historiken, skriver ett genomtänkt svar och gör om samma sak 10 minuter senare.

Det bygger upp snabbt. Här är var det fallerar i riktiga team.

Svarskvaliteten varierar beroende på vem som är online, vilket gör att kunder får blandade signaler om policyer, prissättning eller tidsplaner.
Bildmeddelanden är en tidstjuv eftersom någon måste öppna dem, tolka dem och skriva ett svar från grunden.
Du tappar kontexten när det blir fram och tillbaka, så folk behöver upprepa sig och blir irriterade.
Viktiga DM:ar begravs under lanseringar, supportsprång eller resdagar när du inte kan sitta i Telegram hela dagen.

Det du bygger: en AI som svarar på DM:ar med minne (text + bilder)

Det här workflowet gör din Telegram-bot till en snabb förstalinjeresurs för direktmeddelanden. En användare skickar ett DM till din bot och n8n kontrollerar direkt vilken typ av meddelande det är. Om det är text bygger workflowet en strukturerad prompt och skickar den till en AI-agent som kan behålla korttidskontext genom konversationen. Om det är en bild hämtar workflowet Telegram-filen, ber Gemini granska bildinnehållet och komponera sedan en prompt som inkluderar vad bilden visar. I båda fallen genererar AI-agenten ett Telegram-anpassat svar och skickar tillbaka det direkt, utan att du ens öppnar chatten.

Workflowet börjar med en Telegram-trigger och routar meddelanden efter typ. Gemini hanterar både chatsvar och bildförståelse, medan en minnesbuffer håller de senaste 20 meddelandena tillgängliga så att svaren inte känns “utan tillstånd”. Till sist skickar n8n det formaterade svaret tillbaka i samma DM-tråd.

Det du bygger

Det som automatiseras

Det du uppnår

Inkommande Telegram-DM:ar fångas upp i samma ögonblick de kommer in.
Textmeddelanden omvandlas till en strukturerad prompt för konsekventa svar.
Bilduppladdningar laddas ner och analyseras med Gemini Vision-liknande granskning.
Svar genereras med korttidsminne i konversationen och skickas tillbaka automatiskt.

Korta ner “första svar” från cirka 10 minuter till under en minut.
Svara konsekvent på återkommande frågor, även när olika personer jobbar.
Hantera skärmdumpar och foton utan att be användare “beskriva det i text”.
Hålla konversationerna igång när du sitter i möten eller är i djupt fokus.
Skapa en stabil bas som du senare kan eskalera till e-post eller en manuell kö.

Förväntade resultat

Säg att du får ungefär 30 DM:ar per dag och att cirka en tredjedel innehåller en bild (skärmdumpar, kvitton, felmeddelanden). Manuellt tar även “snabba” svar kanske 5 minuter styck när du läser, kollar kontext och svarar, så det blir ungefär 2 till 3 timmar per dag. Med det här workflowet lägger du cirka 10 minuter på att sätta upp ramar och granska edge cases, medan boten hanterar rutinfrågor och bildförklaringar automatiskt. De flesta team får tillbaka ett par timmar redan första dagen.

Innan du börjar

n8n-instans (prova n8n Cloud gratis)
Alternativ för self-hosting om du föredrar det (Hostinger fungerar bra)
Telegram för att ta emot och skicka DM:ar via en bot
Google Gemini API för att generera svar och analysera bilder
Telegram bot-token (hämta den från @BotFather)

Svårighetsnivå: Nybörjare. Du kopplar konton, klistrar in API-nycklar och justerar ett par prompts.

Vill du att någon bygger detta åt dig? Prata med en automationsexpert (gratis 15-minuters konsultation).

Steg för steg

Ett Telegram-DM triggar workflowet. Noden Telegram Trigger kör igång så fort din bot tar emot ett nytt meddelande, så svaren kan bli nära nog omedelbara.

Meddelandet routas efter typ. En Switch-nod kontrollerar om innehållet är ren text eller en bild. Det avgör vilken prompt som byggs härnäst, så att Gemini får rätt kontext i stället för en rörig “en prompt som passar allt”.

Bilder hämtas och granskas. Om DM:et innehåller en bild hämtar n8n Telegram-filen och skickar den sedan till Geminis nod för bildförståelse för att beskriva vad som finns i den (fel, UI-element, dokument, vad användaren än skickade).

En AI-agent skriver svaret med minne. Workflowet skickar den slutliga prompten till en kontextmedveten agent som stöds av ett minnesbufferfönster, som håller de senaste 20 meddelandena tillgängliga så att svaret förblir sammanhängande i en fram-och-tillbaka-konversation.

Svaret skickas till samma chatt. Noden för att skicka i Telegram skickar ett formaterat svar som fungerar bra i Telegram och inte kräver att du kopierar och klistrar in något.

Du kan enkelt anpassa promptarna efter din ton, eller styra vissa nyckelord till en eskaleringsväg med människa. Se hela implementationsguiden nedan för anpassningsalternativ.

Steg-för-steg-guide för implementering

Steg 1: Konfigurera Telegram-triggern

Konfigurera arbetsflödets startpunkt så att er bot tar emot Telegram-meddelanden.

Lägg till och öppna Telegram Incoming Trigger.
Ställ in Updates på message.
Bekräfta att noden är ansluten till Route Message Type som nästa steg.

Steg 2: Rutta meddelandetyper och hämta bilder

Dela upp flödet så att textmeddelanden och bildmeddelanden hanteras på rätt sätt.

Öppna Route Message Type och verifiera att den första regeln kontrollerar Left Value ={{ $json.message.text }} med operatorn string exists.
Verifiera att den andra regeln kontrollerar Left Value ={{ $json.message.photo[2] }} med operatorn object exists.
Bekräfta att utgången märkt Text går till Compose Text Prompt, och att utgången märkt Image går till Retrieve Telegram File.
I Retrieve Telegram File, ställ in Resource på file och File ID på ={{ $json.message.photo[2].file_id }}.
Credential Required: Anslut era telegramApi-uppgifter i Retrieve Telegram File.

Om ni förväntar er större bilder, bekräfta att indexet [2] finns i inkommande Telegram-payload; annars justerar ni indexet så att det matchar er bots mediastorlekar.

Steg 3: Analysera bilder och skapa prompts

Förbered ren text för AI:n genom att bygga promptsträngar från användarens text eller bildanalys.

Öppna Inspect Image Content och ställ in Resource på image, Input Type på binary och Operation på analyze.
Ställ in Model på models/gemini-2.5-flash.
Credential Required: Anslut era googlePalmApi-uppgifter i Inspect Image Content.
I Compose Image Prompt, lägg till en strängtilldelning med namnet text med värdet =User image description: {{ $json.content.parts[0].text }} User image caption: {{ $('Telegram Incoming Trigger').item.json.message.caption }}.
I Compose Text Prompt, lägg till en strängtilldelning med namnet text med värdet ={{ $json.messages[0].text.body }}.

Steg 4: Sätt upp AI-agenten och minnet

Konfigurera AI-assistenten så att den svarar på antingen text- eller bildprompts och behåller kontexten i konversationen.

Öppna Context Response Agent och ställ in Text till =Use these Descriptions to reply with a message to the user according to his question simply, shortly, and make sure he understand the thing he attaches: "" {{ $json.text }} "" I need your output message to be well spaced and formatted and look as attractive as possible for a telegram response!.
Säkerställ att både Compose Text Prompt och Compose Image Prompt är anslutna till Context Response Agent.
Öppna Session Memory Buffer och ställ in Session Key till =memory_{{ $('Telegram Incoming Trigger').item.json.message.message_id }} med Context Window Length satt till 20.
Bekräfta att Session Memory Buffer är länkat till Context Response Agent via anslutningen ai_memory.
Öppna Gemini Chat Engine och anslut den till Context Response Agent som ai_languageModel.
Credential Required: Anslut era googlePalmApi-uppgifter i Gemini Chat Engine.

⚠️ Vanlig fallgrop: Session Memory Buffer är en sub-nod; inloggningsuppgifter läggs inte till här. Säkerställ att språkmodellens uppgifter är konfigurerade i Gemini Chat Engine, som driver Context Response Agent.

Steg 5: Konfigurera Telegram-svaret

Skicka det AI-genererade svaret tillbaka till den Telegram-chatt där det kom ifrån.

Öppna Dispatch Telegram Reply och ställ in Text till ={{ $json.output }}.
Ställ in Chat ID till ={{ $('Telegram Incoming Trigger').item.json.message.chat.id }}.
Credential Required: Anslut era telegramApi-uppgifter i Dispatch Telegram Reply.

Steg 6: Testa och aktivera ert arbetsflöde

Validera hela flödet för både text- och bildmeddelanden och aktivera sedan automatiseringen.

Klicka på Execute Workflow och skicka ett textmeddelande till er Telegram-bot för att testa flödet Route Message Type → Compose Text Prompt → Context Response Agent.
Skicka en bild med en bildtext för att testa flödet Retrieve Telegram File → Inspect Image Content → Compose Image Prompt → Context Response Agent.
Bekräfta att ett korrekt formaterat svar kommer via Dispatch Telegram Reply.
Växla arbetsflödet till Active för att köra det kontinuerligt i produktion.

🔒

Lås upp fullständig steg-för-steg-guide

Få den kompletta implementeringsguiden + nedladdningsbar mall

Tips för felsökning

Telegram-autentisering kan fallera om bot-token har återskapats. Om svaren plötsligt slutar, verifiera token i @BotFather och uppdatera den i n8n:s Telegram-autentiseringsuppgifter.
Om bildsvar är tomma är filhämtningen oftast boven. Kontrollera utdata från noden “Retrieve Telegram File” för att bekräfta att du faktiskt laddar ner en fil och inte bara får metadata.
Gemini API-anrop kan ge fel på grund av kvotgränser eller saknade behörigheter på nyckeln. Öppna din Google AI API-konsol, bekräfta fakturering/kvot och testa sedan Gemini-chatten och noderna för bildgranskning igen.

Snabba svar

Hur lång tid tar det att sätta upp den här automationen för Telegram Gemini-svar?

Cirka 30 minuter om din bot-token och Gemini-nyckel är klara.

Krävs det kodning för den här automationen för Telegram Gemini-svar?

Nej. Du kopplar främst konton och justerar prompts efter ditt användningsfall.

Är n8n gratis att använda för det här workflowet för Telegram Gemini-svar?

Ja. n8n har ett gratis self-hosted-alternativ och en gratis provperiod på n8n Cloud. Cloud-planer startar på 20 USD/månad för högre volym. Du behöver också räkna med kostnader för användning av Google Gemini API, som beror på hur många DM:ar och bildanalyser du kör.

Var kan jag hosta n8n för att köra den här automationen?

Två alternativ: n8n Cloud (hanterat, enklast att sätta upp) eller self-hosting på en VPS. För self-hosting är Hostinger VPS prisvärd och hanterar n8n bra. Self-hosting ger dig obegränsade körningar men kräver grundläggande serverhantering.

Kan jag modifiera det här workflowet för Telegram Gemini-svar för andra användningsfall?

Ja, och det bör du. De flesta anpassningar sker i stegen “Compose Text Prompt” och “Compose Image Prompt”, plus instruktionerna i “Context Response Agent” som talar om för boten hur den ska bete sig. Vanliga justeringar är att lägga till dina FAQ:er, sätta ramar (återbetalningspolicy, tillgänglighet, prisregler) och routa vissa nyckelord till en människa i stället för boten.

Varför misslyckas min Telegram-anslutning i det här workflowet?

Oftast beror det på en ogiltig eller utbytt bot-token. Skapa om eller kopiera token igen från @BotFather, uppdatera Telegram-autentiseringsuppgifterna i n8n och testa sedan Telegram Trigger och svars-noden igen. Om det fungerar i en nod men inte i den andra, bekräfta att båda noderna använder samma autentiseringspost.

Vilken volym kan det här workflowet för Telegram Gemini-svar hantera?

Om du self-hostar finns ingen körningsgräns (det beror främst på din server och Gemini-kvoten). På n8n Cloud beror gränsen på din plans månatliga körningar, och du kan uppgradera om boten får hög belastning.

Är den här automationen för Telegram Gemini-svar bättre än att använda Zapier eller Make?

Ofta, ja, eftersom det här inte är en enkel “meddelande in, meddelande ut”-zap. Du routar mellan text- och bildflöden, hämtar filer och behåller kontext med ett minnesfönster, vilket är svårare (och ibland dyrt) att göra snyggt i Zapier. n8n ger dig också mer kontroll över hur prompts byggs, vilket spelar roll när du bryr dig om konsekvens. Om du self-hostar betalar du inte per uppgift på samma sätt, så hög DM-volym blir mindre läskig. Samtidigt: om du bara behöver ett grundläggande autosvar utan minne och utan bildhantering kan Zapier eller Make gå snabbare att klicka ihop. Prata med en automationsexpert om du vill ha hjälp att välja.

När det här väl är igång slutar dina DM:ar vara ett konstant avbrott och börjar fungera som en organiserad intagskanal. Workflowet hanterar de repetitiva frågorna och de stökiga bildförklaringarna, så att du kan fokusera på de samtal som faktiskt behöver dig.

Telegram + Google gemini: snabba svar på dm

Så här fungerar automationen

n8n Workflow Template: Telegram + Google gemini: snabba svar på dm

Varför det här spelar roll: långsamma, inkonsekventa DM-svar

Det du bygger: en AI som svarar på DM:ar med minne (text + bilder)

Det du bygger

Förväntade resultat

Innan du börjar

Steg för steg

Steg-för-steg-guide för implementering

Steg 1: Konfigurera Telegram-triggern

Steg 2: Rutta meddelandetyper och hämta bilder

Steg 3: Analysera bilder och skapa prompts

Steg 4: Sätt upp AI-agenten och minnet

Steg 5: Konfigurera Telegram-svaret

Steg 6: Testa och aktivera ert arbetsflöde

Lås upp fullständig steg-för-steg-guide

Tips för felsökning

Snabba svar

Kontakta oss

Kontakta oss

Telegram + Google gemini: snabba svar på dm

Så här fungerar automationen

n8n Workflow Template: Telegram + Google gemini: snabba svar på dm

Varför det här spelar roll: långsamma, inkonsekventa DM-svar

Det du bygger: en AI som svarar på DM:ar med minne (text + bilder)

Det du bygger

Förväntade resultat

Innan du börjar

Steg för steg

Steg-för-steg-guide för implementering

Steg 1: Konfigurera Telegram-triggern

Steg 2: Rutta meddelandetyper och hämta bilder

Steg 3: Analysera bilder och skapa prompts

Steg 4: Sätt upp AI-agenten och minnet

Steg 5: Konfigurera Telegram-svaret

Steg 6: Testa och aktivera ert arbetsflöde

Lås upp fullständig steg-för-steg-guide

Tips för felsökning

Nästa steg

Snabba svar

Kontakta oss

Använd mall