Din ”snabba paper-koll” blir till 12 öppna flikar, tre halvgenomlästa abstracts och en anteckning du aldrig hittar igen. Sedan pingar någon dig och vill ha slutsatsen. Och du är tillbaka i att kopiera länkar, skumma PDF:er och försöka låta säker.
Marknadschefer som gör konkurrentanalyser känner igen det här. Det gör även grundare som följer ny teknik och konsulter som lever på ”skicka mig sammanfattningen”-förfrågningar. Den här automationen för Telegram Gemini summaries ger dig en felfri, lättläst papersammanfattning direkt i chatten, utan flikcirkusen.
Du får se hur flödet hanterar länkar, röstmeddelanden och skärmdumpar, hur det hämtar paper-detaljerna och hur det levererar resultatet som ett meddelande eller som en fil när outputen blir lång.
Så fungerar den här automationen
Hela n8n-flödet, från trigger till slutlig output:
n8n Workflow Template: Telegram + Gemini: papersammanfattningar i chatten
flowchart LR
subgraph sg0["Start Telegram Bot Flow"]
direction LR
n0@{ icon: "mdi:cog", form: "rounded", label: "Decodo", pos: "b", h: 48 }
n1@{ icon: "mdi:memory", form: "rounded", label: "Simple Memory", pos: "b", h: 48 }
n2["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/telegram.svg' width='40' height='40' /></div><br/>Send Fallback Text"]
n3["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/telegram.svg' width='40' height='40' /></div><br/>Start Telegram Bot"]
n4@{ icon: "mdi:swap-horizontal", form: "rounded", label: "Detect Message Type", pos: "b", h: 48 }
n5["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/telegram.svg' width='40' height='40' /></div><br/>Download Telegram Photo"]
n6["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/telegram.svg' width='40' height='40' /></div><br/>Download Telegram Voice"]
n7@{ icon: "mdi:robot", form: "rounded", label: "Analyze Image Content", pos: "b", h: 48 }
n8@{ icon: "mdi:robot", form: "rounded", label: "Transcribe Voice Message", pos: "b", h: 48 }
n9@{ icon: "mdi:swap-vertical", form: "rounded", label: "Format Image Text", pos: "b", h: 48 }
n10@{ icon: "mdi:swap-vertical", form: "rounded", label: "Format Voice Text", pos: "b", h: 48 }
n11@{ icon: "mdi:swap-vertical", form: "rounded", label: "Prepare Chat Data", pos: "b", h: 48 }
n12@{ icon: "mdi:robot", form: "rounded", label: "Research Summary Agent", pos: "b", h: 48 }
n14@{ icon: "mdi:brain", form: "rounded", label: "Gemini Research Model", pos: "b", h: 48 }
n15@{ icon: "mdi:swap-horizontal", form: "rounded", label: "Check Telegram Message Length", pos: "b", h: 48 }
n16@{ icon: "mdi:cog", form: "rounded", label: "Convert Output to Text File", pos: "b", h: 48 }
n17["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/telegram.svg' width='40' height='40' /></div><br/>Send Research Summary File"]
n18["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/telegram.svg' width='40' height='40' /></div><br/>Send Research Summary Message"]
n0 -.-> n12
n1 -.-> n12
n9 --> n11
n10 --> n11
n11 --> n12
n3 --> n4
n4 --> n5
n4 --> n11
n4 --> n6
n4 --> n2
n7 --> n9
n14 -.-> n12
n12 --> n15
n5 --> n7
n6 --> n8
n8 --> n10
n16 --> n17
n15 --> n16
n15 --> n18
end
subgraph sg1["Generate Search URL Flow"]
direction LR
n13@{ icon: "mdi:brain", form: "rounded", label: "Gemini URL Interpreter", pos: "b", h: 48 }
n19@{ icon: "mdi:robot", form: "rounded", label: "Generate Search URL Insights", pos: "b", h: 48 }
n20@{ icon: "mdi:swap-vertical", form: "rounded", label: "Define Search URLs", pos: "b", h: 48 }
n20 --> n19
n13 -.-> n19
end
%% Styling
classDef trigger fill:#e8f5e9,stroke:#388e3c,stroke-width:2px
classDef ai fill:#e3f2fd,stroke:#1976d2,stroke-width:2px
classDef aiModel fill:#e8eaf6,stroke:#3f51b5,stroke-width:2px
classDef decision fill:#fff8e1,stroke:#f9a825,stroke-width:2px
classDef database fill:#fce4ec,stroke:#c2185b,stroke-width:2px
classDef api fill:#fff3e0,stroke:#e65100,stroke-width:2px
classDef code fill:#f3e5f5,stroke:#7b1fa2,stroke-width:2px
classDef disabled stroke-dasharray: 5 5,opacity: 0.5
class n3 trigger
class n7,n8,n12,n19 ai
class n14,n13 aiModel
class n1 ai
class n4,n15 decision
classDef customIcon fill:none,stroke:none
class n2,n3,n5,n6,n17,n18 customIcon
Problemet: paper-läsning blir snabbt splittrad
Akademisk läsning börjar oftast enkelt: ”Skumma bara det här pappret.” Sedan sprider det sig. Du öppnar arXiv, följer citeringar, hoppar till Google Scholar och plötsligt jonglerar du ett dussin källor utan en enhetlig anteckningsstruktur. Om någon skickar en skärmdump på en figur eller ett röstmeddelande som ”kan du kolla det här påståendet?”, blir friktionen ännu större eftersom informationen inte ens är sökbar. Kostnaden är inte bara tid. Det är kontextbyten, tappat fokus och sammanfattningar som varierar i ton beroende på vem som skrev dem den dagen.
Små friktioner staplas på varandra. Här brukar det oftast fallera i riktiga team.
- Du slutar med att skriva om samma struktur för ”TL;DR + nyckelmetoder + begränsningar” om och om igen.
- Att klistra in paper-länkar i anteckningar blir rörigt, så att hitta dem senare är i praktiken tur.
- Röstmeddelanden och skärmdumpar blir till ”jag tar det sen”, vilket betyder att de försvinner.
- Manuell sammanfattning ger lätt fel, särskilt när du skummar under tidspress.
Lösningen: En Telegram-assistent för research som sammanfattar åt dig
Det här flödet gör en Telegram-bot till en researchassistent som förstår det du skickar och svarar med en användbar sammanfattning. Det startar när ett meddelande når din bot (text, bild eller röstmeddelande). Är det en skärmdump läser Gemini innehållet och extraherar relevant text. Är det röst transkriberar Gemini till en korrekt formaterad prompt. Sedan bygger flödet en strukturerad ”chat payload” och skickar den till en Research Synthesis Agent, som använder Gemini för att tolka URL:er och intention, och Decodo för att skrapa paper-detaljer som titel, abstract och publiceringsmetadata. Till sist får du sammanfattningen tillbaka i Telegram, antingen som ett vanligt meddelande eller som en fil om svaret är för långt för chatten.
Flödet startar i Telegram och routar direkt meddelandet efter typ. Därefter omvandlar det det du skickade till användbar text, kör research + syntes, kontrollerar längden och levererar resultatet i rätt format. Inga extra appar att öppna.
Det du får: automation vs. resultat
| Det här flödet automatiserar | Resultat du får |
|---|---|
|
|
Exempel: så här ser det ut
Säg att du granskar 10 papers i veckan och vanligtvis lägger cirka 25 minuter per styck: öppnar länken, skummar abstractet, plockar några detaljer, skriver en kort slutsats och klistrar in den där du sparar anteckningar. Det blir runt 4 timmar i veckan. Med det här flödet vidarebefordrar du arXiv-länken (eller skickar en skärmdump/röstmeddelande) i Telegram på under en minut, väntar ett par minuter på sammanfattningen och sedan är du klar. Räkna med 30 minuter av din tid för veckan i stället för en halv dag.
Det här behöver du
- n8n-instans (testa n8n Cloud gratis)
- Alternativ för egen hosting om du föredrar det (Hostinger fungerar bra)
- Telegram för att ta emot meddelanden och leverera sammanfattningar.
- Google Gemini för att tolka, transkribera, extrahera och sammanfatta.
- Decodo för att skrapa paper-detaljer från akademiska källor.
Kunskapsnivå: Medel. Du kopplar en Telegram-bot, lägger in API-uppgifter och justerar en platshållare i en systemprompt.
Vill du inte sätta upp det här själv? Prata med en automationsexpert (gratis 15-minuters konsultation).
Så fungerar det
Ett Telegram-meddelande sätter igång det. Du skickar en arXiv-länk, en skriven fråga, en skärmdump av ett paper eller ett röstmeddelande till din bot. Flödets trigger lyssnar på nya meddelanden och skickar dem direkt till ett routningssteg.
Flödet gör om ”det du än skickade” till strukturerad text. Skärmdumpar går igenom ett steg för bildinspektion (Gemini extraherar läsbart innehåll). Röstmeddelanden går igenom transkribering. Ren text går rakt igenom. I slutet av det här steget ser allt likadant ut för sammanfattaren, vilket är hela poängen.
Research + syntes sker på ett ställe. En Gemini-URL-tolk tolkar akademiska URL:er och intention, sedan använder Research Synthesis Agent Decodo-skrapning för att hämta detaljer som titlar, abstracts och publiceringsinfo. Efter det skriver Gemini en kortfattad sammanfattning som faktiskt går att använda, inte ett vagt stycke.
Leveransen anpassas efter meddelandelängd. Om svaret är tillräckligt kort kommer det tillbaka som ett vanligt Telegram-meddelande. Om det blir långt konverterar n8n det till en fil och skickar filen i stället, så att du inte tappar innehåll på grund av chattens begränsningar.
Du kan enkelt ändra sammanfattningsstrukturen så att den matchar din anteckningsmall, eller ändra vilka källor som skrapas utifrån dina behov. Se hela implementationsguiden nedan för anpassningsalternativ.
Steg-för-steg-guide för implementering
Steg 1: Konfigurera Telegram-triggern
Det här arbetsflödet startar när en användare skickar ett meddelande till er Telegram-bot. Konfigurera triggern så att den lyssnar efter inkommande meddelanden.
- Lägg till noden Telegram Bot Trigger och ställ in Updates till
message. - Inloggningsuppgifter krävs: Anslut era Telegram API-inloggningsuppgifter till Telegram Bot Trigger.
- Bekräfta att triggern är ansluten till Route Message Type som nästa nod.
Steg 2: Routa och bygg chattinput från Telegram-meddelanden
Inkommande meddelanden routas efter typ (foto, text, röst) och transformeras sedan till en enhetlig chattpayload för AI-agenten.
- I Route Message Type lägger ni till tre regler med följande vänstervärden:
{{ $json.message.photo }},{{ $json.message.text }}och{{ $json.message.voice }}, var och en med villkoret notEmpty. - Anslut Photo-utgången till Fetch Telegram Photo och ställ in File ID till
{{ $json.message.photo[3].file_id }}med Resource satt tillfile. - Anslut Voice-utgången till Fetch Telegram Voice och ställ in File ID till
{{ $json.message.voice.file_id }}med Resource satt tillfile. - Skicka typer som inte stöds till Send Fallback Notice med Text satt till
Sorry, i can only support text, photo, and voice messageoch Chat ID satt till{{ $json.message.chat.id }}. - I Compose Image Text ställer ni in message.text till
Caption: {{ $('Telegram Bot Trigger').item.json.message.caption ?? "[none]" }} --- Image: {{ $json.content.parts[0].text }}. - I Compose Voice Text ställer ni in message.text till
{{ $json.content.parts[0].text }}. - I Assemble Chat Payload ställer ni in chatInput till
{{ $json.message.text }}och chatId till{{ $('Telegram Bot Trigger').item.json.message.chat.id }}. - Inloggningsuppgifter krävs: Anslut era Telegram API-inloggningsuppgifter till alla Telegram-åtgärdsnoder (5+ noder, inklusive Fetch Telegram Photo, Fetch Telegram Voice, Send Fallback Notice, Deliver Summary File och Deliver Summary Message).
$json.message.photo[3]. Om avsändarens foto inte har fyra storlekar kan detta index saknas. Justera indexet eller lägg till en fallback vid behov.Steg 3: Konfigurera generering av url-insikter
Innan researchen startar definierar arbetsflödet akademiska url:er och tolkar deras parametrar så att AI-agenten kan använda dem.
- I Set Search URLs ställer ni in urls till
{{[\n "https://scholar.google.com/scholar?q=artificial+intelligence&hl=en&as_sdt=0,5",\n "https://scholar.google.com/scholar?as_ylo=2025&q=artificial+intelligence&hl=en&as_sdt=0,5",\n "https://arxiv.org/search/?query=artificial+intelligence&searchtype=all&abstracts=show&order=-announced_date_first",\n "https://arxiv.org/search/?query=artificial+intelligence&searchtype=all&source=header",\n]}}. - Anslut Set Search URLs till Generate URL Insights och behåll Prompt Type som
define. - Säkerställ att Gemini URL Parser är ansluten som AI-språkmodell för Generate URL Insights.
- Inloggningsuppgifter krävs: Anslut era Google Gemini-inloggningsuppgifter till Gemini URL Parser.
Steg 4: Sätt upp AI-bearbetning för research
AI-agenten tar emot användarens fråga och url-insikterna, skrapar akademiska källor och returnerar en strukturerad sammanfattning.
- I Inspect Image Content ställer ni in Resource till
image, Input Type tillbinaryoch Operation tillanalyze. - I Transcribe Voice Audio ställer ni in Resource till
audiooch Input Type tillbinary. - Anslut Gemini Research Chat som språkmodell för Research Synthesis Agent.
- Inloggningsuppgifter krävs: Anslut era Google Gemini-inloggningsuppgifter till Inspect Image Content, Transcribe Voice Audio och Gemini Research Chat.
- Bekräfta att Data Scraper Tool är ansluten som ett AI-verktyg för Research Synthesis Agent och att Session Memory Buffer är ansluten som AI-minne.
- Inloggningsuppgifter krävs: Lägg till inloggningsuppgifter för AI-verktygen på den överordnade anslutningen Research Synthesis Agent (inte direkt på Data Scraper Tool eller Session Memory Buffer).
{{INPUT_SEARCH_URL_INSIGHTS}}, som tillhandahålls av Generate URL Insights.Steg 5: Konfigurera leverans av output
Arbetsflödet kontrollerar svarslängden och skickar antingen ett meddelande eller en textfil tillbaka till Telegram.
- I Check Message Length ställer ni in villkoret till Number > 4000 med
{{ $json.output.length }}som vänstervärde. - På true-grenen konfigurerar ni Convert Output to File med Operation
toTextoch Source Propertyoutput. - I Deliver Summary File ställer ni in Chat ID till
{{ $('Assemble Chat Payload').item.json.chatId }}och Operation tillsendDocument. - På false-grenen konfigurerar ni Deliver Summary Message med Text
{{ $json.output }}och Chat ID{{ $('Assemble Chat Payload').item.json.chatId }}.
Steg 6: Testa och aktivera ert arbetsflöde
Validera triggern, routningen, AI-bearbetningen och leveransen av output innan ni aktiverar användning i produktion.
- Klicka på Execute Workflow och skicka ett text-, foto- och röstmeddelande till er bot för att verifiera alla rutter från Route Message Type.
- Bekräfta att Inspect Image Content och Transcribe Voice Audio returnerar text i Compose Image Text och Compose Voice Text.
- Verifiera att Research Synthesis Agent skapar ett
output-fält och att Check Message Length routar korrekt. - Kontrollera Telegram för antingen ett meddelande från Deliver Summary Message eller en fil från Deliver Summary File.
- När testerna lyckas, växla arbetsflödet till Active för att köra kontinuerligt.
Vanliga fallgropar
- Telegram-botens inloggningsuppgifter kan gå ut eller klistras in fel. Om meddelanden aldrig triggar flödet, kontrollera först token i Telegram Bot Trigger-noden.
- Om du använder Wait-noder eller extern bearbetning (som transkribering och skrapning) varierar bearbetningstiderna. Öka väntetiden om nedströms noder fallerar på tomma svar.
- Standardprompter i Gemini/AI Agent-noder är generiska. Lägg in ditt önskade format (punkter, ”nyckelpåståenden”, ”begränsningar”, citeringar) tidigt, annars kommer du redigera outputen i all evighet.
Vanliga frågor
Cirka en timme om din Telegram-bot och dina Gemini-uppgifter är klara.
Nej. Du kopplar konton, klistrar in API-nycklar och redigerar ett par textfält i n8n.
Ja. n8n har ett gratis alternativ för egen hosting och en gratis provperiod i n8n Cloud. Cloud-planer börjar på 20 USD/månad för högre volymer. Du behöver också räkna in kostnader för Gemini och Decodo, som beror på hur många meddelanden och papers du processar.
Två alternativ: n8n Cloud (hanterat, enklast att komma igång) eller egen hosting på en VPS. För egen hosting är Hostinger VPS prisvärd och hanterar n8n bra. Egen hosting ger obegränsade körningar men kräver grundläggande serverhantering.
Ja, och det bör du. Uppdatera instruktionerna i Research Synthesis Agent så att den följer din struktur (till exempel: 5 punkter, sedan ”metoder”, sedan ”begränsningar”, sedan ”varför det spelar roll”). Du kan också justera prompten för Gemini URL-parsern så att den prioriterar arXiv kontra Google Scholar-länkar beroende på vad ditt team använder mest. Vill du spara varje sammanfattning, lägg till Airtable eller Google Sheets efter leveranssteget.
Oftast beror det på en felaktig eller roterad bot-token i Telegram Bot Trigger- eller Send Message-noderna. Dubbelkolla vilken inloggning som är vald i n8n och skriv sedan direkt till boten för att bekräfta att den fortfarande svarar. Om foton och röstmeddelanden fallerar men text fungerar beror det ofta på saknade behörigheter eller en utgången filhämtning när media hämtas från Telegram.
Många, så länge dina gränser för n8n-körningar och API-kvoter hänger med.
För det här användningsfallet är n8n oftast bättre eftersom logikgrenarna (text vs. bild vs. röst) är enkla att hantera, och flöden med AI + filhantering blir snabbt dyra med Zapier-liknande prissättning per task. Egen hosting är också viktigt om du väntar dig många meddelanden, eftersom du inte betalar per liten delsteg. Samtidigt: om du bara vill ha ”Telegram-länk in, sammanfattning ut” utan mediastöd kan Zapier eller Make gå snabbare att klicka ihop. Den verkliga skillnaden är kontroll: prompter, parsing och fil-leverans baserat på längd är enklare att finjustera i n8n. Prata med en automationsexpert om du vill ha hjälp att välja.
Det här är den typen av automation som tyst fixar din vecka. Färre flikar, bättre anteckningar och sammanfattningar du faktiskt kan lita på när du behöver agera snabbt.
Kontakta oss
Hör av dig, så diskuterar vi hur just din verksamhet kan dra nytta av alla fantastiska möjligheter som AI skapar.