Behöver ert företag hjälp med att implementera AI? Kontakta oss och få prisoffert här →
AI Skolan
januari 22, 2026

Telegram + Gemini: papersammanfattningar i chatten

Rickard Andersson Partner, Nodenordic.se

Din ”snabba paper-koll” blir till 12 öppna flikar, tre halvgenomlästa abstracts och en anteckning du aldrig hittar igen. Sedan pingar någon dig och vill ha slutsatsen. Och du är tillbaka i att kopiera länkar, skumma PDF:er och försöka låta säker.

Marknadschefer som gör konkurrentanalyser känner igen det här. Det gör även grundare som följer ny teknik och konsulter som lever på ”skicka mig sammanfattningen”-förfrågningar. Den här automationen för Telegram Gemini summaries ger dig en felfri, lättläst papersammanfattning direkt i chatten, utan flikcirkusen.

Du får se hur flödet hanterar länkar, röstmeddelanden och skärmdumpar, hur det hämtar paper-detaljerna och hur det levererar resultatet som ett meddelande eller som en fil när outputen blir lång.

Så fungerar den här automationen

Hela n8n-flödet, från trigger till slutlig output:

n8n Workflow Template: Telegram + Gemini: papersammanfattningar i chatten

Problemet: paper-läsning blir snabbt splittrad

Akademisk läsning börjar oftast enkelt: ”Skumma bara det här pappret.” Sedan sprider det sig. Du öppnar arXiv, följer citeringar, hoppar till Google Scholar och plötsligt jonglerar du ett dussin källor utan en enhetlig anteckningsstruktur. Om någon skickar en skärmdump på en figur eller ett röstmeddelande som ”kan du kolla det här påståendet?”, blir friktionen ännu större eftersom informationen inte ens är sökbar. Kostnaden är inte bara tid. Det är kontextbyten, tappat fokus och sammanfattningar som varierar i ton beroende på vem som skrev dem den dagen.

Små friktioner staplas på varandra. Här brukar det oftast fallera i riktiga team.

  • Du slutar med att skriva om samma struktur för ”TL;DR + nyckelmetoder + begränsningar” om och om igen.
  • Att klistra in paper-länkar i anteckningar blir rörigt, så att hitta dem senare är i praktiken tur.
  • Röstmeddelanden och skärmdumpar blir till ”jag tar det sen”, vilket betyder att de försvinner.
  • Manuell sammanfattning ger lätt fel, särskilt när du skummar under tidspress.

Lösningen: En Telegram-assistent för research som sammanfattar åt dig

Det här flödet gör en Telegram-bot till en researchassistent som förstår det du skickar och svarar med en användbar sammanfattning. Det startar när ett meddelande når din bot (text, bild eller röstmeddelande). Är det en skärmdump läser Gemini innehållet och extraherar relevant text. Är det röst transkriberar Gemini till en korrekt formaterad prompt. Sedan bygger flödet en strukturerad ”chat payload” och skickar den till en Research Synthesis Agent, som använder Gemini för att tolka URL:er och intention, och Decodo för att skrapa paper-detaljer som titel, abstract och publiceringsmetadata. Till sist får du sammanfattningen tillbaka i Telegram, antingen som ett vanligt meddelande eller som en fil om svaret är för långt för chatten.

Flödet startar i Telegram och routar direkt meddelandet efter typ. Därefter omvandlar det det du skickade till användbar text, kör research + syntes, kontrollerar längden och levererar resultatet i rätt format. Inga extra appar att öppna.

Det du får: automation vs. resultat

Exempel: så här ser det ut

Säg att du granskar 10 papers i veckan och vanligtvis lägger cirka 25 minuter per styck: öppnar länken, skummar abstractet, plockar några detaljer, skriver en kort slutsats och klistrar in den där du sparar anteckningar. Det blir runt 4 timmar i veckan. Med det här flödet vidarebefordrar du arXiv-länken (eller skickar en skärmdump/röstmeddelande) i Telegram på under en minut, väntar ett par minuter på sammanfattningen och sedan är du klar. Räkna med 30 minuter av din tid för veckan i stället för en halv dag.

Det här behöver du

  • n8n-instans (testa n8n Cloud gratis)
  • Alternativ för egen hosting om du föredrar det (Hostinger fungerar bra)
  • Telegram för att ta emot meddelanden och leverera sammanfattningar.
  • Google Gemini för att tolka, transkribera, extrahera och sammanfatta.
  • Decodo för att skrapa paper-detaljer från akademiska källor.

Kunskapsnivå: Medel. Du kopplar en Telegram-bot, lägger in API-uppgifter och justerar en platshållare i en systemprompt.

Vill du inte sätta upp det här själv? Prata med en automationsexpert (gratis 15-minuters konsultation).

Så fungerar det

Ett Telegram-meddelande sätter igång det. Du skickar en arXiv-länk, en skriven fråga, en skärmdump av ett paper eller ett röstmeddelande till din bot. Flödets trigger lyssnar på nya meddelanden och skickar dem direkt till ett routningssteg.

Flödet gör om ”det du än skickade” till strukturerad text. Skärmdumpar går igenom ett steg för bildinspektion (Gemini extraherar läsbart innehåll). Röstmeddelanden går igenom transkribering. Ren text går rakt igenom. I slutet av det här steget ser allt likadant ut för sammanfattaren, vilket är hela poängen.

Research + syntes sker på ett ställe. En Gemini-URL-tolk tolkar akademiska URL:er och intention, sedan använder Research Synthesis Agent Decodo-skrapning för att hämta detaljer som titlar, abstracts och publiceringsinfo. Efter det skriver Gemini en kortfattad sammanfattning som faktiskt går att använda, inte ett vagt stycke.

Leveransen anpassas efter meddelandelängd. Om svaret är tillräckligt kort kommer det tillbaka som ett vanligt Telegram-meddelande. Om det blir långt konverterar n8n det till en fil och skickar filen i stället, så att du inte tappar innehåll på grund av chattens begränsningar.

Du kan enkelt ändra sammanfattningsstrukturen så att den matchar din anteckningsmall, eller ändra vilka källor som skrapas utifrån dina behov. Se hela implementationsguiden nedan för anpassningsalternativ.

Steg-för-steg-guide för implementering

Steg 1: Konfigurera Telegram-triggern

Det här arbetsflödet startar när en användare skickar ett meddelande till er Telegram-bot. Konfigurera triggern så att den lyssnar efter inkommande meddelanden.

  1. Lägg till noden Telegram Bot Trigger och ställ in Updates till message.
  2. Inloggningsuppgifter krävs: Anslut era Telegram API-inloggningsuppgifter till Telegram Bot Trigger.
  3. Bekräfta att triggern är ansluten till Route Message Type som nästa nod.

Steg 2: Routa och bygg chattinput från Telegram-meddelanden

Inkommande meddelanden routas efter typ (foto, text, röst) och transformeras sedan till en enhetlig chattpayload för AI-agenten.

  1. I Route Message Type lägger ni till tre regler med följande vänstervärden: {{ $json.message.photo }}, {{ $json.message.text }} och {{ $json.message.voice }}, var och en med villkoret notEmpty.
  2. Anslut Photo-utgången till Fetch Telegram Photo och ställ in File ID till {{ $json.message.photo[3].file_id }} med Resource satt till file.
  3. Anslut Voice-utgången till Fetch Telegram Voice och ställ in File ID till {{ $json.message.voice.file_id }} med Resource satt till file.
  4. Skicka typer som inte stöds till Send Fallback Notice med Text satt till Sorry, i can only support text, photo, and voice message och Chat ID satt till {{ $json.message.chat.id }}.
  5. I Compose Image Text ställer ni in message.text till Caption: {{ $('Telegram Bot Trigger').item.json.message.caption ?? "[none]" }} --- Image: {{ $json.content.parts[0].text }}.
  6. I Compose Voice Text ställer ni in message.text till {{ $json.content.parts[0].text }}.
  7. I Assemble Chat Payload ställer ni in chatInput till {{ $json.message.text }} och chatId till {{ $('Telegram Bot Trigger').item.json.message.chat.id }}.
  8. Inloggningsuppgifter krävs: Anslut era Telegram API-inloggningsuppgifter till alla Telegram-åtgärdsnoder (5+ noder, inklusive Fetch Telegram Photo, Fetch Telegram Voice, Send Fallback Notice, Deliver Summary File och Deliver Summary Message).

⚠️ Vanlig fallgrop: Fetch Telegram Photo använder $json.message.photo[3]. Om avsändarens foto inte har fyra storlekar kan detta index saknas. Justera indexet eller lägg till en fallback vid behov.

Steg 3: Konfigurera generering av url-insikter

Innan researchen startar definierar arbetsflödet akademiska url:er och tolkar deras parametrar så att AI-agenten kan använda dem.

  1. I Set Search URLs ställer ni in urls till {{[\n "https://scholar.google.com/scholar?q=artificial+intelligence&hl=en&as_sdt=0,5",\n "https://scholar.google.com/scholar?as_ylo=2025&q=artificial+intelligence&hl=en&as_sdt=0,5",\n "https://arxiv.org/search/?query=artificial+intelligence&searchtype=all&abstracts=show&order=-announced_date_first",\n "https://arxiv.org/search/?query=artificial+intelligence&searchtype=all&source=header",\n]}}.
  2. Anslut Set Search URLs till Generate URL Insights och behåll Prompt Type som define.
  3. Säkerställ att Gemini URL Parser är ansluten som AI-språkmodell för Generate URL Insights.
  4. Inloggningsuppgifter krävs: Anslut era Google Gemini-inloggningsuppgifter till Gemini URL Parser.

Steg 4: Sätt upp AI-bearbetning för research

AI-agenten tar emot användarens fråga och url-insikterna, skrapar akademiska källor och returnerar en strukturerad sammanfattning.

  1. I Inspect Image Content ställer ni in Resource till image, Input Type till binary och Operation till analyze.
  2. I Transcribe Voice Audio ställer ni in Resource till audio och Input Type till binary.
  3. Anslut Gemini Research Chat som språkmodell för Research Synthesis Agent.
  4. Inloggningsuppgifter krävs: Anslut era Google Gemini-inloggningsuppgifter till Inspect Image Content, Transcribe Voice Audio och Gemini Research Chat.
  5. Bekräfta att Data Scraper Tool är ansluten som ett AI-verktyg för Research Synthesis Agent och att Session Memory Buffer är ansluten som AI-minne.
  6. Inloggningsuppgifter krävs: Lägg till inloggningsuppgifter för AI-verktygen på den överordnade anslutningen Research Synthesis Agent (inte direkt på Data Scraper Tool eller Session Memory Buffer).

Systemmeddelandet i Research Synthesis Agent refererar redan till {{INPUT_SEARCH_URL_INSIGHTS}}, som tillhandahålls av Generate URL Insights.

Steg 5: Konfigurera leverans av output

Arbetsflödet kontrollerar svarslängden och skickar antingen ett meddelande eller en textfil tillbaka till Telegram.

  1. I Check Message Length ställer ni in villkoret till Number > 4000 med {{ $json.output.length }} som vänstervärde.
  2. På true-grenen konfigurerar ni Convert Output to File med Operation toText och Source Property output.
  3. I Deliver Summary File ställer ni in Chat ID till {{ $('Assemble Chat Payload').item.json.chatId }} och Operation till sendDocument.
  4. På false-grenen konfigurerar ni Deliver Summary Message med Text {{ $json.output }} och Chat ID {{ $('Assemble Chat Payload').item.json.chatId }}.

⚠️ Vanlig fallgrop: Telegram-meddelanden över 4096 tecken kommer att misslyckas. Noden Check Message Length förhindrar detta—kringgå den inte.

Steg 6: Testa och aktivera ert arbetsflöde

Validera triggern, routningen, AI-bearbetningen och leveransen av output innan ni aktiverar användning i produktion.

  1. Klicka på Execute Workflow och skicka ett text-, foto- och röstmeddelande till er bot för att verifiera alla rutter från Route Message Type.
  2. Bekräfta att Inspect Image Content och Transcribe Voice Audio returnerar text i Compose Image Text och Compose Voice Text.
  3. Verifiera att Research Synthesis Agent skapar ett output-fält och att Check Message Length routar korrekt.
  4. Kontrollera Telegram för antingen ett meddelande från Deliver Summary Message eller en fil från Deliver Summary File.
  5. När testerna lyckas, växla arbetsflödet till Active för att köra kontinuerligt.
🔒

Lås upp fullständig steg-för-steg-guide

Få den kompletta implementeringsguiden + nedladdningsbar mall

Vanliga fallgropar

  • Telegram-botens inloggningsuppgifter kan gå ut eller klistras in fel. Om meddelanden aldrig triggar flödet, kontrollera först token i Telegram Bot Trigger-noden.
  • Om du använder Wait-noder eller extern bearbetning (som transkribering och skrapning) varierar bearbetningstiderna. Öka väntetiden om nedströms noder fallerar på tomma svar.
  • Standardprompter i Gemini/AI Agent-noder är generiska. Lägg in ditt önskade format (punkter, ”nyckelpåståenden”, ”begränsningar”, citeringar) tidigt, annars kommer du redigera outputen i all evighet.

Vanliga frågor

Hur lång tid tar det att sätta upp den här automationen för Telegram Gemini summaries?

Cirka en timme om din Telegram-bot och dina Gemini-uppgifter är klara.

Behöver jag kunna koda för att automatisera Telegram Gemini summaries?

Nej. Du kopplar konton, klistrar in API-nycklar och redigerar ett par textfält i n8n.

Är n8n gratis att använda för det här flödet för Telegram Gemini summaries?

Ja. n8n har ett gratis alternativ för egen hosting och en gratis provperiod i n8n Cloud. Cloud-planer börjar på 20 USD/månad för högre volymer. Du behöver också räkna in kostnader för Gemini och Decodo, som beror på hur många meddelanden och papers du processar.

Var kan jag hosta n8n för att köra den här automationen för Telegram Gemini summaries?

Två alternativ: n8n Cloud (hanterat, enklast att komma igång) eller egen hosting på en VPS. För egen hosting är Hostinger VPS prisvärd och hanterar n8n bra. Egen hosting ger obegränsade körningar men kräver grundläggande serverhantering.

Kan jag anpassa det här flödet för Telegram Gemini summaries till ett specifikt sammanfattningsformat?

Ja, och det bör du. Uppdatera instruktionerna i Research Synthesis Agent så att den följer din struktur (till exempel: 5 punkter, sedan ”metoder”, sedan ”begränsningar”, sedan ”varför det spelar roll”). Du kan också justera prompten för Gemini URL-parsern så att den prioriterar arXiv kontra Google Scholar-länkar beroende på vad ditt team använder mest. Vill du spara varje sammanfattning, lägg till Airtable eller Google Sheets efter leveranssteget.

Varför fallerar min Telegram-anslutning i det här flödet?

Oftast beror det på en felaktig eller roterad bot-token i Telegram Bot Trigger- eller Send Message-noderna. Dubbelkolla vilken inloggning som är vald i n8n och skriv sedan direkt till boten för att bekräfta att den fortfarande svarar. Om foton och röstmeddelanden fallerar men text fungerar beror det ofta på saknade behörigheter eller en utgången filhämtning när media hämtas från Telegram.

Hur många papers kan den här automationen för Telegram Gemini summaries hantera?

Många, så länge dina gränser för n8n-körningar och API-kvoter hänger med.

Är den här automationen för Telegram Gemini summaries bättre än att använda Zapier eller Make?

För det här användningsfallet är n8n oftast bättre eftersom logikgrenarna (text vs. bild vs. röst) är enkla att hantera, och flöden med AI + filhantering blir snabbt dyra med Zapier-liknande prissättning per task. Egen hosting är också viktigt om du väntar dig många meddelanden, eftersom du inte betalar per liten delsteg. Samtidigt: om du bara vill ha ”Telegram-länk in, sammanfattning ut” utan mediastöd kan Zapier eller Make gå snabbare att klicka ihop. Den verkliga skillnaden är kontroll: prompter, parsing och fil-leverans baserat på längd är enklare att finjustera i n8n. Prata med en automationsexpert om du vill ha hjälp att välja.

Det här är den typen av automation som tyst fixar din vecka. Färre flikar, bättre anteckningar och sammanfattningar du faktiskt kan lita på när du behöver agera snabbt.

Kontakta oss

Hör av dig, så diskuterar vi hur just din verksamhet kan dra nytta av alla fantastiska möjligheter som AI skapar.

×

Använd mall

Få direkt tillgång till denna n8n-arbetsflödes JSON-fil

Launch login modal Launch register modal