Behöver ert företag hjälp med att implementera AI? Kontakta oss och få prisoffert här →
AI Skolan
januari 21, 2026

Telegram + Google Drive: snabba PDF-svar i chatten

Rickard Andersson Partner, Nodenordic.se

Du har filen någonstans. Du minns till och med vad den säger. Men att hitta den, öppna den, söka i den och svara någon om den äter ändå upp hela förmiddagen.

Det här drabbar ops-chefer och små teamgrundare först, helt ärligt. Men marknadsförare som lever i Telegram-kanaler känner av det också. En Telegram PDF-assistent-automatisering ger dig svar från dina Drive-dokument (och röstmeddelanden) utan att hoppa mellan appar.

Det här arbetsflödet gör Telegram till en praktisk ”fråga och gå vidare”-assistent. Du får se vad det gör, vad du behöver och hur delarna hänger ihop.

Så fungerar automatiseringen

Hela n8n-arbetsflödet, från trigger till slutligt resultat:

n8n Workflow Template: Telegram + Google Drive: snabba PDF-svar i chatten

Problemet: att svara på ”enkla” frågor tar en evighet

De flesta jobbfrågor är inte svåra. De är bara begravda. Någon frågar ”Vad är återbetalningspolicyn i PDF:en?” eller ”Vilken version av avtalsmallen använder vi?” och du hamnar på en skattjakt genom Drive-mappar, gamla chattar och halvt ihågkomna filnamn. Till slut hittar du PDF:en, inser att den är inskannad, kopierar ett stycke, klistrar in det i ett svar och oroar dig ändå för att du missade en detalj. Gör du det några gånger om dagen har du tappat ett rejält tidblock. Dessutom är kontextbytena utmattande.

Det här växer snabbt. Här är var det faller isär i verkliga team.

  • Du öppnar samma PDF:er om och om igen eftersom svaret inte finns sparat någonstans som är smidigt.
  • Inskannade dokument saktar ner allt, eftersom sök inte fungerar förrän någon kör OCR.
  • Röstmeddelanden är ”snabba”, men blir en backlogg eftersom ingen vill transkribera och sammanfatta dem.
  • När du svarar utifrån minnet smyger sig små fel in och du slösar ytterligare 10 minuter på att rätta dig själv.

Lösningen: en Telegram-assistent som kan söka i Drive-PDF:er

Det här n8n-arbetsflödet ger dig en kommando-styrd AI-assistent i Telegram som kopplar mot Google Drive och andra ”admin”-verktyg. Det startar när någon skickar ett meddelande till din Telegram-bot (text eller röst). Ett routningssteg tittar på kommandot (som /pdf för att hitta filer, /rag för att ställa frågor om indexerade dokument, eller /invoice för att skapa ett dokument). Därifrån söker arbetsflödet antingen i Drive, hämtar en PDF och kör OCR, sparar sökbara textbitar i en vektordatabas (Qdrant), eller skickar din begäran till en AI Agent för ett vanligt chatt-svar. Till sist skickas svaret tillbaka till Telegram som text, eller till och med som ett genererat röstsvar när du använder röstmeddelanden.

Arbetsflödet börjar med en Telegram-message-trigger. Det skickar din begäran via en Switch-nod till en av flera ”banor” (Drive PDF-sök, PDF-frågor och svar med RAG, rösttranskribering och svar, kalender/admin-uppgifter eller fakturaskapande). Resultatet hamnar direkt tillbaka i samma chatt så att du kan fortsätta.

Vad du får: automatisering vs. resultat

Exempel: så här ser det ut

Säg att du svarar på 6 dokumentfrågor i veckan och att varje fråga tar kanske 10 minuter för att hitta PDF:en, söka, kopiera utdraget och svara. Det är ungefär en timme ren ”var lade vi det där?”. Med det här arbetsflödet skickar du /rag plus din fråga i Telegram, väntar ungefär en minut på hämtning och AI-svar, och sen är du klar. Om du dessutom indexerar 2 nya PDF:er i veckan via /qdrant är det ett par minuters uppstart som fortsätter att betala tillbaka.

Det här behöver du

  • n8n-instans (testa n8n Cloud gratis)
  • Självhostningsalternativ om du föredrar det (Hostinger fungerar bra)
  • Telegram för bot-chattgränssnittet
  • Google Drive + Google Docs för att lagra och skapa dokument
  • OpenAI API-nyckel (hämta den från platform.openai.com)
  • Google Gemini API-nyckel (hämta den från Google AI Studio)
  • Qdrant för att lagra embeddings för PDF-frågor och svar
  • Mistral AI API-nyckel (hämta den från console.mistral.ai)
  • Brave Search API-nyckel (hämta den från Braves utvecklarportal)
  • Replicate API-token (hämta den från replicate.com)

Kunskapsnivå: Medel. Du kommer inte koda mycket, men du kommer sätta upp autentisering, klistra in API-nycklar och uppdatera några ID:n (Drive-mapp-ID:n, mall-dokument-ID:n, kalender-ID:n).

Vill du inte sätta upp det här själv? Prata med en automationsexpert (gratis 15-minuters konsultation).

Så fungerar det

Ett Telegram-meddelande triggar allt. Botten lyssnar på text, kommandon och röstmeddelanden och skickar sedan en snabb ”skriver…”-indikator så att chatten känns responsiv.

Din begäran routas baserat på kommandot. En Switch kontrollerar om du bad om hjälp, PDF-sök, PDF-frågor och svar, fakturagenerering, webbsök, födelsedagar eller en generell chatt. Den routningen är det som gör assistenten förutsägbar i stället för att ”AI-gissa” varje gång.

Dokumentjobbet sker i bakgrunden. Om du indexerar en PDF laddar arbetsflödet ner den från Google Drive, kör OCR via Mistral, delar upp texten i bitar, skapar OpenAI-embeddings och lagrar allt i Qdrant. Om du ställer en fråga hämtar Retrieval QA-kedjan de mest relevanta textbitarna och Gemini skriver svaret med den kontexten.

Röst konverteras och besvaras. Röstmeddelanden laddas ner från Telegram, Whisper transkriberar dem, en AI Agent formulerar svaret och Replicate kan skapa ett ljudsvar om du vill att assistenten ska ”prata tillbaka”.

Du kan enkelt ändra Telegram-kommandona så att de matchar ert interna språk utifrån era behov. Se hela implementationsguiden nedan för anpassningsalternativ.

Steg-för-steg-guide för implementering

Steg 1: Konfigurera Telegram-triggern

Konfigurera den inkommande Telegram-webhooken så att arbetsflödet kan ta emot och routa meddelanden från er bot.

  1. Lägg till och öppna Telegram Event Listener.
  2. Anslut er Telegram-bot och spara noden för att generera webhooken.
  3. Bekräfta körflödet: Telegram Event Listener skickar utdata parallellt till både Send Typing Indicator och Route Content Type.
Tips: Använd Telegrams BotFather för att verifiera er bot-token innan ni testar triggern.

Steg 2: Anslut Telegram och centrala integrationer

Det här arbetsflödet använder flera Telegram-, Google-, AI- och HTTP-noder. Anslut autentiseringsuppgifter en gång för att undvika körningsfel i parallella grenar.

  1. Anslut Telegram-autentiseringsuppgifter till alla meddelandenoder (11+ noder), inklusive Send Typing Indicator, Post AI Text Reply, Deliver AI Voice Reply och Send RAG Reply.
  2. Anslut Google Drive-autentiseringsuppgifter till alla Google Drive-noder (5+ noder), inklusive Retrieve PDF File, Locate PDF Files, Google Drive Lookup, Google Drive Export och Google Drive Archive.
  3. Anslut Google Docs-autentiseringsuppgifter i Google Docs Reader och Google Calendar-autentiseringsuppgifter i Calendar Birthday Query.
  4. Anslut API-autentiseringsuppgifter för Transcribe Audio to Text (OpenAI), Gemini Chat Model och Gemini Chat Model Alt.
  5. Ställ in autentisering för HTTP request-noderna (6+ noder), inklusive Primary Replicate Request, Retrieve Replicate Audio, Upload to Mistral, Fetch Mistral Signed URL och Run Mistral OCR.
  6. Anslut Qdrant-autentiseringsuppgifter i Qdrant Vector Index och Qdrant Store RAG, samt OpenAI embeddings-autentiseringsuppgifter i OpenAI Embeddings och OpenAI Embeddings RAG.
Autentiseringsuppgifter krävs: Det här arbetsflödet har inga autentiseringsuppgifter förkonfigurerade. Ni måste lägga till autentiseringsuppgifter för Telegram, Google, OpenAI, Gemini, Brave Search, Qdrant och eventuella HTTP API:er innan ni testar.

Steg 3: Konfigurera innehållsroutning och hjälpsvar

Routa Telegram-meddelanden till rätt bearbetningsgren baserat på innehållstyp och ge ett standardsvar för hjälp.

  1. Öppna Route Content Type och definiera villkor för text, röst, sök, kalender och dokumentrelaterade förfrågningar.
  2. Säkerställ att Route Content Type är kopplad till Help Response Sender för ej stödda förfrågningar eller hjälpförfrågningar.
  3. Verifiera att routningsutgångarna inkluderar Brave Web Search, Calendar Birthday Query, Fetch Voice Recording, QA Retrieval Chain och Conversational AI Agent.
Tips: Håll hjälpmeddelanden korta för att minska förvirring vid kommandon som inte stöds.

Steg 4: Konfigurera AI-pipelinen för röstmeddelanden

Den här grenen hanterar röstmeddelanden genom att transkribera ljud, generera ett svar med en agent och returnera ett talat svar.

  1. Säkerställ att Fetch Voice Recording tar emot Telegram-röstmeddelanden och skickar utdata till Transcribe Audio to Text.
  2. Konfigurera Transcribe Audio to Text så att transkriptdata skickas till Merge Content Fields.
  3. Koppla Merge Content Fields till Voice Response Agent, som därefter skickar utdata till Primary Replicate Request och Retrieve Replicate Audio innan Deliver AI Voice Reply.
  4. Koppla Gemini Chat Model Alt som språkmodell för Voice Response Agent och lägg till autentiseringsuppgifter där.
  5. Koppla Reasoning Tool Alt, Math Utility Alt, Date Time Utility Alt, Brave Search Tool Alt, Calendar Create Event Alt och Calendar Holiday Lookup Alt till Voice Response Agent. Lägg till eventuella nödvändiga verktygsautentiseringsuppgifter i Voice Response Agent, inte i verktygsnoderna.
  6. Koppla Window Memory Alt till Voice Response Agent; konfigurera minnesinställningar inne i agenten.

Steg 5: Konfigurera AI-assistentens textsvar

Den här grenen hanterar vanliga textsvar med en AI-agent med verktyg, minne och en Gemini-modell.

  1. Säkerställ att Conversational AI Agent skickar utdata till Post AI Text Reply.
  2. Koppla Gemini Chat Model som språkmodell för Conversational AI Agent och anslut era Gemini-autentiseringsuppgifter där.
  3. Koppla Reasoning Tool, Math Utility, Date Time Utility, Brave Search Tool, Calendar Create Event Tool och Calendar Holiday Lookup som verktyg för Conversational AI Agent, och lägg till eventuella verktygsautentiseringsuppgifter i föräldranoden.
  4. Koppla Window Memory till Conversational AI Agent för att bevara kontext mellan meddelanden.
  5. Inkludera Airbnb MCP Client och Airbnb Toolset som verktyg om ni planerar att använda MCP-integrationerna; lägg till deras autentiseringsuppgifter i Conversational AI Agent.

Steg 6: Sätt upp RAG och svar med vektorsök

RAG-flödet indexerar dokument och besvarar frågor med Qdrant och en retrieval chain.

  1. Koppla QA Retrieval Chain till Send RAG Reply för slutliga Telegram-svar.
  2. Koppla Vector Store Fetcher som retriever för QA Retrieval Chain och anslut den till Qdrant Store RAG.
  3. Koppla Gemini RAG Model som språkmodell för QA Retrieval Chain och anslut Gemini-autentiseringsuppgifter.
  4. Ställ in OpenAI Embeddings RAG som embeddings-leverantör för Qdrant Store RAG och anslut OpenAI-autentiseringsuppgifter.
  5. Säkerställ att OpenAI Embeddings, Standard Data Loader och Token Chunk Splitter är anslutna till Qdrant Vector Index för att köra indexeringspipelinen.
⚠️ Vanlig fallgrop: RAG-svar kommer att misslyckas om Qdrant-autentiseringsuppgifter eller samlingsnamn saknas i Qdrant Store RAG eller Qdrant Vector Index.

Steg 7: Konfigurera PDF- och dokumenthantering

Det här arbetsflödet indexerar PDF:er, utför OCR och hanterar Google Drive-dokumentexporter för leverans via Telegram.

  1. Säkerställ att Refresh Document Index skickar utdata till Locate PDF Files och därefter till Send PDF Search Reply för att lista resultat.
  2. Koppla Retrieve PDF File till Upload to Mistral, Fetch Mistral Signed URL och Run Mistral OCR.
  3. Verifiera att Run Mistral OCR skickar utdata till Custom Script Logic, sedan till Iterate Items Batch och slutligen till Assign Page Value och Qdrant Vector Index.
  4. Bekräfta att Qdrant Vector Index skickar utdata till Pause Execution, sedan tillbaka till Iterate Items Batch och till sist till Notify Qdrant Indexing.
  5. För dokumentexporter, koppla Map Field ValuesGoogle Drive LookupGoogle Docs ReaderGoogle Drive Export.
  6. Bekräfta att Google Drive Export skickar utdata parallellt till både Google Drive Archive och Send Invoice PDF.

Steg 8: Konfigurera webbsök- och kalendersvar

Aktivera svar med extern data för webbsökning och födelsedagsfrågor i kalendern.

  1. Koppla Brave Web Search till Send Brave Search Reply och lägg till Brave Search-autentiseringsuppgifter.
  2. Koppla Calendar Birthday Query till Send Birthday List och lägg till Google Calendar-autentiseringsuppgifter.

Steg 9: Testa och aktivera ert arbetsflöde

Validera alla grenar och säkerställ att autentiseringsuppgifter fungerar innan ni går live.

  1. Klicka på Execute Workflow och skicka ett testmeddelande i Telegram (text, röst, sök och kalender) för att trigga varje gren.
  2. Bekräfta lyckade körningar: röstmeddelanden returnerar Deliver AI Voice Reply, textmeddelanden returnerar Post AI Text Reply, RAG-frågor returnerar Send RAG Reply och sökningar returnerar Send Brave Search Reply.
  3. Om någon nod ger fel, gå tillbaka och justera autentiseringsuppgifter i den specifika noden och testa igen.
  4. Slå på arbetsflödet till Active för att möjliggöra produktionsanvändning.
🔒

Lås upp fullständig steg-för-steg-guide

Få den kompletta implementeringsguiden + nedladdningsbar mall

Vanliga fallgropar

  • OAuth-uppgifter för Google Drive och Google Docs kan löpa ut eller sakna rätt scopes. Om filsök eller fakturagenerering misslyckas, kontrollera först Google Cloud OAuth consent och det anslutna kontot i n8n-credentials.
  • Om du använder Wait-noder eller extern rendering varierar processtiderna. Öka väntetiden om nedströms-noder fallerar på tomma svar.
  • Qdrant kan se ”ansluten” ut men ändå neka skrivningar om collections-namnet, URL:en eller API-nyckeln är fel. Om RAG-svar kommer tillbaka tomma, kontrollera Qdrant-collectionen och bekräfta att embeddings faktiskt lagras.

Vanliga frågor

Hur lång tid tar det att sätta upp den här Telegram PDF-assistent-automatiseringen?

Cirka 60 minuter om du redan har dina API-nycklar och Google-åtkomst redo.

Behöver jag kunna koda för att automatisera den här Telegram PDF-assistent-automatiseringen?

Nej. Du kommer främst att koppla ihop konton och klistra in API-nycklar. Lite redigering (som mapp-ID:n och mall-ID:n) är den huvudsakliga ”tekniska” delen.

Är n8n gratis att använda för det här arbetsflödet för Telegram PDF-assistent-automatisering?

Ja. n8n har ett gratis självhostat alternativ och en gratis provperiod på n8n Cloud. Cloud-planer börjar på 20 USD/månad för högre volym. Du behöver också räkna med API-kostnader för OpenAI (Whisper + embeddings), Gemini, Mistral OCR, Qdrant-hosting, Brave Search och Replicate text-till-tal.

Var kan jag hosta n8n för att köra den här automatiseringen?

Två alternativ: n8n Cloud (hanterat, enklast uppsättning) eller självhosting på en VPS. För självhosting är Hostinger VPS prisvärd och klarar n8n bra. Självhosting ger dig obegränsade körningar men kräver grundläggande serverhantering.

Kan jag anpassa det här arbetsflödet för Telegram PDF-assistent-automatisering för en annan AI-modell eller färre kommandon?

Ja, men planera det medvetet. Du kan byta ut Gemini-chatmodellnoderna mot en annan LLM du föredrar, och du kan ta bort hela grenar genom att redigera Route Content Type (Switch)-logiken så att bara de kommandon du vill ha kvar finns kvar. Vanliga anpassningar är att stänga av röstsvar (Replicate), behålla bara /pdf och /rag och ändra fakturamall-mappningen i Map Field Values- och Google Docs-noderna.

Varför misslyckas min Telegram-anslutning i det här arbetsflödet?

Oftast är det bot-tokenen eller en Telegram-nod som pekar på fel credential. Generera tokenen på nytt i @BotFather vid behov och uppdatera sedan varje Telegram-nod som skickar meddelanden (inte bara triggern). Kontrollera också att din bot kan läsa den meddelandetyp du skickar (röst vs text) och att du testar i rätt chatt.

Hur många PDF:er kan den här Telegram PDF-assistent-automatiseringen hantera?

Många.

Är den här Telegram PDF-assistent-automatiseringen bättre än att använda Zapier eller Make?

För ett arbetsflöde som det här, ja i de flesta fall. Du kombinerar rösttranskribering, RAG-hämtning, OCR, embeddings, en vektordatabas och flera verktygs”banor” bakom en Telegram-bot, och n8n hanterar den förgreningarna snyggt utan att det blir en prischock. Självhosting är också en stor grej när du har frekventa chattinteraktioner. Zapier eller Make kan fortfarande vara bra för lätta ”Telegram-meddelande → en åtgärd”-automatiseringar, men de blir klumpiga när du behöver minne, hämtningskedjor eller mycket villkorsstyrd routning. Prata med en automationsexpert om du vill ha hjälp att välja den enklaste uppsättningen för dina exakta behov.

När det här väl är igång blir Telegram platsen där du frågar och platsen där du får svaret. Arbetsflödet sköter det repetitiva grävandet så att du kan återgå till det faktiska arbetet.

Kontakta oss

Hör av dig, så diskuterar vi hur just din verksamhet kan dra nytta av alla fantastiska möjligheter som AI skapar.

×

Använd mall

Få direkt tillgång till denna n8n-arbetsflödes JSON-fil

Launch login modal Launch register modal