Röstmeddelanden går snabbt, men de är också lätta att tappa bort. De ligger i Telegram-trådar, begravda under nyare meddelanden, och detaljerna du tänkte “komma ihåg senare” försvinner tyst.
Marknadschefer märker det när kampanjanteckningar aldrig hamnar i en brief. Grundare märker det när kundfeedback blir kvar i chatten. Och ops-ansvariga får jaga uppdateringar som redan borde vara dokumenterade. Den här automatiseringen för voice note summaries gör varje Telegram-röstmeddelande till en Google Docs-transkribering plus en felfritt formaterad, chefsklar sammanfattning.
Du får se exakt hur flödet körs, vad du behöver koppla ihop och var transkriberingen och sammanfattningen hamnar i Google Drive så att du faktiskt kan söka och använda dem.
Så fungerar automatiseringen
Här är hela arbetsflödet du kommer att sätta upp:
n8n Workflow Template: Telegram till Google Docs, röstmemon blir sammanfattningar
flowchart LR
subgraph sg0["Telegram Flow"]
direction LR
n0["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/telegram.svg' width='40' height='40' /></div><br/>Telegram"]
n1@{ icon: "mdi:robot", form: "rounded", label: "OpenAI", pos: "b", h: 48 }
n2@{ icon: "mdi:brain", form: "rounded", label: "DeepSeek Chat Model2", pos: "b", h: 48 }
n3@{ icon: "mdi:robot", form: "rounded", label: "AI Agent2", pos: "b", h: 48 }
n4["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/telegram.svg' width='40' height='40' /></div><br/>Telegram Trigger1"]
n5@{ icon: "mdi:cog", form: "rounded", label: "Google Drive1", pos: "b", h: 48 }
n6@{ icon: "mdi:cog", form: "rounded", label: "Google Drive3", pos: "b", h: 48 }
n1 --> n5
n1 --> n3
n0 --> n1
n3 --> n6
n4 --> n0
n2 -.-> n3
end
%% Styling
classDef trigger fill:#e8f5e9,stroke:#388e3c,stroke-width:2px
classDef ai fill:#e3f2fd,stroke:#1976d2,stroke-width:2px
classDef aiModel fill:#e8eaf6,stroke:#3f51b5,stroke-width:2px
classDef decision fill:#fff8e1,stroke:#f9a825,stroke-width:2px
classDef database fill:#fce4ec,stroke:#c2185b,stroke-width:2px
classDef api fill:#fff3e0,stroke:#e65100,stroke-width:2px
classDef code fill:#f3e5f5,stroke:#7b1fa2,stroke-width:2px
classDef disabled stroke-dasharray: 5 5,opacity: 0.5
class n4 trigger
class n1,n3 ai
class n2 aiModel
classDef customIcon fill:none,stroke:none
class n0,n4 customIcon
Varför det här spelar roll: röstmeddelanden blir inte “riktig” dokumentation
Röstmeddelanden är där mycket av jobbet faktiskt sker. Du spelar in en snabb kunduppdatering på väg till nästa möte. Du fångar en feature-idé medan den är färsk. Du sammanfattar ett säljsamtal medan detaljerna fortfarande är skarpa. Sedan blir meddelandet kvar i Telegram, osökbart och separerat från resten av din dokumentation. När du väl behöver det sitter du och skrollar igenom ljud, försöker gissa vilket meddelande det var och hoppas att du inte missade den där kritiska detaljen.
Det är inte ett stort haveri. Det är dussintals små som staplas på varandra.
- Att lyssna om några minuter ljud blir en daglig vana som stjäl ungefär en timme till fredag.
- Viktiga uppdateringar hamnar inte i ett format som teamet kan skumma, vidarebefordra eller klistra in i en rapport.
- Manuell transkribering är segt, så du “gör det senare”, vilket oftast betyder aldrig.
- Sammanfattningar varierar kraftigt beroende på vem som skriver dem, vilket gör veckorapporteringen rörig och inkonsekvent.
Vad du bygger: Telegram-röstmeddelanden till Google Docs-transkriberingar + sammanfattningar
Det här flödet lyssnar efter nya Telegram-meddelanden och reagerar direkt när ett röstmeddelande kommer in. Det hämtar röstfilen från Telegram via meddelandets file_id och skickar sedan ljudet till ett AI-transkriberingssteg så att du får tillbaka felfritt formaterad text. Därefter sparar flödet transkriberingen som ett nytt Google-dokument i en Google Drive-mapp som heter “N8N Transcribes”, där aktuell tid används som dokumentnamn. Sedan skickas transkriberingen till en AI-agent som tar fram en ren text-sammanfattning för rapportering (ingen rich text, inga etiketter och tillräckligt utvecklad för att klistra in i en uppdatering till chef). Slutligen sparas sammanfattningen som ett separat Google-dokument i en andra Drive-mapp som heter “N8N Summaries”.
Flödet är enkelt att leva med. Du spelar in ett röstmeddelande i Telegram och fortsätter med dagen. Google Drive fylls tyst med sökbara transkriberingar och strukturerade sammanfattningar som du kan återanvända i dokument, statusuppdateringar eller veckorapporter.
Det här bygger du
| Vad som automatiseras | Vad du uppnår |
|---|---|
|
|
Förväntade resultat
Säg att du lämnar 5 röstmeddelanden per dag för kunduppdateringar och interna påminnelser. Manuellt kanske du lägger cirka 10 minuter per meddelande på att lyssna om, skriva ner nyckelpunkter och lägga det på rätt plats, alltså ungefär 50 minuter per dag. Med det här flödet lägger du cirka 1 minut på att spela in och skicka varje meddelande, och sedan skapas transkribering och sammanfattning automatiskt i Google Drive. Det ger dig nära en timme tillbaka de flesta dagar, och du slutar tappa detaljer.
Innan du börjar
- n8n-instans (testa n8n Cloud gratis)
- Alternativ för egen hosting om du föredrar det (Hostinger fungerar bra)
- Telegram för att ta emot röstmeddelanden via en bot.
- Google Drive för att lagra transkriberingar och sammanfattningar som Docs.
- OpenAI API-nyckel (hämta den i din OpenAI API-dashboard)
Svårighetsnivå: Nybörjare. Du kopplar konton, väljer Drive-mappar och klistrar in en API-nyckel.
Vill du att någon bygger detta åt dig? Prata med en automationsexpert (gratis 15-minuters konsultation).
Steg för steg
Ett Telegram-röstmeddelande startar allt. Flödet börjar med en Telegram-trigger som bevakar nya meddelanden som skickas till din bot. När meddelandet innehåller ett röstmeddelande fångar n8n file_id som behövs för att hämta ljudet.
Ljudet hämtas och transkriberas. Ett Telegram-steg laddar ner själva röstfilen, och sedan skickar AI-transkriberingsanropet den till en AI-modell så att du får tillbaka text. Ingen nedladdning till datorn, ingen uppladdning någon annanstans.
En sammanfattning skapas för rapportering. En AI-agent tar transkriberingen och producerar en ren text-sammanfattning som är tänkt att klistras in i uppdateringar. Den inbyggda prompten styr redan mot tydligt “vad som hände och vad det betyder”.
Två Google-dokument sparas i Google Drive. Transkriberingen skrivs till ett dokument i “N8N Transcribes”, och sammanfattningen blir ett separat dokument i “N8N Summaries”. Båda tidsstämplas så att du kan sortera per dag och söka senare.
Du kan enkelt justera sammanfattningsprompten så att den matchar din ton eller ditt rapporteringsformat utifrån dina behov. Se hela implementationsguiden nedan för anpassningsalternativ.
Steg-för-steg-guide för implementering
Steg 1: konfigurera Telegram-triggern
Konfigurera arbetsflödet så att det startar när en ny Telegram-händelse kommer in.
- Lägg till noden Incoming Telegram Start som din trigger.
- Öppna Incoming Telegram Start och anslut er Telegram-bot så att den kan ta emot uppdateringar.
- Inloggningsuppgifter krävs: anslut era inloggningsuppgifter för Telegram Bot.
Steg 2: anslut intag av Telegram-meddelanden
Fånga innehållet i det inkommande meddelandet och skicka det vidare till transkriberingssteget.
- Lägg till Telegram Message Capture efter Incoming Telegram Start.
- Anslut Incoming Telegram Start till Telegram Message Capture.
- Inloggningsuppgifter krävs: anslut era inloggningsuppgifter för Telegram Bot.
Steg 3: konfigurera AI-transkribering och agentintelligens
Transkribera ljudet och förbered ett agentdrivet arbetsflöde för dokumenthantering.
- Lägg till AI Transcription Call efter Telegram Message Capture för att hantera ljudtranskribering.
- Inloggningsuppgifter krävs: anslut era OpenAI-inloggningsuppgifter i AI Transcription Call.
- Lägg till Automation Agent Hub och anslut den som en parallell utgång från AI Transcription Call.
- Anslut DeepSeek Language Core till Automation Agent Hub som språkmodell.
- Inloggningsuppgifter krävs: anslut era DeepSeek-inloggningsuppgifter i DeepSeek Language Core.
AI Transcription Call skickar utdata parallellt till både Drive File Writer och Automation Agent Hub.
Steg 4: konfigurera utdata till Google Drive
Spara transkriberingsutdata till Google Drive i både fil- och dokumentformat.
- Lägg till Drive File Writer och anslut den till AI Transcription Call för omedelbar filutdata.
- Lägg till Drive Document Saver och anslut den till Automation Agent Hub för lagring av bearbetade dokument.
- Inloggningsuppgifter krävs: anslut era Google Drive-inloggningsuppgifter för både Drive File Writer och Drive Document Saver.
Steg 5: granska arbetsflödets anteckningar och layout
Behåll dokumentationsblocket och säkerställ att flödet matchar den avsedda processen.
- Behåll Flowpast Branding som en referensanteckning för arbetsflödet.
- Verifiera ordningen: Incoming Telegram Start → Telegram Message Capture → AI Transcription Call med parallella utgångar till Drive File Writer och Automation Agent Hub.
- Bekräfta att Automation Agent Hub är ansluten till Drive Document Saver och DeepSeek Language Core som sin språkmodell.
Steg 6: testa och aktivera ert arbetsflöde
Kör ett fullständigt test för att bekräfta att ljud transkriberas och lagras korrekt.
- Klicka på Execute Workflow och skicka ett testljudmeddelande till er Telegram-bot.
- Bekräfta att AI Transcription Call genererar utdata och att både Drive File Writer och Drive Document Saver skapar filer i Google Drive.
- När allt fungerar, växla arbetsflödet till Active för användning i produktion.
Felsökningstips
- Behörigheter och tokens för Telegram-botar kan vara lite kinkiga. Om flödet slutar “se” meddelanden, kontrollera din bot-token i n8n-uppgifter och bekräfta att boten fortfarande finns i chatten du skriver i.
- Om du använder Wait-noder eller extern rendering varierar bearbetningstiderna. Öka väntetiden om noder längre fram fallerar på tomma svar.
- Standardprompter i AI-noder är generiska. Lägg in er tonalitet tidigt, annars kommer du att sitta och redigera output för alltid.
Snabba svar
Cirka 30 minuter om din Telegram-bot och Google Drive är redo.
Nej. Du kopplar främst Telegram, Google Drive och dina AI-uppgifter i n8n.
Ja. n8n har ett gratis alternativ för egen hosting och en gratis provperiod på n8n Cloud. Molnplaner börjar på 20 USD/månad för högre volym. Du behöver också räkna med OpenAI API-kostnader, som vanligtvis bara är några cent per röstmeddelande beroende på längd.
Två alternativ: n8n Cloud (hanterat, enklast att komma igång) eller egen hosting på en VPS. För egen hosting är Hostinger VPS prisvärt och hanterar n8n bra. Egen hosting ger dig obegränsade körningar men kräver grundläggande serverhantering.
Ja, och det borde du förmodligen. Den enklaste vinsten är att uppdatera AI-agentens prompt så att sammanfattningen matchar ditt format (dagligt standup, kundsammanfattning, projektlogg). Du kan också ändra de två Google Drive-noderna så att de sparar i kundspecifika mappar, eller byta ut Google Docs-output mot Google Sheets när du behöver strukturerade fält. Om du vill använda en annan modell kan du byta chattmodellen bakom AI-agenten (det här flödet använder en DeepSeek-chattmodell) utan att ändra resten av flödet.
Oftast beror det på en ogiltig eller roterad bot-token i dina Telegram-uppgifter. Dubbelkolla att boten tar emot meddelanden (och att du skickar röstmeddelanden till rätt chatt) och spara sedan om uppgiften i n8n. Om det fungerar för text men inte för röst ligger felet ofta i filhämtningssteget som använder file_id, så granska körningsdatan och bekräfta att file_id finns på inkommande meddelande.
Tillräckligt för de flesta små team: dussintals röstmeddelanden per dag är normalt, och den främsta begränsningen är din AI-användning och n8n:s körkapacitet.
Ofta, ja, eftersom det här är ett flerstegsflöde med filhantering (ljud), transkribering, ett andra AI-steg för sammanfattning och två olika Drive-utdata. n8n gör den typen av förgrening och kedjning enkel, och du kan köra egen hosting för hög volym utan att betala per task på samma sätt. Zapier och Make kan också göra det, men kostnaderna kan smyga upp när du lägger till AI-steg och filbearbetning. Dessutom ger n8n tydligare felsökning när något fallerar halvvägs. Om du bara behöver “skicka meddelande till dokument” utan AI funkar de verktygen bra. Om du vill ha hela pipelinen med transkribering + sammanfattning är n8n oftast det lugnare valet. Prata med en automationsexpert om du vill ha hjälp att välja rätt stack.
När det här väl rullar slutar dina röstmeddelanden att vara “tillfälliga”. De blir sökbar dokumentation som du faktiskt kan återanvända, vecka efter vecka.
Kontakta oss
Hör av dig, så diskuterar vi hur just din verksamhet kan dra nytta av alla fantastiska möjligheter som AI skapar.