Behöver ert företag hjälp med att implementera AI? Kontakta oss och få prisoffert här →
AI Skolan
januari 22, 2026

Telegram till Google Sheets, röstnoter blir sökbara

Rickard Andersson Partner, Nodenordic.se

Du spelar in en snabb röstanteckning, och sedan försvinner den i din chatthistorik. Senare kommer du på “den där idén” och lägger 10 minuter på att skrolla, lyssna om och ändå hittar du den inte.

Den här automatiseringen för transkribering av röstanteckningar träffar innehållsskapare först, om vi ska vara ärliga. Men journalister och stressade ops-personer känner också igen sig, för “jag transkriberar det senare” blir snabbt en backlogg.

I den här guiden får du se hur en Telegram-bot transkriberar röstmeddelanden, sparar originalaudio i Google Drive och loggar allt i Google Sheets så att du kan söka, filtrera och dela på några sekunder.

Så fungerar automatiseringen

Här är hela arbetsflödet du ska sätta upp:

n8n Workflow Template: Telegram till Google Sheets, röstnoter blir sökbara

Varför det här spelar roll: röstanteckningar du inte hittar igen

Röstanteckningar är toppen i stunden. De går snabbt, kräver ingen ansträngning och fångar tankar när du går, kör bil eller hoppar mellan möten. Problemet kommer senare. Telegram är inte byggt för att du ska kunna söka i ljud, så “biblioteket” du tror att du skapar blir en hög inspelningar utan index. Om du samlar idéer, intervjuklipp, kundcitat eller mötesinsikter blir den högen tyst och stilla oanvändbar. Du slutar lita på ditt eget system och börjar göra om jobb du redan har gjort.

Det eskalerar snabbt. Här är var det skapar fel i verkligheten.

  • Att hitta en specifik idé betyder ofta att du måste spela upp en massa röstanteckningar, vilket är frustrerande och långsamt.
  • Manuell transkribering skjuts upp, blir sedan bortglömd, och de bästa detaljerna försvinner bakom “jag gör det senare”.
  • Att dela ett ljudklipp med en kollega är krångligt när det saknas en korrekt formaterad länk, kontext och text.
  • Utan en strukturerad logg (datum, längd, transkript, URL) kan du inte sortera, filtrera eller bygga en pålitlig content pipeline.

Det du bygger: Telegram-röstanteckningar loggade till Sheets automatiskt

Det här arbetsflödet gör Telegram till din “insamlingsinkorg” och Google Sheets till ditt sökbara arkiv. Det startar när någon skickar ett röstmeddelande till din Telegram-bot. n8n kontrollerar meddelandetypen så att du bara hanterar riktiga röstanteckningar och laddar sedan ner ljudfilen från Telegram. Därefter transkriberas ljudet med OpenAI Whisper, samtidigt som originalfilen laddas upp till Google Drive för säker förvaring. Sedan slås transkriptet och Drive-filens detaljer ihop till en korrekt formaterad post, formateras i kolumner och läggs till längst ner i ett Google Sheet. Till sist svarar boten i Telegram med en bekräftelse som innehåller transkriptet och en nedladdningslänk till det sparade ljudet.

Flödet är lätt att förstå, vilket är en stor del av nyttan. Telegram triggar det, OpenAI sköter transkriberingen, Google Drive lagrar originalet och Google Sheets blir platsen där du faktiskt söker och organiserar dina anteckningar.

Det du bygger

Förväntade resultat

Säg att du fångar 10 röstanteckningar i veckan och att varje är 30 sekunder till 2 minuter. Manuellt skulle du ladda ner ljudet (några minuter), ladda upp det någonstans (några till) och sedan skriva en grov transkribering (ofta 10 minuter per anteckning). Det är cirka 2 timmar i veckan bara för att göra dina egna anteckningar användbara. Med det här flödet skickar du röstanteckningen som vanligt och väntar på svaret; loggposten och Drive-backupen sker i bakgrunden, oftast inom ett par minuter.

Innan du börjar

  • n8n-instans (testa n8n Cloud gratis)
  • Alternativ för self-hosting om du föredrar det (Hostinger fungerar bra)
  • Telegram-bot för att ta emot röstmeddelanden via en bot.
  • Google Sheets för att lagra en sökbar transkriptlogg.
  • OpenAI API-nyckel (hämta den i OpenAI-dashboarden)

Kunskapsnivå: Nybörjare. Du kopplar konton, klistrar in en API-nyckel och väljer ett målark samt en Drive-mapp.

Vill du att någon bygger detta åt dig? Prata med en automationsexpert (gratis 15-minuters konsultation).

Steg för steg

En Telegram-bot tar emot ett nytt meddelande. Flödet startar med en Telegram Trigger som lyssnar efter nya meddelanden som skickas till din bot, så du behöver inte öppna n8n för att “köra” något.

Flödet kontrollerar om det faktiskt är en röstanteckning. Ett enkelt villkorssteg validerar meddelandetypen. Om någon skickar text eller en bild svarar boten artigt och slösar inte dina transkriberingskrediter.

Ljudet laddas ner, transkriberas och säkerhetskopieras. n8n hämtar .oga-filen från Telegram, skickar den till OpenAI Whisper för transkribering och laddar upp originalaudio till Google Drive så att du alltid har källfilen.

Allt slås ihop till en korrekt formaterad loggpost. Transkriptet, datum/tid, längd och Google Drive-nedladdnings-URL mappas till en strukturerad rad och läggs till i Google Sheets. Därefter skickas en bekräftelse tillbaka i Telegram med transkriptet och länken.

Du kan enkelt justera loggformatet för att inkludera taggar, talarnamn eller en kort sammanfattning utifrån dina behov. Se hela implementationsguiden nedan för anpassningsalternativ.

Steg-för-steg-guide för implementering

Steg 1: Konfigurera Telegram-triggern

Börja med att konfigurera Telegram-lyssnaren så att arbetsflödet kan fånga inkommande röstmeddelanden.

  1. Lägg till och öppna Telegram Voice Trigger.
  2. Ställ in Updatesmessage.
  3. Under Additional Fields, aktivera Download och sätt det till true.
  4. Inloggning krävs: Anslut era telegramApi-inloggningsuppgifter.

Steg 2: Validera indata och hantera icke-röstmeddelanden

Säkerställ att endast röstmeddelanden behandlas och ge ett hjälpsamt svar för indatatyp som inte stöds.

  1. Öppna Validate Voice Type och bekräfta att villkoret använder StringContains med Left Value satt till ={{ $json.message.toJsonString() }} och Right Value satt till audio/ogg.
  2. Koppla utgången false från Validate Voice Type till Unsupported Input Reply.
  3. I Unsupported Input Reply, ställ in Text till =Sorry, I can’t read your input right now. Please send me a voice message, and I’ll help you transcribe and track it! 🎙️💬.
  4. Ställ in Chat ID till ={{ $('Telegram Voice Trigger').item.json.message.chat.id }}.
  5. Inloggning krävs: Anslut era telegramApi-inloggningsuppgifter för Unsupported Input Reply.

Steg 3: Hämta röstfilen och bearbeta parallellt

Ladda ner röstfilen och transkribera samt lagra den samtidigt.

  1. Konfigurera Fetch Voice File med Resource satt till file.
  2. Ställ in File ID till ={{ $json.message.voice.file_id }}.
  3. Inloggning krävs: Anslut era telegramApi-inloggningsuppgifter för Fetch Voice File.
  4. Fetch Voice File skickar utdata till både Transcribe Audio Clip och Store Audio in Drive parallellt.
  5. I Transcribe Audio Clip, ställ in Resourceaudio och Operationtranscribe.
  6. Inloggning krävs: Anslut era openAiApi-inloggningsuppgifter för Transcribe Audio Clip.
  7. I Store Audio in Drive, ställ in Name till =audio-{{ $now.toFormat("yyyyLLdd-HHmmss") }}-{{$binary.data.fileName}}.
  8. Ställ in DriveMy Drive och Folder till ID:t för er målmappp.
  9. Inloggning krävs: Anslut era googleDriveOAuth2Api-inloggningsuppgifter för Store Audio in Drive.

⚠️ Vanlig fallgrop: Om röstfilen inte laddas ner, säkerställ att Telegram Voice Trigger har Download satt till true.

Steg 4: Slå ihop utdata och mappa den slutliga posten

Kombinera transkription och filmetadata och strukturera sedan utdata för loggning och notifieringar.

  1. Koppla både Transcribe Audio Clip och Store Audio in Drive till Combine Transcript & File.
  2. Öppna Map Voice Record Output och klistra in JavaScript-koden som visas i noden för att mappa DateTime, Duration, Transcript, AudioURL och ChatID.
  3. Bekräfta att koden refererar till triggerns chatt-ID med $('Telegram Voice Trigger').first().json.message.chat.id.

Steg 5: Konfigurera åtgärder för utdata

Logga transkriptionen i Google Sheets och notifiera användaren i Telegram.

  1. Map Voice Record Output skickar utdata till både Append Voice Log och Notify User in Telegram parallellt.
  2. I Append Voice Log, ställ in Operationappend, välj ert Document och välj Sheet (t.ex. Sheet1).
  3. Inloggning krävs: Anslut era googleSheetsOAuth2Api-inloggningsuppgifter för Append Voice Log.
  4. I Notify User in Telegram, ställ in Text till =✅ Voice Transcription Complete Your voice recording (⏱️ {{ $json.Duration }} seconds, recorded at {{ $json.DateTime }}) has been successfully transcribed and securely stored. 📎 Original audio stored here: {{ $json.AudioURL }} Thank you for using VoiceScribe AI! 🎙️.
  5. Ställ in Chat ID till ={{ $json.ChatID }}.
  6. Inloggning krävs: Anslut era telegramApi-inloggningsuppgifter för Notify User in Telegram.

Steg 6: Testa och aktivera ert arbetsflöde

Verifiera flödet från början till slut och slå sedan på automatiseringen.

  1. Klicka på Execute Workflow och skicka ett röstmeddelande till er Telegram-bot.
  2. Bekräfta att Append Voice Log lägger till en ny rad som innehåller DateTime, Duration, Transcript och AudioURL.
  3. Verifiera att Notify User in Telegram svarar med det formaterade bekräftelsemeddelandet och länken.
  4. Om allt lyckas, växla arbetsflödet till Active för att aktivera användning i produktion.
🔒

Lås upp fullständig steg-för-steg-guide

Få den kompletta implementeringsguiden + nedladdningsbar mall

Felsökningstips

  • Google Drive-inloggningar kan löpa ut eller kräva specifika behörigheter. Om saker slutar fungera, kontrollera först n8n-skärmen Credentials och bekräfta Drive-scope samt åtkomst till målmappen.
  • Om du använder Wait-noder eller extern rendering varierar bearbetningstiderna. Öka väntetiden om nedströmsnoder fallerar på tomma svar.
  • OpenAI-prompter och standardinställningar kan vara lite generiska. Lägg in ditt önskade språk och formatering tidigt (till exempel “returnera korrekt formaterade stycken med skiljetecken”), annars kommer du fortsätta putsa transkript manuellt.

Snabba svar

Hur lång tid tar det att sätta upp den här automatiseringen för transkribering av röstanteckningar?

Cirka 30 minuter om dina konton är redo.

Krävs det kodning för den här transkriberingen av röstanteckningar?

Nej. Du kopplar Telegram, Google och OpenAI och väljer sedan kalkylarket och Drive-mappen.

Är n8n gratis att använda för det här arbetsflödet för transkribering av röstanteckningar?

Ja. n8n har ett gratis self-hosted-alternativ och en gratis provperiod på n8n Cloud. Cloud-planer börjar på 20 USD/månad för högre volym. Du behöver också räkna med kostnader för OpenAI Whisper API (oftast ören per minut ljud).

Var kan jag hosta n8n för att köra den här automatiseringen?

Två alternativ: n8n Cloud (hanterad, enklast att komma igång) eller self-hosting på en VPS. För self-hosting är Hostinger VPS prisvärd och hanterar n8n bra. Self-hosting ger dig obegränsade körningar men kräver grundläggande serverhantering.

Kan jag anpassa det här arbetsflödet för transkribering av röstanteckningar för andra användningsfall?

Ja, ganska enkelt. Du kan byta ut steget “Transcribe Audio Clip” mot Deepgram eller AssemblyAI och sedan behålla samma loggning i Google Drive + Google Sheets. Vanliga justeringar är att lägga till en kort sammanfattning efter transkriberingen, tagga anteckningar per projekt eller routa specifika nyckelord till Slack i stället för (eller utöver) Sheets.

Varför misslyckas min Telegram-anslutning i det här flödet?

Oftast är det ett problem med bot-token eller att fel update-typ lyssnas på. Dubbelkolla token i n8n Credentials och bekräfta sedan att Telegram Trigger är konfigurerad för meddelanden som innehåller röstanteckningar. Om det fungerar för text men inte för ljud kan filtret för meddelandetyp vara för strikt, eller så saknar steget “Fetch Voice File” behörighet att ladda ner filer från Telegrams API.

Vilka volymer kan det här arbetsflödet för transkribering av röstanteckningar hantera?

De flesta små team kan köra hundratals röstanteckningar i månaden utan att ens behöva tänka på det.

Är den här automatiseringen för transkribering av röstanteckningar bättre än att använda Zapier eller Make?

Ofta, ja, när du går bortom en leksakssetup. Det här flödet behöver förgreningar (röst vs inte röst), binär filhantering för ljud och att slå ihop flera utdata (transkript + Drive-länk) till en strukturerad rad. n8n är bekväm med den komplexiteten, och self-hosting undviker prissättning per uppgift när användningen växer. Zapier eller Make kan fortfarande fungera om du har låg volym och vill ha den snabbaste UI-only-setupen, men du kan stöta på begränsningar eller högre kostnader med fil-tunga steg. Prata med en automationsexpert om du vill ha hjälp att välja.

När det här väl rullar slutar dina röstanteckningar vara “meddelanden” och blir en faktisk kunskapsbas du kan söka i. Sätt upp det en gång, och gå sedan tillbaka till jobbet som kräver din hjärna.

Kontakta oss

Hör av dig, så diskuterar vi hur just din verksamhet kan dra nytta av alla fantastiska möjligheter som AI skapar.

×

Använd mall

Få direkt tillgång till denna n8n-arbetsflödes JSON-fil

Launch login modal Launch register modal