Du spelar in samtalet, laddar upp videon och sedan… ingenting. Den ”viktiga delen” sitter fast i en tidslinje, och att hitta ett enda citat betyder att du får skrolla igenom en timme ljud igen.
Marknadschefer som försöker fånga kundernas egna ord märker det direkt. Byråägare som jagar beslut från kundsamtal också. Och om du driver ett litet team har du förmodligen sagt ”jag tittar senare” fler gånger än du vill erkänna. Den här Drive-transkriptionsautomationen gör nya Google Drive-videor till sökbara rader i Google Sheets, så att ni faktiskt kan använda det som sades.
Nedan ser du hur flödet fungerar, vilka resultat du kan förvänta dig och hur du undviker vanliga uppsättningsfallgropar som gör att sådana här automationer känns opålitliga.
Så fungerar den här automationen
Hela n8n-flödet, från trigger till slutlig output:
n8n Workflow Template: Google Drive till Google Sheets, sökbara utskrifter
flowchart LR
subgraph sg0["When chat message received Flow"]
direction LR
n2@{ icon: "mdi:play-circle", form: "rounded", label: "When chat message received", pos: "b", h: 48 }
n3@{ icon: "mdi:robot", form: "rounded", label: "AI Agent", pos: "b", h: 48 }
n4@{ icon: "mdi:brain", form: "rounded", label: "OpenAI Chat Model", pos: "b", h: 48 }
n6@{ icon: "mdi:database", form: "rounded", label: "Get row(s) in sheet in Googl..", pos: "b", h: 48 }
n4 -.-> n3
n2 --> n3
n6 -.-> n3
end
subgraph sg1["Google Drive Flow"]
direction LR
n0@{ icon: "mdi:play-circle", form: "rounded", label: "Google Drive Trigger", pos: "b", h: 48 }
n1@{ icon: "mdi:cog", form: "rounded", label: "Download file", pos: "b", h: 48 }
n7@{ icon: "mdi:cog", form: "rounded", label: "VLM Run for Video Processing", pos: "b", h: 48 }
n1 --> n7
n0 --> n1
end
subgraph sg2["Flow 3"]
direction LR
n5@{ icon: "mdi:database", form: "rounded", label: "Append row in sheet", pos: "b", h: 48 }
n8["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/webhook.dark.svg' width='40' height='40' /></div><br/>Receives JSON Data"]
n8 --> n5
end
%% Styling
classDef trigger fill:#e8f5e9,stroke:#388e3c,stroke-width:2px
classDef ai fill:#e3f2fd,stroke:#1976d2,stroke-width:2px
classDef aiModel fill:#e8eaf6,stroke:#3f51b5,stroke-width:2px
classDef decision fill:#fff8e1,stroke:#f9a825,stroke-width:2px
classDef database fill:#fce4ec,stroke:#c2185b,stroke-width:2px
classDef api fill:#fff3e0,stroke:#e65100,stroke-width:2px
classDef code fill:#f3e5f5,stroke:#7b1fa2,stroke-width:2px
classDef disabled stroke-dasharray: 5 5,opacity: 0.5
class n2,n0 trigger
class n3 ai
class n4 aiModel
class n6,n5 database
class n8 api
classDef customIcon fill:none,stroke:none
class n8 customIcon
Problemet: videokunskap försvinner så fort samtalet är slut
Video är ett dåligt format för att hitta tillbaka till information. Du kan ha en mapp full av säljsamtal, onboardinginspelningar, webbinarier och interna möten, men när någon frågar ”vad bestämde vi?” sitter du fast i att gissa vilken fil som innehåller svaret. Även om du hittar rätt inspelning måste du ändå spela upp den igen, anteckna och sedan skriva om anteckningarna till något sökbart. Det är långsamt, mentalt dränerande och det bromsar i tysthet momentum i hela teamet.
Friktionen byggs på. Ett enda missat citat är irriterande, men en månad av missat sammanhang blir snabbt dubbelarbete och dåliga beslut.
- De flesta team tappar cirka 2 timmar i veckan på att titta om inspelningar bara för att hitta en detalj.
- Anteckningar hamnar utspridda i dokument, DMs och anteckningsböcker, så ingen litar på att de har ”hela bilden”.
- Viktiga formuleringar återanvänds aldrig i marknadsföring eller enablement eftersom det är för mycket krångel att plocka fram dem.
- När en ny kollega börjar ger du dem en Drive-mapp och hoppas att de kan lista ut det.
Lösningen: automatisk transkribering till Google Sheets + faktabaserad Q&A
Det här flödet bevakar en specifik Google Drive-mapp efter nyligen skapade videofiler. När en ny fil dyker upp hämtar n8n fil-ID, laddar ner videon och skickar den till VLM Run för asynkron transkribering (så att långa inspelningar inte blockerar ditt flöde). När transkriberingen är klar anropar VLM Run tillbaka till n8n via en Webhook och skickar en transkript-payload. n8n lägger sedan till en ny rad i Google Sheets som innehåller en videoidentifierare och transkripttext eller JSON. Efter det kan du ställa frågor via Chat Trigger, och en AI-agent hämtar relevanta rader från arket och svarar enbart med hjälp av dessa transkriptsegment.
Det börjar med ”fil skapad i Drive”, går via ”transkribera och lagra” och slutar med ”sök och svara”. Google Drive är ert inflöde, Google Sheets blir ert sökbara minne, och chattupplevelsen är er genväg till exakt ögonblicket när någon sa det ni behöver.
Det du får: automation kontra resultat
| Vad det här flödet automatiserar | Resultaten du får |
|---|---|
|
|
Exempel: så här ser det ut
Säg att du laddar upp 10 inspelade samtal i veckan till en Drive-mapp och att du vanligtvis lägger cirka 15 minuter per samtal på att titta om för att plocka ut anteckningar och citat. Det är ungefär 2,5 timmar, och det är den typen av jobb som skjuts till fredag eftermiddag och sedan aldrig blir av. Med det här flödet är ditt manuella arbete i princip uppladdningen (en minut) och kanske en snabb genomläsning av transkriptraden senare. Transkriberingen kör i bakgrunden och arket är redo när du behöver det, vilket i praktiken brukar innebära att du får tillbaka de där 2 timmarna varje vecka.
Det här behöver du
- n8n-instans (prova n8n Cloud gratis)
- Alternativ för self-hosting om du föredrar det (Hostinger fungerar bra)
- Google Drive för att lagra och trigga på nya videor
- Google Sheets för att lagra transkript som sökbara rader
- VLM Run API-nyckel (hämta den i din VLM Run-dashboard)
- OpenAI API-nyckel (hämta den från OpenAI-plattformen)
Kunskapsnivå: Medel. Du kopplar OAuth-konton, installerar VLM Run-noden och mappar några fält till Sheets.
Vill du inte sätta upp det här själv? Prata med en automationsexpert (gratis 15-minuters konsultation).
Så fungerar det
En ny video hamnar i en bevakad Drive-mapp. Google Drive Trigger kontrollerar en specifik mapp och körs när en fil skapas, och fångar fil-ID så att resten av flödet kan hitta den.
Filen laddas ner för transkribering. n8n hämtar videon från Google Drive och sparar den som binärdata, vilket är det transkriberingstjänsten behöver.
Asynkron transkribering kör och anropar tillbaka när den är klar. VLM Run bearbetar videon asynkront och postar transkript-JSON tillbaka till din n8n Webhook-URL, så att långa inspelningar inte binder upp ditt flöde.
Transkriptet lagras och blir sedan sökbart. n8n lägger till en rad i Google Sheets med videoidentifierare och transkripttext/JSON. När du ställer en fråga via Chat Trigger använder AI-agenten Sheets-verktyget för att hämta relevanta rader och svarar enbart utifrån det innehållet.
Du kan enkelt ändra vilken mapp som bevakas och vilka kolumner som används i arket så att det matchar hur ditt team namnger inspelningar och söker senare. Se hela implementationsguiden nedan för anpassningsalternativ.
Steg-för-steg-guide för implementering
Steg 1: Konfigurera Google Drive-triggern
Konfigurera arbetsflödet så att det bevakar en specifik Google Drive-mapp efter nya videofiler.
- Lägg till och öppna Drive File Watcher.
- Ställ in Event på
fileCreated. - Ställ in Trigger On på
specificFolderoch välj er mapp i Folder to Watch (ersätt[YOUR_ID]). - Inloggningsuppgifter krävs: Anslut era
googleDriveOAuth2Api-inloggningsuppgifter.
⚠️ Vanlig fallgrop: Mappväljaren visar fortfarande [YOUR_ID] i mallar – se till att ni väljer den riktiga mappen, annars triggas inte flödet.
Steg 2: Koppla ihop Google Drive och transkriptionsbearbetning
Ladda ner den nya filen och skicka den till transkriberingstjänsten.
- Öppna Retrieve Drive File och ställ in Operation på
download. - Ställ in File ID på
={{ $json.id }}för att använda ID:t från Drive File Watcher. - Inloggningsuppgifter krävs: Anslut era
googleDriveOAuth2Api-inloggningsuppgifter för Retrieve Drive File. - Öppna Video Transcription Runner och ställ in Domain på
video.transcriptionoch Operation påvideo. - Ställ in Callback URL på
https://playground.attensys.ai/webhook/transcript-videooch aktivera Process Asynchronously. - Inloggningsuppgifter krävs: Anslut era
vlmRunApi-inloggningsuppgifter för Video Transcription Runner.
Steg 3: Konfigurera webhook-mottagning
Ta emot callbacken från transkriberingen och skicka vidare till lagring.
- Öppna Transcript Webhook Intake och ställ in HTTP Method på
POST. - Ställ in Path på
transcript-videoså att den matchar callback-URL:en i Video Transcription Runner.
Steg 4: Konfigurera Google Sheets-utdata och AI-frågor och svar
Lägg till transkriptioner i Sheets och konfigurera AI-assistenten så att den kan svara på frågor utifrån lagrade transkriptioner.
- Öppna Append Transcript Row och ställ in Operation på
append. - Ställ in Document ID till ert kalkylark (ersätt
[YOUR_ID]) och Sheet Name tillgid=0(Sheet1). - Mappa kolumner: Data till
={{ $json.body[0].body.response }}och Video Namae till={{ $json.body[0].body.id }}. - Inloggningsuppgifter krävs: Anslut era
googleSheetsOAuth2Api-inloggningsuppgifter för Append Transcript Row. - Öppna Chat Message Entry och behåll Mode som
webhookmed Public aktiverat för extern chattåtkomst. - Öppna Answering AI Agent och bekräfta att System Message definierar beteendet för video-frågor och svar.
- Öppna Fetch Sheet Rows Tool och välj samma Document ID och Sheet Name (
gid=0). - Inloggningsuppgifter krävs: Anslut era
googleSheetsOAuth2Api-inloggningsuppgifter för Fetch Sheet Rows Tool. - Öppna OpenAI Conversational Model och välj Model
gpt-4.1. - Inloggningsuppgifter krävs: Anslut era
openAiApi-inloggningsuppgifter för OpenAI Conversational Model. - Klicka på Execute Workflow och ladda upp en ny video i den bevakade Google Drive-mappen.
- Bekräfta att Drive File Watcher triggar, att Retrieve Drive File sedan laddar ner filen och att Video Transcription Runner tar emot den.
- Verifiera att Transcript Webhook Intake tar emot callbacken och att Append Transcript Row lägger till en ny rad i ert kalkylark.
- Skicka ett meddelande till webhooken för Chat Message Entry och bekräfta att Answering AI Agent svarar med transkriptdata som hämtas av Fetch Sheet Rows Tool.
- När allt fungerar, slå på arbetsflödet Active för produktion.
Tips: Fetch Sheet Rows Tool är ett AI-verktyg kopplat till Answering AI Agent; inloggningsuppgifter ska läggas till på själva verktygsnoden, medan språkmodellens inloggningsuppgifter hör till OpenAI Conversational Model.
Steg 5: Testa och aktivera ert arbetsflöde
Verifiera att filinläsning, lagring av transkription och AI-frågor och svar fungerar hela vägen.
Vanliga fallgropar
- Google Drive-uppgifter kan gå ut eller sakna åtkomst till den bevakade mappen. Om något slutar fungera, kontrollera först anslutningen för Google Drive Trigger och mappbehörigheterna i n8n.
- Om du använder Wait-noder eller extern rendering varierar processtiderna. Öka väntetiden om noder längre fram misslyckas på grund av tomma svar.
- VLM Run-callbackar är beroende av att din Webhook är nåbar. Om transkript aldrig kommer fram, bekräfta att Webhook-URL/sökväg matchar exakt och kontrollera n8n-körloggarna för Webhook-noden.
Vanliga frågor
Cirka 30 minuter om du redan har kontona och nycklarna.
Nej. Du kopplar Google-konton, klistrar in API-nycklar och mappar några fält till Google Sheets.
Ja. n8n har ett gratis self-hosted-alternativ och en gratis provperiod på n8n Cloud. Cloud-planer börjar på 20 USD/månad för högre volym. Du behöver också räkna med kostnader för transkribering i VLM Run och din användning av chattmodellen (OpenAI är ofta några cent per fråga, beroende på hur mycket transkript du tar in).
Två alternativ: n8n Cloud (hanterat, enklast att komma igång) eller self-hosting på en VPS. För self-hosting är Hostinger VPS prisvärd och klarar n8n bra. Self-hosting ger obegränsat antal körningar men kräver grundläggande serverhantering.
Ja, men oftast gör du det genom att duplicera Google Drive Trigger och peka varje trigger mot en annan mapp, och sedan återanvända samma nedladdnings- och transkriberingsväg. Ett annat alternativ är en Switch-nod efter triggern om du vill ha olika Sheets-flikar per mapp. Vanliga justeringar är att lägga till extra kolumner (kundnamn, samtalsdatum), spara transkriptet som ren text i stället för JSON och ändra agentinstruktionerna så att den alltid returnerar citat tillsammans med videons namn.
Oftast beror det på utgångna OAuth-uppgifter eller att det kopplade kontot inte har åtkomst till den bevakade mappen. Anslut Google Drive på nytt i n8n och bekräfta att mappen fortfarande finns och är delad med det kontot. Kontrollera också triggerinställningarna, eftersom ”Specific folder” inte fungerar om du råkade välja en genväg eller en mapp som ditt konto inte kan lista på ett tillförlitligt sätt.
Om du self-hostar n8n finns ingen körningsgräns (det beror främst på din server och transkriberingskapacitet). På n8n Cloud begränsar din plan antalet körningar per månad, så team med hög volym kan behöva en större plan eller self-hosting.
Ofta, ja. Mönstret med asynkron callback (skicka ut en lång video, vänta på ett Webhook-svar senare) är mycket enklare att kontrollera i n8n, särskilt när du vill ha förgreningar, omförsök och tydligare loggning. Du får också en rak väg till faktabaserad Q&A eftersom AI-agenten kan instrueras att bara hämta de rader den behöver från Google Sheets. Zapier och Make kan fungera för enkla flöden som ”uppladdning → transkribering → spara”, men de blir klumpiga när transkriberingen tar tid eller när du vill ha ett chattgränssnitt ovanpå. Om du är osäker, prata med en automationsexpert och beskriv dina behov kring volym och svarstid.
När transkript automatiskt hamnar i ditt ark slutar inspelningarna vara ”lagring” och blir användbar kunskap. Sätt upp det, låt det rulla och njut av att få tillbaka din tid.
Kontakta oss
Hör av dig, så diskuterar vi hur just din verksamhet kan dra nytta av alla fantastiska möjligheter som AI skapar.