Behöver ert företag hjälp med att implementera AI? Kontakta oss och få prisoffert här →
AI Skolan
januari 22, 2026

OpenAI + Google Drive: textade MP4:or levererade

Rickard Andersson Partner, Nodenordic.se

Råvideor är enkla att spela in. Att göra dem till något du faktiskt kan publicera är slitjobbet. Undertexter behöver rättas, speakerröster matchar inte tajmingen och “final-final-v3”-filer hamnar utspridda på laptops och i chatttrådar.

Den här OpenAI-videoautomationen träffar innehållsskapare först, men utbildningsteam och små byråer känner av den också. Du vill ha en felfri MP4 med undertexter (eller berättarröst) som är redo att dela, utan att spendera kvällen i ett redigeringsprogram.

Det här arbetsflödet gör uppladdningar till polerade leveranser och lägger de färdiga filerna i Google Drive. Du ser vad som automatiseras, vilka resultat du kan förvänta dig och vad som krävs för att köra det stabilt.

Så fungerar den här automatiseringen

Det kompletta n8n-arbetsflödet, från trigger till slutleverans:

n8n Workflow Template: OpenAI + Google Drive: textade MP4:or levererade

Problemet: flaskhalsar i videoredigering bromsar leveransen

De flesta team fastnar inte på “att göra en video”. De fastnar på allt efter inspelningen. Undertexter behöver genereras och sedan rensas. Speakerröster låter bra, men att synka dem mot bild tar evigheter. Och när du producerar många lektioner, demoklipp eller sociala klipp blir redigeringskön den verkliga begränsningen. Det värsta är kontextbytena: du hoppar mellan ett transkriberingsverktyg, ett TTS-verktyg, en editor och ett lagringssystem, och ändå slutar det med att du manuellt exporterar och delar.

Det går snabbt att summera. Här är var det oftast fallerar i verkligheten.

  • Grundläggande undertextning kan sluka cirka 1–2 timmar per video när du räknar in rensning och omexporter.
  • Små timingfel skapar stora trovärdighetsproblem, särskilt i utbildnings- eller compliancevideor.
  • Team tappar bort versioner eftersom leveranser hamnar i slumpmässiga mappar och meddelandetrådar.
  • Färdiga SaaS-editorer ger löpande avgifter, exportbegränsningar eller vattenstämplar som gör skalning krånglig.

Lösningen: ladda upp en gång, få tillbaka en MP4 redo för Drive

Det här arbetsflödet ger dig en AI-assisterad “redigeringsfil” som körs i n8n och slutar i Google Drive. Det startar när någon laddar upp råvideo (och eventuella stödassets) via en enkel formulärtrigger. Flödet mellanlagrar filerna på din server, förbereder en sessionsmapp och kör sedan grovjobbet: transkribering med OpenAI Whisper, valfri textrensning och valfri AI-röstgenerering med OpenAI Speech. Därefter slår FFmpeg-baserade steg ihop klipp, justerar videons timing för att matcha berättarrösten när det behövs och bränner in undertexter när du väljer undertextläge. Till sist levereras och lagras den färdiga MP4:an i Google Drive så att du kan dela en länk, lägga den i en kursplattform eller skicka den till en kund utan att leta filer.

Arbetsflödet börjar med ett uppladdningsformulär och en servermapps-setup. Sedan bearbetar det media (transkribera, översätta, berättarröst, slå ihop, undertexta) och renderar den slutliga MP4:an. Sist laddar det upp resultatet till Google Drive och städar bort temporära filer så att din server inte blir en skräplåda.

Vad du får: automatisering vs. resultat

Exempel: så här ser det ut i praktiken

Säg att du producerar 5 utbildningsklipp per vecka. Manuell hantering: en “enkel” runda (generera undertexter, rensa dem, exportera, ladda upp till Drive, dela) landar ofta på cirka 2 timmar per klipp, så du tappar ungefär 10 timmar i veckan. Med det här arbetsflödet laddar du upp en gång (cirka 10 minuter), väntar på bearbetning och rendering (ofta under en timme beroende på videolängd och serverhastighet), och sedan finns den färdiga MP4:an redan i Google Drive. Du granskar och godkänner fortfarande, men det repetitiva arbetet slutar äga din kalender.

Det här behöver du

  • n8n-instans (prova n8n Cloud gratis)
  • Alternativ för egen drift om du föredrar det (Hostinger fungerar bra)
  • OpenAI API för Whisper-transkribering och Speech TTS
  • Google Drive för att lagra och dela slutliga MP4-leveranser
  • FFmpeg installerat (installerat på din server)
  • OpenAI API-nyckel (hämta den i OpenAI-dashbordet)

Kunskapsnivå: Medel. Du kopplar in credentials i n8n och är bekväm med att konfigurera en server som kan köra FFmpeg-jobb.

Vill du inte sätta upp det här själv? Prata med en automationsexpert (gratis 15-minuters konsultation).

Så fungerar det

Ett uppladdningsformulär startar jobbet. Någon skickar in en video (och valfria assets) via triggern “Incoming Upload Form”, vilket startar en ny bearbetningssession.

Filer mellanlagras och organiseras på servern. n8n skapar en mediamapp och en sessionsmapp, flyttar uppladdningen och packar upp arkiv vid behov så att varje körning är isolerad och prydlig.

OpenAI sköter transkribering och röstgenerering. Whisper tar fram transkriptet, sedan rensar ett AI-formateringssteg upp det för undertexter eller berättarröst. Om berättarröstläge väljs genererar OpenAI Speech rösten och arbetsflödet justerar videons timing så att ljud och bild matchar naturligt.

Den slutliga MP4:an renderas och levereras till Google Drive. FFmpeg slår ihop klipp, applicerar undertext-styling när du väljer undertextläge och producerar en MP4 redo att publicera. Google Drive-lagring blir din överlämningspunkt och städsteg tar bort temporära filer.

Du kan enkelt ändra undertext-styling och röstalternativ utifrån dina behov. Se den fullständiga implementeringsguiden nedan för anpassningsalternativ.

Steg-för-steg-guide för implementering

Steg 1: Konfigurera den manuella triggern

Det här arbetsflödet startar med en manuell trigger för att initiera fjärrmappar innan filbearbetningen börjar.

  1. Lägg till och öppna Start Folder Setup.
  2. Lämna alla fält med standardvärdena, eftersom den här manuella triggern används för körningar av setup.
  3. Koppla Start Folder Setup till Remote Init Command för att starta flödet för mappinitiering.

⚠️ Vanlig fallgrop: Den manuella triggern körs inte automatiskt. Ni måste klicka på Execute Workflow för att mappsetupen ska starta.

Steg 2: Anslut fjärr- och överföringstjänster

Arbetsflödet använder flera SSH-, FTP-, HTTP- och Google Drive-anslutningar för att flytta filer och köra fjärrkommandon.

  1. Öppna varje SSH-nod och anslut autentiseringsuppgifter: Remote Init Command, Create Media Folder, Create Session Folder, Extract Archive, Execute Finalize, Merge Update Assets, Extract Update Archive, Trigger Media Build, Apply Server Settings och Cleanup Temp Files. Credential Required: Anslut era SSH-autentiseringsuppgifter.
  2. Öppna varje FTP-nod och anslut autentiseringsuppgifter: Transfer Upload Files, Sync Data Assets, Stage Data Files, Transfer Variant Files, Send Composition Files, Deliver Video Files, Upload Update Assets, Sync Update Assets, Send Upload Summary och Deliver Alt Video. Credential Required: Anslut era FTP-autentiseringsuppgifter.
  3. Öppna HTTP-noderna Web Task Request, Output Service Call och Webhook Task Call. Credential Required: Anslut era HTTP Request-autentiseringsuppgifter om era endpoints kräver auth.
  4. Öppna Store Video Output. Credential Required: Anslut era Google Drive-autentiseringsuppgifter.

Det här arbetsflödet har många SSH- och FTP-noder. Konfigurera autentiseringsuppgifter en gång och återanvänd dem i alla relaterade noder för att undvika inkonsekvenser.

Steg 3: Sätt upp intake och förbearbetning

Två formulärtriggers fångar upp uppladdningar och uppdateringar och förbereder samt överför sedan data för bearbetning.

  1. Öppna Incoming Upload Form och Incoming Update Form för att konfigurera era formulärfält och beteendet vid inskickning.
  2. Konfigurera Prepare Form Values för att mappa eller normalisera inkommande fält för uppladdningsflödet.
  3. Bekräfta att uppdateringsflödet kör Sanitize Update Data före Upload Update Assets och Compose Update Data.
  4. Verifiera intake-vägen: Incoming Upload FormPrepare Form ValuesTransfer Upload FilesExtract ArchiveSync Data AssetsWeb Task RequestWorkflow Script.

⚠️ Vanlig fallgrop: Om formulären lämnas i testläge triggar inte produktionsinskickningar arbetsflödet. Se till att publicera båda formulärtriggers.

Steg 4: Konfigurera bearbetning och AI-formatering

Huvudflödet för bearbetning mellanlagrar filer, formaterar innehåll med AI och renderar mallar innan det förgrenas till parallella utdata.

  1. Säkerställ att bearbetningskedjan följer: Combine StreamsStage Data FilesAI Formatting StepRender Template.
  2. Öppna AI Formatting Step. Credential Required: Anslut era OpenAI-autentiseringsuppgifter.
  3. Granska Render Template, Compile Variants och Build Composition för att bekräfta att kodlogiken stämmer med ert dataschema.
  4. Render Template skickar utdata parallellt till både Merge Render Outputs och Output Service Call.
  5. Workflow Script skickar utdata parallellt till både Execute Finalize och Combine Streams.

Om utdata från AI-formateringen är inkonsekvent, lägg till loggning i Render Template och Compile Variants för att inspektera genererad data.

Steg 5: Konfigurera mediabygge, leverans och uppdateringar

Kompositioner skickas för att bygga mediaresurser, medan uppdateringsinskickningar följer sin egen synkroniserings- och svarsväg.

  1. Bekräfta kompositionskedjan: Merge Render OutputsBuild CompositionSend Composition FilesTrigger Media BuildDeliver Video FilesStore Video OutputCleanup Temp Files.
  2. Säkerställ att varianter går via Output Service CallCompile VariantsTransfer Variant FilesMerge Render Outputs.
  3. Validera uppdateringsflödet: Incoming Update FormSanitize Update DataUpload Update AssetsCompose Update DataMerge Update AssetsExtract Update ArchiveSync Update AssetsWebhook Task CallPrepare ResponseSend Upload SummaryApply Server Settings.
  4. Bekräfta sekundär leveransväg: Deliver Alt VideoStore Video Output.

⚠️ Vanlig fallgrop: Säkerställ att Store Video Output pekar på en giltig Google Drive-mapp, annars misslyckas sparandet även om överföringarna lyckas.

Steg 6: Testa och aktivera ert arbetsflöde

Kör varje trigger manuellt för att bekräfta end-to-end-bearbetning innan ni aktiverar produktionsanvändning.

  1. Klicka på Execute Workflow i Start Folder Setup för att verifiera att mappar skapas via Remote Init CommandCreate Media FolderCreate Session Folder.
  2. Skicka in en testpayload till Incoming Upload Form och bekräfta att kedjan når Store Video Output och Cleanup Temp Files.
  3. Skicka in en testpayload till Incoming Update Form och bekräfta att kedjan når Apply Server Settings.
  4. En lyckad körning ska visa att filer mellanlagras, renderas, levereras och lagras utan nodfel.
  5. När ni är redo, växla arbetsflödet till Active så att formulärinskickningar och fjärruppgifter körs i produktion.
🔒

Lås upp fullständig steg-för-steg-guide

Få den kompletta implementeringsguiden + nedladdningsbar mall

Vanliga fallgropar

  • Google Drive-credentials kan gå ut eller kräva specifika behörigheter. Om det skapar fel, kontrollera först inställningarna för credentials i n8n och Drive-kontots delnings-/åtkomstregler.
  • Om du använder Wait-noder eller extern rendering varierar processtiderna. Öka väntetiden om nedströmsnoder fallerar på tomma svar.
  • Standardprompter i AI-noder är generiska. Lägg in er tonalitet och era riktlinjer tidigt, annars kommer du att redigera leveranserna för alltid.

Vanliga frågor

Hur lång tid tar det att sätta upp den här OpenAI-videoautomationen?

Cirka 45 minuter om din server och dina konton är klara.

Behöver jag kunna koda för att automatisera OpenAI-videoautomation?

Nej. Du kopplar mest ihop konton och justerar några formulärfält och inställningar.

Är n8n gratis att använda för det här arbetsflödet för OpenAI-videoautomation?

Ja. n8n har ett gratis alternativ för egen drift och en gratis provperiod på n8n Cloud. Cloud-planer börjar på 20 USD/månad för högre volym. Du behöver också räkna med kostnader för OpenAI API (Whisper är cirka 0,006 USD/min, plus Speech-användning för berättarröster).

Var kan jag hosta n8n för att köra den här automatiseringen?

Två alternativ: n8n Cloud (hanterat, enklast att komma igång) eller egen drift på en VPS. För egen drift är Hostinger VPS prisvärd och klarar n8n bra. Egen drift ger obegränsade körningar men kräver grundläggande serverhantering.

Kan jag anpassa det här arbetsflödet för OpenAI-videoautomation för olika undertextstilar och språk?

Ja, och det är en av de bästa anledningarna att använda den här mallen. Du kan ändra undertextstyling i steget “Apply Subtitle” (typsnitt, marginaler, bakgrund), och du kan lägga till språk genom att utöka språklistan i uppladdningsformuläret. För berättarröster byter du röst i OpenAI Speech-noden genom att ändra vald röst. Om du vill ersätta Drive med Slack eller Dropbox byter du sista lagrings-/leveranssteget men behåller samma renderpipeline.

Varför misslyckas min Google Drive-anslutning i det här arbetsflödet?

Oftast beror det på credentials som har gått ut eller återkallats. Anslut Google Drive på nytt i n8n och bekräfta att Drive-kontot fortfarande har behörighet att ladda upp till målmappen. Om du använder en delad enhet, dubbelkolla att kontot som ligger i credentials har åtkomst till den (delade enheter kan vara petiga). Håll också koll på kvotproblem om du laddar upp många stora MP4:or under kort tid.

Hur många videor kan den här OpenAI-videoautomationen hantera?

Många, men det beror på dina exekveringsgränser och serverns kapacitet. På n8n Cloud beror din månatliga exekveringsgräns på planen, vilket påverkar hur många körningar du kan trigga. Om du kör egen drift finns ingen inbyggd exekveringsgräns, men FFmpeg-rendering och OpenAI-anrop blir en flaskhals för CPU, bandbredd och samtidighet. I praktiken börjar många team med några videor per dag och ökar parallell bearbetning när de ser stabila renderingstider. Om du planerar batchbearbetning av 50+ videor på en dag vill du ha en kraftigare VPS och vissa köregler så att jobben inte staplas på varandra.

Är den här OpenAI-videoautomationen bättre än att använda Zapier eller Make?

För det här användningsfallet, ja, eftersom den “svåra delen” är serverside mediearbete och flersteglogik, inte bara att flytta data mellan appar. n8n låter dig också köra egen drift, vilket är viktigt när du gör många körningar eller hanterar stora filer. Zapier/Make kan fungera för enkla triggers och notifieringar, men långkörande videokörningar tenderar att bli krångliga (och dyra) där. Den största fördelen är ärligt talat kontroll: FFmpeg, filstaging och anpassad bearbetning är förstaklass i ett arbetsflöde som det här. Prata med en automationsexpert om du vill ha hjälp att välja rätt upplägg.

När det här väl är igång blir din “redigering” en uppladdning och en granskning, inte ett veckovis produktionsslit. Arbetsflödet tar hand om de repetitiva delarna så att du kan fokusera på innehåll som faktiskt ger effekt.

Kontakta oss

Hör av dig, så diskuterar vi hur just din verksamhet kan dra nytta av alla fantastiska möjligheter som AI skapar.

×

Använd mall

Få direkt tillgång till denna n8n-arbetsflödes JSON-fil

Launch login modal Launch register modal