Du tar en YouTube-länk, och sedan börjar det riktiga jobbet. Hitta en transkribering, städa upp den, sammanfatta den, översätta den, klistra in den i ett dokument och hoppas att du inte missade den enda nyckelpunkten som din målgrupp faktiskt brydde sig om.
Marknadschefer känner av det här när innehållskalendern blir tajt. En grundare som försöker hålla sig synlig känner det också. Och om du jobbar med kunder vet du att frågan “kan vi få det här på spanska till i morgon?” dyker upp vid sämsta möjliga tillfälle. Den här YouTube-sammanfattningsautomationen gör en video-URL till en delbar Google Docs-sammanfattning, på det språk du väljer.
Nedan ser du hur arbetsflödet körs från start till mål, vad det ersätter och vilka resultat du kan förvänta dig när det väl är på plats.
Så här fungerar automationen
Hela n8n-flödet, från trigger till slutresultat:
n8n Workflow Template: YouTube till Google Docs – delbara sammanfattningar klara
flowchart LR
subgraph sg0["On form submission Flow"]
direction LR
n0["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/form.svg' width='40' height='40' /></div><br/>On form submission"]
n1@{ icon: "mdi:brain", form: "rounded", label: "Google Gemini Chat Model", pos: "b", h: 48 }
n2@{ icon: "mdi:cog", form: "rounded", label: "Google Docs", pos: "b", h: 48 }
n3@{ icon: "mdi:swap-vertical", form: "rounded", label: "Mapper", pos: "b", h: 48 }
n4["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/code.svg' width='40' height='40' /></div><br/>Formator"]
n5["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/code.svg' width='40' height='40' /></div><br/>Optimizer"]
n6@{ icon: "mdi:robot", form: "rounded", label: "AI Agent1", pos: "b", h: 48 }
n7["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/httprequest.dark.svg' width='40' height='40' /></div><br/>YouTube Transcript AI"]
n3 --> n7
n4 --> n6
n6 --> n5
n5 --> n2
n0 --> n3
n7 --> n4
n1 -.-> n6
end
%% Styling
classDef trigger fill:#e8f5e9,stroke:#388e3c,stroke-width:2px
classDef ai fill:#e3f2fd,stroke:#1976d2,stroke-width:2px
classDef aiModel fill:#e8eaf6,stroke:#3f51b5,stroke-width:2px
classDef decision fill:#fff8e1,stroke:#f9a825,stroke-width:2px
classDef database fill:#fce4ec,stroke:#c2185b,stroke-width:2px
classDef api fill:#fff3e0,stroke:#e65100,stroke-width:2px
classDef code fill:#f3e5f5,stroke:#7b1fa2,stroke-width:2px
classDef disabled stroke-dasharray: 5 5,opacity: 0.5
class n0 trigger
class n6 ai
class n1 aiModel
class n7 api
class n4,n5 code
classDef customIcon fill:none,stroke:none
class n0,n4,n5,n7 customIcon
Problemet: att göra sammanfattningar av videor är märkligt manuellt
Att sammanfatta en YouTube-video låter enkelt tills du gör det mer än två gånger. Du letar efter en transkribering (eller kopierar undertexter), inser att den är stökig, fixar tidsstämplar och märkliga radbrytningar och skriver sedan om allt till något läsbart. Sedan kommer formateringen för återanvändning: ett korrekt formaterat dokument som någon kan skumma, plocka citat ur och göra inlägg av. Behöver du flerspråkiga versioner blir det ytterligare ett varv med kopiering, översättning och kontroll av ton. Ärligt talat är friktionen inte en enda stor uppgift. Det är högen av småsaker som hela tiden stjäl dina bästa kreativa timmar.
Det blir snabbt mycket. Här är var det oftast fallerar i riktiga team.
- Du lägger ofta runt 30 minuter per video bara på att få fram en “användbar” transkribering och sammanfattning.
- Sammanfattningar varierar i kvalitet eftersom alla skriver på sitt sätt, så ditt återanvända innehåll känns inkonsekvent.
- Språkönskemål blir sista-minuten-bränder, eftersom översättning och omskrivning fortfarande kräver mänsklig insats.
- Även när du är klar hamnar resultatet på slumpmässiga ställen, vilket gör det svårt att dela eller bygga en repeterbar process.
Lösningen: YouTube-transkribering → AI-sammanfattning → Google Docs
Det här arbetsflödet ger dig en strukturerad, repeterbar väg från “här är en videolänk” till “här är en sammanfattning jag kan dela”. Det börjar med ett enkelt formulär (ditt team klistrar in en YouTube-URL och väljer utdata-språk). n8n hämtar sedan transkriberingen via YouTube Transcript API på RapidAPI, så du slipper kopiera undertexter manuellt. Därefter formaterar det transkriberingen till något som AI:n kan jobba med (även när transkriberingen inte är perfekt). Sedan genererar en AI-agent, driven av en chattmodell, en kort sammanfattning på det språk du valt. Till sist lägger flödet in den färdiga sammanfattningen i ett fördefinierat Google Docs-dokument, så att den direkt är redigerbar, delbar och redo att återanvändas.
Arbetsflödet startar när du skickar in YouTube-länken i intagsformuläret. Det hämtar och rensar transkriberingen, och sedan skapar AI-agenten sammanfattningen med den språkinstruktion du angav. Slutresultatet sparas direkt i Google Docs, vilket innebär att din “single source of truth” redan är organiserad.
Det här får du: automation vs. resultat
| Vad det här arbetsflödet automatiserar | Resultat du får |
|---|---|
|
|
Exempel: så här ser det ut i praktiken
Säg att du sammanfattar 5 YouTube-videor varje vecka för ett nyhetsbrev och sociala inlägg. Manuellt kan du lägga cirka 30 minuter per video på att hantera transkribering, skriva och formatera, vilket blir ungefär 2,5 timmar i veckan. Med det här flödet tar det kanske 2 minuter att skicka in URL och språk, sedan väntar du på bearbetningen och Google Docs uppdateras automatiskt. Du granskar och justerar fortfarande, men du börjar från ett korrekt formaterat utkast i stället för ett blankt dokument.
Det här behöver du
- n8n-instans (testa n8n Cloud gratis)
- Alternativ för egen hosting om du föredrar det (Hostinger fungerar bra)
- RapidAPI för åtkomst till YouTube Transcript API.
- Google Docs för att lagra och dela sammanfattningar.
- Google Gemini API-nyckel (hämta den från Google AI Studio / Google Cloud Console).
Kunskapsnivå: Medel. Du kopplar konton, lägger in API-nycklar och testar med några riktiga videolänkar.
Vill du inte sätta upp det här själv? Prata med en automationsexpert (gratis 15-minuters konsultation).
Så fungerar det
Ett formulärutskick drar i gång allt. Du klistrar in en YouTube-URL och anger vilket språk du vill att sammanfattningen ska skrivas på. Det gör att förfrågningar blir konsekventa i teamet, även om flera personer använder samma flöde.
Transkriberingen hämtas automatiskt. n8n skickar en HTTP-förfrågan till YouTube Transcript API (via RapidAPI) och får tillbaka transkriptdata. Inget hoppande mellan verktyg, ingen manuell kopiering.
Texten rensas och förbereds för sammanfattning. Ett formateringssteg omformar transkriberingen så att AI-agenten får färre störmoment, som trasiga rader eller udda avgränsare. Sedan använder sammanfattningsagenten chattmodellen (Gemini i det här flödet) för att skapa en kort version på det begärda språket.
Sammanfattningen sparas där du faktiskt använder den. Arbetsflödet uppdaterar ett fördefinierat Google Docs-dokument med den slutliga sammanfattningen, så att den direkt kan delas och är enkel att redigera. Om du vill ha spårbarhet kan du även logga varje körning i Google Sheets eller meddela någon via e-post.
Du kan enkelt justera sammanfattningsformatet så att det matchar er tonalitet, eller byta måldokument baserat på kampanj, kund eller språk. Se hela implementationsguiden nedan för alternativ för anpassning.
Steg-för-steg-guide för implementering
Steg 1: konfigurera formulärtriggern
Skapa formuläret som samlar in YouTube-URL och språkval från användare.
- Lägg till och öppna Form Intake Trigger.
- Ställ in Form Title till
summarize youtube videos from transcript for social media. - Under Form Fields, lägg till videoUrl med platshållaren
full video urloch markera fältet som obligatoriskt. - Lägg till language med platshållaren
Englishoch markera fältet som obligatoriskt. - Koppla Form Intake Trigger till Map Input Fields.
Steg 2: koppla anropet till transcript-API:t
Mappa formulärfälten och anropa transcript-API:t för att hämta rå transkriptdata.
- Öppna Map Input Fields och bekräfta tilldelningarna: videoUrl satt till
{{ $json.videoUrl }}och language satt till{{ $json.language }}. - Öppna Transcript API Request och ställ in URL till
https://youtube-transcriptor-pro.p.rapidapi.com/yt/index.php. - Ställ in Method till
POST, aktivera Send Body och ställ in Content Type tillmultipart-form-data. - Under Body Parameters, ställ in name till
=videoUrloch value till{{ $json.videoUrl }}. - Under Header Parameters, ställ in x-rapidapi-host till
youtube-transcriptor-pro.p.rapidapi.comoch lägg till er API-nyckel i x-rapidapi-key. - Koppla Map Input Fields till Transcript API Request.
Steg 3: konfigurera transkriptbearbetning och AI-sammanfattning
Formatera transkripttexten, skicka den till AI-modellen och extrahera sammanfattningsdelen.
- Öppna Transcript Formatter och behåll den medföljande JavaScript-koden som parsar, avkodar och outputtar chatInput.
- Öppna Summarization Agent och bekräfta att System Message använder
{{ $('Map Input Fields').item.json.language }}för att tvinga språkspecifik output. - Öppna Gemini Chat Model och ställ in Model Name till
models/gemini-2.0-flash. - Credential Required: Anslut era googlePalmApi-uppgifter i Gemini Chat Model.
- Säkerställ att Gemini Chat Model är kopplad som språkmodell för Summarization Agent (uppgifter ska läggas till i Gemini Chat Model, inte i agenten).
- Öppna Summary Extractor och behåll JavaScript-koden som extraherar sektionen
🎬 **Summary**till summary. - Koppla Transcript API Request → Transcript Formatter → Summarization Agent → Summary Extractor.
Steg 4: konfigurera uppdateringen i Google Docs
Infoga den extraherade sammanfattningen i ett Google-dokument.
- Öppna Update Docs Record och ställ in Operation till
update. - Ställ in Authentication till
serviceAccount. - Ställ in Document URL till ert mål-Google-dokument.
- I Action Fields, ställ in Text till
{{ $json.summary }}och Action tillinsert. - Credential Required: Anslut era googleApi-uppgifter i Update Docs Record.
- Koppla Summary Extractor till Update Docs Record.
Steg 5: testa och aktivera ert arbetsflöde
Validera varje steg och slå sedan på arbetsflödet för produktionsanvändning.
- Klicka på Execute Workflow och skicka in formuläret i Form Intake Trigger med en giltig YouTube-URL och ett språk.
- Kontrollera att Transcript API Request returnerar transkriptdata och att Transcript Formatter outputtar chatInput.
- Bekräfta att Summarization Agent producerar ett formaterat svar och att Summary Extractor outputtar ett summary-värde.
- Verifiera att Update Docs Record infogar sammanfattningen i ert Google-dokument.
- Växla arbetsflödet till Active för att aktivera inskick av formulär i drift.
Vanliga fallgropar
- RapidAPI-uppgifter kan gå ut eller så kan din plan blockera vissa endpoints. Om hämtning av transkribering misslyckas, kontrollera först loggarna i RapidAPI-dashboarden och prenumerationsstatus.
- Om du använder Wait-noder eller extern rendering varierar bearbetningstiderna. Öka väntetiden om noder längre ned i flödet fallerar på tomma svar.
- Standardprompter i AI-noder är generiska. Lägg in er tonalitet tidigt, annars kommer du att redigera outputen för alltid.
Vanliga frågor
Cirka 30 minuter om dina API:er och ditt Google-konto är redo.
Nej. Du kopplar främst konton och klistrar in API-nycklar. Det ingår lite testning, men du blir guidad.
Ja. n8n har ett gratisalternativ för egen hosting och en gratis provperiod på n8n Cloud. Cloud-planer börjar på 20 USD/månad för högre volym. Du behöver också räkna in användningsavgifter för RapidAPI och dina Gemini API-kostnader, som beror på hur många videor du bearbetar.
Två alternativ: n8n Cloud (hanterat, enklast att komma igång) eller egen hosting på en VPS. För egen hosting är Hostinger VPS prisvärd och hanterar n8n bra. Egen hosting ger dig obegränsade körningar men kräver grundläggande serverhantering.
Ja, men då vill du göra måldokumentet dynamiskt. I praktiken lägger du till ett “kund”-fält i formuläret och routar till olika Google Docs i steget “Update Docs Record” baserat på det värdet. Vanliga anpassningar är att ändra sammanfattningslängd, lägga till punktlistor för sociala krokar och spara en kopia i en daterad mappstruktur.
Oftast beror det på en saknad eller utgången RapidAPI-nyckel, eller att förfrågan slår i en planbegränsning. Öppna HTTP Request-noden, bekräfta att headervärdet är korrekt och kontrollera sedan din RapidAPI-dashboard för fel och kvot. Om videon har transkribering avstängd eller om språkspåret inte finns kan API:t också returnera tom data, vilket ser ut som ett “fel” längre ned i flödet.
Många, så länge dina API-kvoter hänger med.
Ofta, ja, eftersom det här flödet gynnas av lite mer kontroll. n8n gör det enklare att formatera transkriberingar, köra ett AI-agentsteg och hantera udda fall som saknade transkriptbitar utan att betala straff för “per steg”. Egen hosting är också viktigt om du bearbetar många videor, eftersom du inte blir lika låst av task-prissättning. Zapier eller Make kan fortfarande fungera för väldigt enkla flöden, men det här brukar växa när team börjar lägga till dokumentrouting, godkännanden och loggning. Om du vill ha en second opinion, prata med en automationsexpert.
När det här väl rullar blir det en rutinuppgift att göra en YouTube-länk till en delbar, flerspråkig sammanfattning, inte ett miniprojekt. Arbetsflödet tar hand om de repeterbara delarna så att du kan lägga tid på att finslipa budskapet och publicera.
Kontakta oss
Hör av dig, så diskuterar vi hur just din verksamhet kan dra nytta av alla fantastiska möjligheter som AI skapar.