Du klistrar in en videolänk, intalar dig att du ska ”titta på den senare”, och sedan blir senare till aldrig. Under tiden växer ditt kalkylark med ”saker att granska”, dina anteckningar blir spretiga och du är tillbaka med att skumma timelines för att hitta den där enda sekunden du behövde.
Den här automatiseringen för Gemini Sheets-logging slår hårdast mot marknadsteam när de spårar konkurrentannonser, men content ops och byråägare känner av den också. Resultatet är enkelt: varje publik video-URL blir en tydlig, strukturerad beskrivning i Google Sheets utan att du behöver sitta igenom hela klippet.
Nedan ser du hur arbetsflödet förvandlar en URL till en Gemini-genererad ”videoDescription”, vad som förändras i vardagen och vad du behöver för att köra det stabilt.
Så fungerar den här automatiseringen
Se hur detta löser problemet:
n8n Workflow Template: Google Gemini till Google Sheets, videonoteringar klara
flowchart LR
subgraph sg0["When clicking ‘Test workflow’ Flow"]
direction LR
n0@{ icon: "mdi:cog", form: "rounded", label: "Wait", pos: "b", h: 48 }
n1["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/httprequest.dark.svg' width='40' height='40' /></div><br/>Download video"]
n2["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/httprequest.dark.svg' width='40' height='40' /></div><br/>Upload video Gemini"]
n3["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/httprequest.dark.svg' width='40' height='40' /></div><br/>Analyze video Gemini"]
n4@{ icon: "mdi:play-circle", form: "rounded", label: "When clicking ‘Test workflow’", pos: "b", h: 48 }
n5@{ icon: "mdi:swap-vertical", form: "rounded", label: "Set Input", pos: "b", h: 48 }
n6@{ icon: "mdi:swap-vertical", form: "rounded", label: "Get Result", pos: "b", h: 48 }
n0 --> n3
n5 --> n1
n1 --> n2
n2 --> n0
n3 --> n6
n4 --> n5
end
%% Styling
classDef trigger fill:#e8f5e9,stroke:#388e3c,stroke-width:2px
classDef ai fill:#e3f2fd,stroke:#1976d2,stroke-width:2px
classDef aiModel fill:#e8eaf6,stroke:#3f51b5,stroke-width:2px
classDef decision fill:#fff8e1,stroke:#f9a825,stroke-width:2px
classDef database fill:#fce4ec,stroke:#c2185b,stroke-width:2px
classDef api fill:#fff3e0,stroke:#e65100,stroke-width:2px
classDef code fill:#f3e5f5,stroke:#7b1fa2,stroke-width:2px
classDef disabled stroke-dasharray: 5 5,opacity: 0.5
class n4 trigger
class n1,n2,n3 api
classDef customIcon fill:none,stroke:none
class n1,n2,n3 customIcon
Utmaningen: förvandla videor till användbara anteckningar (utan att titta på allt)
Video finns överallt, men din tid gör det inte. Om du katalogiserar kampanjmaterial, granskar UGC-bidrag, loggar produktdemor eller gör grundläggande innehållsmoderering är den långsamma delen inte att ”hitta videon”. Det är att titta, spola tillbaka, anteckna och sedan försöka sammanfatta det viktiga på ett sätt som teamet faktiskt kan söka i senare. Och om du hoppar över anteckningarna betalar du två gånger: först genom förlorad kontext, och igen när någon frågar ”Vad är det i det här klippet?” och du måste öppna det på nytt och börja om.
Det blir mycket snabbt. Här är var det oftast faller isär.
- Att kopiera en URL till ett ark går snabbt, men att skriva en konsekvent beskrivning för dussintals videor gör det inte.
- Manuella anteckningar speglar ofta den som tittade, vilket gör att varumärkessignaler och nyckelögonblick missas eller beskrivs olika.
- ”Jag tittar senare” blir en backlogg, och backloggar gör granskningar tyngre för varje vecka.
- När du skannar efter material som är off-brand eller olämpligt är den mentala belastningen av att vara fullt uppmärksam påtaglig, och folk blir utbrända.
Lösningen: Gemini analyserar videon och Sheets lagrar anteckningarna
Det här arbetsflödet tar en publik video-URL, laddar ner filen, skickar den till Google Gemini 2.0 Flash för multimodal analys, väntar på bearbetning och hämtar sedan tillbaka en detaljerad skriftlig beskrivning. I stället för ”någon borde titta på det här” får du ett stabilt utdatafält (kallat videoDescription) som du kan klistra in, routa eller logga där ni spårar innehåll. I praktiken använder de flesta team Google Sheets som ett enkelt, delat system för källdata. En rad per video. Samma struktur varje gång. Och eftersom prompten är redigerbar kan du styra Gemini mot det du bryr dig om: varumärkeselement, ton, visuella handlingar, tillgänglighetsliknande beskrivningar eller modereringsflaggor.
Arbetsflödet startar när du kör det och anger video-URL:en samt din referens till Gemini API-nyckeln. Därefter hämtar det videofilen, laddar upp den till Gemini för bearbetning, pausar kort så att Gemini hinner klart och begär sedan den slutliga analysen. Du får en korrekt formaterad textbeskrivning som är redo att loggas i Google Sheets eller skickas vidare till nästa steg i din process.
Vad som förändras: före vs. efter
| Det här elimineras | Effekt du kommer att se |
|---|---|
|
|
Effekt i verkligheten
Säg att du granskar 20 publika videor i veckan för kampanjresearch. Manuellt tar även ”lätt” antecknande kanske 15 minuter per video när du räknar in att skumma efter nyckelögonblick, så det blir ungefär 5 timmar i veckan. Med det här arbetsflödet klistrar du in URL:en, låter Gemini bearbeta (du väntar, du jobbar inte) och loggar sedan beskrivningen i Google Sheets på en minut eller två. De flesta veckor får du tillbaka flera timmar, och anteckningarna blir mer konsekventa än mänskliga sammanfattningar.
Krav
- n8n-instans (prova n8n Cloud gratis)
- Alternativ för självhostning om du föredrar det (Hostinger fungerar bra)
- Google Gemini API för att generera videobeskrivningen.
- Google Sheets för att lagra och dela resultatet.
- Gemini API-nyckel (hämta den på ai.google.dev och sätt den sedan som GeminiKey).
Kunskapsnivå: Nybörjare. Du kopplar konton, sätter en miljövariabel för API-nyckeln och redigerar en URL och en prompt.
Behöver du hjälp att implementera detta? Prata med en automationsexpert (gratis 15-minuters konsultation).
Arbetsflödets flöde
Du anger en publik video-URL. Arbetsflödet är byggt för att starta från ett enkelt inmatningssteg (noden ”Define Input Values”), där du klistrar in URL:en och refererar till din miljövariabel GeminiKey.
Videon hämtas och förbereds. En HTTP Request laddar ner videofilen så att den kan skickas till Gemini. Här är tillgänglighet avgörande: om URL:en kräver inloggning eller är spärrad bakom behörigheter kan arbetsflödet inte hämta filen.
Gemini bearbetar videon. En annan HTTP Request laddar upp filen till Gemini, och sedan ger en Wait-nod Gemini tid att bli klar. Därefter anropar arbetsflödet Gemini igen för att köra prompten för ”visuell analys” som du styr.
Beskrivningen extraheras och loggas. Ett avslutande Set-steg plockar ut analysen till ett korrekt formaterat fält videoDescription, som du kan skriva in i Google Sheets (för spårning) eller slå ihop med annan metadata du samlar in.
Du kan enkelt justera analys-prompten för att fokusera på varumärke, tillgänglighet, modereringssignaler eller nyckelscener utifrån dina behov. Se hela implementeringsguiden nedan för anpassningsalternativ.
Steg-för-steg-guide för implementering
Steg 1: konfigurera den manuella triggern
Det här arbetsflödet startar med en manuell trigger så att ni kan köra tester vid behov medan ni konfigurerar indata och API-anrop.
- Lägg till noden Manual Run Trigger för att starta arbetsflödet manuellt under uppsättning och testning.
- Koppla Manual Run Trigger till Define Input Values för att skicka den initiala video-URL:en in i arbetsflödet.
Steg 2: anslut videokällan
Ange video-URL:en och hämta den faktiska mediefilen för uppladdning.
- I Define Input Values, lägg till ett strängfält med namnet video_url och ställ in värdet till
[YOUR_VIDEO_URL]. - I Fetch Video File, ställ in URL till
={{ $json.video_url }}för att ladda ned videon från den angivna länken. - Koppla Define Input Values till Fetch Video File så att URL:en är tillgänglig för nedladdningen.
Steg 3: sätt upp Geminis bearbetningspipeline
Ladda upp videon till Gemini, vänta på bearbetning och skicka analysförfrågan.
- I Send Video to Gemini, ställ in URL till
=https://generativelanguage.googleapis.com/upload/v1beta/files?key={{ $vars.GeminiKey }}och behåll Method som POST. - I Send Video to Gemini, aktivera Send Body, ställ in Content Type till binaryData, aktivera Send Headers och ställ in Input Data Field Name till
=data. - Bekräfta att headervärdena i Send Video to Gemini matchar: X-Goog-Upload-Command =
start, upload, finalize, X-Goog-Upload-Header-Content-Length =={{ $binary.data.fileSize }}, X-Goog-Upload-Header-Content-Type ==video/{{ $binary.data.fileExtension }}och Content-Type =video/mp4. - Koppla Fetch Video File till Send Video to Gemini och koppla sedan Send Video to Gemini till Pause for Processing.
- I Gemini Visual Analysis, ställ in URL till
=https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp:generateContent?key={{ $vars.GeminiKey }}och behåll Method som POST. - Ställ in JSON Body i Gemini Visual Analysis till
={ "contents": [ { "role": "user", "parts": [ { "fileData": { "fileUri": "{{ $json.file.uri }}", "mimeType": "{{ $json.file.mimeType }}" } }, { "text": "Describe in detail what is visually happening in the video, including key elements, actions, colors, and branding. Note the style, tone, and any notable creative techniques being used." } ] } ], "generationConfig": { "temperature": 1.4, "topK": 40, "topP": 0.95, "maxOutputTokens": 8192, "responseModalities": ["Text"] } }och säkerställ att Specify Body är inställt på json. - Koppla Pause for Processing till Gemini Visual Analysis för att begära beskrivningen efter uppladdningen.
⚠️ Vanlig fallgrop: Gemini API-nyckeln refereras via {{ $vars.GeminiKey }}. Se till att den här variabeln är inställd i er n8n-miljö innan ni testar.
Steg 4: konfigurera utdataformateringen
Extrahera den genererade beskrivningen till ett rent utdatafält.
- I Extract Analysis Output, lägg till ett strängfält med namnet videoDescription med värdet
={{ $json.candidates[0].content.parts[0].text }}. - Koppla Gemini Visual Analysis till Extract Analysis Output för att mata ut den slutliga analystexten.
Steg 5: testa och aktivera ert arbetsflöde
Kör ett fullständigt test för att bekräfta att videon laddas upp, analyseras och att texten extraheras korrekt.
- Klicka på Execute Workflow och verifiera att Fetch Video File laddar ned mediet och att Send Video to Gemini slutförs utan fel.
- Efter Pause for Processing, bekräfta att Gemini Visual Analysis returnerar ett svar med analystexten.
- Kontrollera Extract Analysis Output för fältet videoDescription för att bekräfta att beskrivningen fångas upp.
- När testet är lyckat, växla arbetsflödet till Active för användning i produktion.
Se upp för
- Google Gemini API-inloggningsuppgifter kan löpa ut eller ha fel scopes. Om saker slutar fungera, kontrollera först din miljövariabel GeminiKey och auth-headers i Gemini HTTP-noderna.
- Om du använder Wait-noder eller extern rendering varierar bearbetningstiderna. Öka väntetiden om efterföljande noder faller på tomma svar.
- Standardprompter i AI-noder är generiska. Lägg in er varumärkesröst tidigt, annars kommer du redigera utdata för alltid.
Vanliga frågor
Cirka 30 minuter om dina konton är redo.
Ja. Du skriver ingen kod, men du klistrar in en URL, lägger in en API-nyckel som miljövariabel och kopplar Google Sheets.
Ja. n8n har ett gratis alternativ för självhostning och en gratis provperiod på n8n Cloud. Cloud-planer börjar på 20 USD/månad för högre volym. Du behöver också räkna in användningen av Google Gemini API, som beror på hur många videor du bearbetar och deras storlek.
Två alternativ: n8n Cloud (hanterat, enklast uppsättning) eller självhostning på en VPS. För självhostning är Hostinger VPS prisvärd och hanterar n8n bra. Självhostning ger dig obegränsade körningar men kräver grundläggande serveradministration.
Redigera prompten i steget ”Gemini Visual Analysis” så att utdata matchar ditt use case. Team finjusterar ofta för tillgänglighetsliknande berättarröst, kontroller av varumärkesefterlevnad (logotyper, färger, ton) och extrahering av ”nyckelögonblick” för klipp- och redigeringsanteckningar. Om du vill ha fler kolumner i Google Sheets (som produktnamn, CTA eller riskflagga) lägger du till dem i den sista mappningen ”Extract Analysis Output” och skriver dem till ditt ark.
Oftast är det ett API-nyckelproblem: miljövariabeln GeminiKey är inte satt, den klistrades in med ett extra mellanslag, eller så refererar HTTP-noden faktiskt inte till den. En annan vanlig orsak är själva video-URL:en; om nedladdningssteget inte kan hämta filen (inloggning krävs, länken har gått ut, hosten är blockerad) får Gemini aldrig något. Rate limits kan också dyka upp när du kör en stor batch, så att sakta ner körningar eller lägga in en längre väntan kan stabilisera.
På n8n Cloud beror kapaciteten främst på din plans månatliga körningar, och varje videokörning räknas som en körning (med flera interna steg). Om du självhostar finns inget tak för körningar, men din server och Geminis bearbetningstid blir flaskhalsarna. Praktiskt är detta bekvämt för daglig katalogisering och granskningsköer; för tung batchbearbetning, räkna med längre väntetider och att du behöver takta anropen.
Ofta, ja, eftersom det här flödet kräver flerstegs-HTTP-anrop, filhantering och en väntan på bearbetning, vilket är där n8n förblir flexibelt. Zapier eller Make kan fungera, men du kan stöta på filstorleksgränser, premiumsteg eller krångliga workarounds för ”ladda upp, polla, extrahera”. Med n8n kan du självhosta, köra högre volym utan huvudvärk kring per-task-prissättning och anpassa Gemini-anropets upplägg när behoven förändras. Om din automatisering bara är ”URL in, en sammanfattning ut” kan ett enklare verktyg räcka. Prata med en automationsexpert om du vill ha hjälp att välja.
När det här väl rullar slutar ditt kalkylark vara en kyrkogård av länkar och börjar fungera som ett riktigt bibliotek. Arbetsflödet gör tittandet. Du tar besluten.
Kontakta oss
Hör av dig, så diskuterar vi hur just din verksamhet kan dra nytta av alla fantastiska möjligheter som AI skapar.