Du släpper in ett foto av en sida i en mapp … och sedan börjar det riktiga jobbet. Öppna bilden, kisa mot handskriven japanska, skriva om det som är viktigt och sedan försöka komma ihåg var du sparade anteckningarna senare.
Marknadsansvariga som samlar in eventanteckningar känner igen det här. Driftschefer som hanterar skannade rapporter också. Och ärligt talat fastnar lärare som digitaliserar tryckt material i samma loop. Den här automatiseringen för Drive OCR-sammanfattningar förvandlar nya bilder till en sökbar Google Sheets-logg med en AI-sammanfattning, automatiskt.
Nedan ser du exakt hur arbetsflödet körs, vad du får ut av det och vad du behöver för att sätta upp det utan att göra det till ett flera veckor långt ”någon gång”-projekt.
Så fungerar den här automatiseringen
Hela n8n-arbetsflödet, från trigger till slutresultat:
n8n Workflow Template: Google Drive till Google Sheets: OCR-sammanfattningar loggas
flowchart LR
subgraph sg0["Google Drive New File Flow"]
direction LR
n0@{ icon: "mdi:brain", form: "rounded", label: "OpenRouter Chat Model1", pos: "b", h: 48 }
n1@{ icon: "mdi:database", form: "rounded", label: "Append row in sheet1", pos: "b", h: 48 }
n2@{ icon: "mdi:play-circle", form: "rounded", label: "Google Drive New File Trigger1", pos: "b", h: 48 }
n3@{ icon: "mdi:cog", form: "rounded", label: "Download Image File1", pos: "b", h: 48 }
n4["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/httprequest.dark.svg' width='40' height='40' /></div><br/>Extract Text with OCR.space1"]
n5["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/code.svg' width='40' height='40' /></div><br/>Format OCR Result & Check fo.."]
n6@{ icon: "mdi:robot", form: "rounded", label: "Generate Summary with OpenRo..", pos: "b", h: 48 }
n7@{ icon: "mdi:message-outline", form: "rounded", label: "Send Completion Notification..", pos: "b", h: 48 }
n8@{ icon: "mdi:cog", form: "rounded", label: "Process Completed1", pos: "b", h: 48 }
n1 --> n7
n3 --> n4
n0 -.-> n6
n4 --> n5
n2 --> n3
n5 --> n6
n6 --> n1
n7 --> n8
end
%% Styling
classDef trigger fill:#e8f5e9,stroke:#388e3c,stroke-width:2px
classDef ai fill:#e3f2fd,stroke:#1976d2,stroke-width:2px
classDef aiModel fill:#e8eaf6,stroke:#3f51b5,stroke-width:2px
classDef decision fill:#fff8e1,stroke:#f9a825,stroke-width:2px
classDef database fill:#fce4ec,stroke:#c2185b,stroke-width:2px
classDef api fill:#fff3e0,stroke:#e65100,stroke-width:2px
classDef code fill:#f3e5f5,stroke:#7b1fa2,stroke-width:2px
classDef disabled stroke-dasharray: 5 5,opacity: 0.5
class n2 trigger
class n6 ai
class n0 aiModel
class n1 database
class n4 api
class n5 code
classDef customIcon fill:none,stroke:none
class n4,n5 customIcon
Problemet: bilder blir ”mörk data”
Foton och skanningar samlas på hög snabbare än någon vill erkänna. En mobilbild av handskrivna mötesanteckningar. Ett skannat japanskt dokument från en leverantör. En boksida du lovade att du skulle ”sammanfatta senare”. Sedan försvinner den in i Google Drive som en fil utan namn, vilket betyder att informationen tekniskt sett är lagrad men i praktiken borttappad. När du väl behöver den letar du i mappar, öppnar bilder igen och skriver om nyckelrader i ett dokument eller kalkylark. Det går långsamt, det är felkänsligt och det stjäl i tysthet fokus från arbete som faktiskt driver saker framåt.
Friktionen byggs på. Här är var det oftast faller isär.
- Varje bild tar cirka 10 minuter att läsa, kopiera och lagra på ”rätt” ställe.
- Japansk text ger extra tröghet, eftersom OCR är inkonsekvent och omskrivning är brutalt.
- Viktigt sammanhang går förlorat när du bara sparar råbilden utan en sammanfattning.
- Ingen central logg betyder att du inte kan få överblick över vad som har bearbetats, vad som saknas eller vad som kräver uppföljning.
Lösningen: Google Drive → OCR → AI-sammanfattning → Google Sheets
Det här arbetsflödet bevakar en specifik Google Drive-mapp efter nya bilduppladdningar. När en ny fil dyker upp laddar det ner bilden och skickar den till OCR.space (en OCR-tjänst som stödjer japanska) för att extrahera texten. Därefter städar det upp OCR-resultatet och kontrollerar att det faktiskt finns något användbart där, så att du inte råkar logga tomma rader. Sedan skapar en AI-agent en kort sammanfattning av det extraherade innehållet med en OpenRouter-chatmodell. Till sist lägger n8n till en ny rad i Google Sheets med filnamn, sammanfattning och datum, och skickar en Gmail-notis så att du vet att allt är klart (och kan klicka vidare till arket vid behov).
Arbetsflödet startar med en trigger för ny fil i Google Drive. OCR extraherar den japanska texten, och sedan komprimerar AI den till något du kan ögna igenom på några sekunder. Google Sheets blir det sökbara arkivet, och Gmail stänger loopen med ett enkelt ”bearbetad”-meddelande.
Vad du får: automatisering kontra resultat
| Vad det här arbetsflödet automatiserar | Resultat du får |
|---|---|
|
|
Exempel: så här ser det ut
Säg att du laddar upp 20 bilder i veckan till Drive (mötesanteckningar, boksidor, skannade PM). Manuellt, om varje tar cirka 10 minuter att öppna, läsa, skriva och arkivera i ett kalkylark, blir det runt 3 timmar rutinjobb. Med det här arbetsflödet är ditt ”jobb” bara att släppa bilder i den bevakade mappen, vilket kanske tar 2 minuter totalt. OCR + sammanfattning kör i bakgrunden, sedan uppdateras ditt ark och du får ett mejl när det är klart. Det är timmar tillbaka, varje vecka.
Det här behöver du
- n8n-instans (testa n8n Cloud gratis)
- Alternativ för self-hosting om du föredrar det (Hostinger fungerar bra)
- Google Drive för att bevaka en mapp efter nya bilder
- Google Sheets för att lagra sammanfattningar och filnamn
- Gmail för att skicka klart-notiser
- OCR.space API-nyckel (hämta den i din OCR.space-dashboard)
- OpenRouter API-nyckel (skapa en i ditt OpenRouter-konto)
Kunskapsnivå: Medel. Du klistrar in API-nycklar, kopplar Google-inloggningar och byter ut ett mapp-ID och ett Google Sheet-ID.
Vill du inte sätta upp det här själv? Prata med en automationsexpert (gratis 15-minuters konsultation).
Så fungerar det
En ny bild hamnar i din Drive-mapp. Arbetsflödet använder en Google Drive-trigger för att upptäcka nya filer i en specifik mapp, så att du inte skannar hela din Drive och hoppas att inget missas.
Filen hämtas för bearbetning. n8n laddar ner bildinnehållet så att det kan skickas till OCR.space som en binär fil, vilket OCR-tjänster normalt förväntar sig.
OCR extraherar japansk text, och sedan rensas den upp. HTTP-förfrågan skickar bilden till OCR.space och får tillbaka extraherad text. Ett litet rensningssteg validerar resultatet och tar bort uppenbart skräp, så att nästa steg inte sammanfattar skräpdata.
AI sammanfattar och allt loggas. En AI-agent kopplad till en OpenRouter-chatmodell skapar en kort sammanfattning, och sedan får Google Sheets en ny rad med filnamn, sammanfattning och bearbetningsdatum. Gmail skickar en klart-notis så att du vet att det är redo.
Du kan enkelt ändra sammanfattningsstilen till mer ”punktlista med action items” eller mer ”abstract i ett stycke” beroende på behov. Se hela implementationsguiden nedan för anpassningsalternativ.
Steg-för-steg-guide för implementering
Steg 1: konfigurera Drive-triggern
Konfigurera arbetsflödet så att det startar varje gång en ny bild läggs till i er Google Drive-mapp.
- Lägg till noden Drive File Intake Trigger.
- Ställ in Event på
fileCreated. - Ställ in Trigger On på
specificFolder. - Välj mappen i Folder to Watch och ställ in den på
[YOUR_ID]. - Autentiseringsuppgifter krävs: Anslut era Google Drive-autentiseringsuppgifter.
Steg 2: anslut Google Drive och extrahera OCR-text
Ladda ned bildfilen och skicka den till OCR-API:t för textextrahering.
- Lägg till Fetch Image File och anslut den efter Drive File Intake Trigger.
- Ställ in Operation på
download. - Ställ in File ID på
={{ $json.id }}. - Ställ in Binary Property Name på
data. - Autentiseringsuppgifter krävs: Anslut era Google Drive-autentiseringsuppgifter.
- Lägg till OCR Text Extraction efter Fetch Image File.
- Ställ in URL på
https://api.ocr.space/parse/imageoch Method påPOST. - Aktivera Send Body och ställ in Content Type på
multipart-form-data. - Konfigurera body-parametrar: apikey
[CONFIGURE_YOUR_API_KEY], languagejpn, isOverlayRequiredfalse, och file som binär med Input Data Field Namedata.
⚠️ Vanlig fallgrop: OCR-API-nyckeln krävs. Ersätt [CONFIGURE_YOUR_API_KEY] med en giltig nyckel, annars kommer anropet att misslyckas.
Steg 3: rensa OCR-resultatet och konfigurera AI-sammanfattning
Normalisera OCR-resultatets text och skapa en kort sammanfattning med hjälp av AI-agenten.
- Lägg till Clean OCR Output efter OCR Text Extraction.
- Klistra in JavaScript-koden i JS Code exakt som den är angiven för att normalisera blanksteg och fånga filnamnet.
- Lägg till AI Summary Generator och anslut den efter Clean OCR Output.
- Ställ in Prompt Type på
define. - Ställ in Text på
=以下の文章を簡潔に要約してください: {{ $if( $('Clean OCR Output').first()?.json?.extractedText, $('Clean OCR Output').first().json.extractedText, "(テキストが見つかりませんでした)" ) }}. - Säkerställ att OpenRouter Chat Engine är ansluten som språkmodell för AI Summary Generator.
- Autentiseringsuppgifter krävs: Anslut era
openRouterApi-autentiseringsuppgifter i OpenRouter Chat Engine (AI-verktygets autentiseringsuppgifter ställs in på den överordnade modellnoden, inte på agenten).
Tips: Om OCR returnerar tom text kommer agenten automatiskt att använda reservmeddelandet som är angivet i uttrycket.
Steg 4: logga resultat till Google Sheets och skicka e-post
Lägg till sammanfattningen i ett Google Sheet och avisera via Gmail.
- Lägg till Append Sheet Record efter AI Summary Generator.
- Ställ in Operation på
append. - Ställ in Document ID på
[YOUR_ID]och Sheet Name pågid=0(cachat namn:要約). - Mappa kolumner: 処理日 till
={{ $now.toISO().split('T')[0] }}, 要約結果 till={{ $('AI Summary Generator').first().json.output }}, och ファイル名 till={{ $('Clean OCR Output').first().json.fileName }}. - Autentiseringsuppgifter krävs: Anslut era Google Sheets-autentiseringsuppgifter.
- Lägg till Send Gmail Notice efter Append Sheet Record.
- Ställ in Send To på
[YOUR_EMAIL]. - Ställ in Subject på
=OCR処理完了: {{ $('Clean OCR Output').first().json.fileName }}. - Ställ in Message på
=画像ファイル「{{ $('Clean OCR Output').first().json.fileName }}」のOCR処理が完了しました。 【要約】 {{ $('AI Summary Generator').first().json.message.content }} 【Google Docs】 新規ドキュメントを作成しました。 ドキュメントID: {{ $('Google Docs へ要約を追記').first().json.documentId }}. - Autentiseringsuppgifter krävs: Anslut era Gmail-autentiseringsuppgifter.
- Lägg till Completion Marker efter Send Gmail Notice för att avsluta flödet.
⚠️ Vanlig fallgrop: E-postmeddelandet refererar till Google Docs へ要約を追記, men den noden finns inte i detta arbetsflöde. Ta bort eller ersätt det uttrycket för att undvika körningsfel.
Steg 5: testa och aktivera ert arbetsflöde
Verifiera hela flödet innan ni slår på det för användning i produktion.
- Klicka på Execute Workflow och ladda upp en ny bild i den övervakade Drive-mappen.
- Bekräfta att Fetch Image File laddar ned filen och att OCR Text Extraction returnerar tolkad text.
- Verifiera att Clean OCR Output matar ut
extractedTextochfileName, och att AI Summary Generator skapar en sammanfattning. - Kontrollera att Append Sheet Record lägger till en rad i kalkylarket och att Send Gmail Notice levererar e-postmeddelandet.
- När allt fungerar, växla arbetsflödet till Active för kontinuerlig bearbetning.
Vanliga fallgropar
- Google Drive-inloggningar kan löpa ut eller behöva specifika behörigheter. Om det slutar fungera, kontrollera först n8n:s sida för Credentials och bekräfta sedan att den bevakade mappen fortfarande är åtkomlig för det Google-kontot.
- Om du använder Wait-noder eller extern rendering varierar bearbetningstiderna. Öka väntetiden om nedströms-noder fallerar på tomma svar.
- Standardprompter i AI-noder är generiska. Lägg in er tonalitet tidigt, annars kommer du att redigera utdata för alltid.
Vanliga frågor
Cirka 30 minuter om du redan har dina API-nycklar.
Nej. Du kopplar konton och klistrar in ett par API-nycklar.
Ja. n8n har ett gratis self-hosted-alternativ och en gratis provperiod på n8n Cloud. Cloud-planer startar på 20 USD/månad för högre volym. Du behöver också räkna med användningskostnader för OCR.space och OpenRouter, som beror på hur många bilder du bearbetar.
Två alternativ: n8n Cloud (hanterat, enklast att komma igång) eller self-hosting på en VPS. För self-hosting är Hostinger VPS prisvärd och klarar n8n bra. Self-hosting ger dig obegränsade körningar men kräver grundläggande serveradministration.
Ja, men du gör det i AI-prompten. I steget AI Summary Generator (AI-agenten kopplad till OpenRouter-chatmodellen) ändrar du prompten så att den ber om en längre sammanfattning och anger utdata-språk (till exempel: ”Summarize in English in 5 bullet points”). Du kan också lägga till en ”confidence”-rad eller spara hela OCR-texten i en annan kolumn i arket om du vill ha råtext plus sammanfattning.
Oftast beror det på att Googles auktorisering i n8n:s credentials har gått ut eller ändrats. Anslut Google Drive-kontot på nytt och bekräfta sedan att mapp-ID:t fortfarande pekar på en mapp som kontot har åtkomst till. Om det fungerade tidigare och plötsligt slutade, kontrollera också om mappen flyttades, bytte namn eller om någon annan stramade åt behörigheterna.
På n8n Cloud Starter kan du vanligtvis köra några tusen exekveringar per månad, och varje bild är normalt en exekvering.
Ofta ja, eftersom det här arbetsflödet behöver några ”mellansteg” (ladda ner den binära filen, rensa OCR-resultat och sedan skicka det vidare till en AI-agent) som blir klumpiga i enklare verktyg. n8n ger dig också ett self-host-alternativ, vilket betyder att du inte betalar mer varje gång volymen ökar. Zapier och Make kan fortfarande fungera om ditt flöde är väldigt enkelt, men OCR + AI + loggning tenderar att bli dyrt eller skört där. Om du är osäker: titta på hur många bilder du bearbetar per vecka och hur strikt utdataformat du behöver. Prata med en automationsexpert så får du en rak rekommendation.
När det här väl rullar slutar Drive vara en dumpningsplats och börjar fungera som ett inflödessystem. Arbetsflödet tar hand om det repetitiva, och du får ett strukturerat ark du faktiskt kan använda.
Kontakta oss
Hör av dig, så diskuterar vi hur just din verksamhet kan dra nytta av alla fantastiska möjligheter som AI skapar.