Google Drive till Google Sheets: OCR-sammanfattningar loggas

Du släpper in ett foto av en sida i en mapp … och sedan börjar det riktiga jobbet. Öppna bilden, kisa mot handskriven japanska, skriva om det som är viktigt och sedan försöka komma ihåg var du sparade anteckningarna senare.

Marknadsansvariga som samlar in eventanteckningar känner igen det här. Driftschefer som hanterar skannade rapporter också. Och ärligt talat fastnar lärare som digitaliserar tryckt material i samma loop. Den här automatiseringen för Drive OCR-sammanfattningar förvandlar nya bilder till en sökbar Google Sheets-logg med en AI-sammanfattning, automatiskt.

Nedan ser du exakt hur arbetsflödet körs, vad du får ut av det och vad du behöver för att sätta upp det utan att göra det till ett flera veckor långt ”någon gång”-projekt.

Så fungerar den här automatiseringen

Hela n8n-arbetsflödet, från trigger till slutresultat:

n8n Workflow Template: Google Drive till Google Sheets: OCR-sammanfattningar loggas

Click to explore

flowchart LR

    subgraph sg0["Google Drive New File Flow"]
        direction LR
        n0@{ icon: "mdi:brain", form: "rounded", label: "OpenRouter Chat Model1", pos: "b", h: 48 }
        n1@{ icon: "mdi:database", form: "rounded", label: "Append row in sheet1", pos: "b", h: 48 }
        n2@{ icon: "mdi:play-circle", form: "rounded", label: "Google Drive New File Trigger1", pos: "b", h: 48 }
        n3@{ icon: "mdi:cog", form: "rounded", label: "Download Image File1", pos: "b", h: 48 }
        n4["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/httprequest.dark.svg' width='40' height='40' /></div><br/>Extract Text with OCR.space1"]
        n5["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/code.svg' width='40' height='40' /></div><br/>Format OCR Result & Check fo.."]
        n6@{ icon: "mdi:robot", form: "rounded", label: "Generate Summary with OpenRo..", pos: "b", h: 48 }
        n7@{ icon: "mdi:message-outline", form: "rounded", label: "Send Completion Notification..", pos: "b", h: 48 }
        n8@{ icon: "mdi:cog", form: "rounded", label: "Process Completed1", pos: "b", h: 48 }
        n1 --> n7
        n3 --> n4
        n0 -.-> n6
        n4 --> n5
        n2 --> n3
        n5 --> n6
        n6 --> n1
        n7 --> n8
    end

    %% Styling
    classDef trigger fill:#e8f5e9,stroke:#388e3c,stroke-width:2px
    classDef ai fill:#e3f2fd,stroke:#1976d2,stroke-width:2px
    classDef aiModel fill:#e8eaf6,stroke:#3f51b5,stroke-width:2px
    classDef decision fill:#fff8e1,stroke:#f9a825,stroke-width:2px
    classDef database fill:#fce4ec,stroke:#c2185b,stroke-width:2px
    classDef api fill:#fff3e0,stroke:#e65100,stroke-width:2px
    classDef code fill:#f3e5f5,stroke:#7b1fa2,stroke-width:2px
    classDef disabled stroke-dasharray: 5 5,opacity: 0.5
    class n2 trigger
    class n6 ai
    class n0 aiModel
    class n1 database
    class n4 api
    class n5 code
    classDef customIcon fill:none,stroke:none
    class n4,n5 customIcon

Problemet: bilder blir ”mörk data”

Foton och skanningar samlas på hög snabbare än någon vill erkänna. En mobilbild av handskrivna mötesanteckningar. Ett skannat japanskt dokument från en leverantör. En boksida du lovade att du skulle ”sammanfatta senare”. Sedan försvinner den in i Google Drive som en fil utan namn, vilket betyder att informationen tekniskt sett är lagrad men i praktiken borttappad. När du väl behöver den letar du i mappar, öppnar bilder igen och skriver om nyckelrader i ett dokument eller kalkylark. Det går långsamt, det är felkänsligt och det stjäl i tysthet fokus från arbete som faktiskt driver saker framåt.

Friktionen byggs på. Här är var det oftast faller isär.

Varje bild tar cirka 10 minuter att läsa, kopiera och lagra på ”rätt” ställe.
Japansk text ger extra tröghet, eftersom OCR är inkonsekvent och omskrivning är brutalt.
Viktigt sammanhang går förlorat när du bara sparar råbilden utan en sammanfattning.
Ingen central logg betyder att du inte kan få överblick över vad som har bearbetats, vad som saknas eller vad som kräver uppföljning.

Lösningen: Google Drive → OCR → AI-sammanfattning → Google Sheets

Det här arbetsflödet bevakar en specifik Google Drive-mapp efter nya bilduppladdningar. När en ny fil dyker upp laddar det ner bilden och skickar den till OCR.space (en OCR-tjänst som stödjer japanska) för att extrahera texten. Därefter städar det upp OCR-resultatet och kontrollerar att det faktiskt finns något användbart där, så att du inte råkar logga tomma rader. Sedan skapar en AI-agent en kort sammanfattning av det extraherade innehållet med en OpenRouter-chatmodell. Till sist lägger n8n till en ny rad i Google Sheets med filnamn, sammanfattning och datum, och skickar en Gmail-notis så att du vet att allt är klart (och kan klicka vidare till arket vid behov).

Arbetsflödet startar med en trigger för ny fil i Google Drive. OCR extraherar den japanska texten, och sedan komprimerar AI den till något du kan ögna igenom på några sekunder. Google Sheets blir det sökbara arkivet, och Gmail stänger loopen med ett enkelt ”bearbetad”-meddelande.

Vad du får: automatisering kontra resultat

Vad det här arbetsflödet automatiserar

Resultat du får

Bevakar en Drive-mapp och reagerar automatiskt på nya bilduppladdningar.
Laddar ner filen och skickar den till OCR.space för extrahering av japansk text.
Rensar och validerar OCR-resultatet så att tomma resultat inte skräpar ner dina loggar.
Skapar en AI-sammanfattning via OpenRouter, lägger sedan till den i Google Sheets och mejlar dig via Gmail.

Förvandlar ”jag gör det senare”-bilder till en användbar logg på cirka 2 minuter av din tid.
Ett enda Google Sheet som du kan söka i, filtrera och dela med teamet.
Färre transkriptionsfel, eftersom OCR gör grovjobbet först.
Snabbare återblick, eftersom sammanfattningar gör att du kan skanna dussintals poster snabbt.
Mindre jagande, eftersom arbetsflödet mejlar dig när bearbetningen är klar.

Exempel: så här ser det ut

Säg att du laddar upp 20 bilder i veckan till Drive (mötesanteckningar, boksidor, skannade PM). Manuellt, om varje tar cirka 10 minuter att öppna, läsa, skriva och arkivera i ett kalkylark, blir det runt 3 timmar rutinjobb. Med det här arbetsflödet är ditt ”jobb” bara att släppa bilder i den bevakade mappen, vilket kanske tar 2 minuter totalt. OCR + sammanfattning kör i bakgrunden, sedan uppdateras ditt ark och du får ett mejl när det är klart. Det är timmar tillbaka, varje vecka.

Det här behöver du

n8n-instans (testa n8n Cloud gratis)
Alternativ för self-hosting om du föredrar det (Hostinger fungerar bra)
Google Drive för att bevaka en mapp efter nya bilder
Google Sheets för att lagra sammanfattningar och filnamn
Gmail för att skicka klart-notiser
OCR.space API-nyckel (hämta den i din OCR.space-dashboard)
OpenRouter API-nyckel (skapa en i ditt OpenRouter-konto)

Kunskapsnivå: Medel. Du klistrar in API-nycklar, kopplar Google-inloggningar och byter ut ett mapp-ID och ett Google Sheet-ID.

Vill du inte sätta upp det här själv? Prata med en automationsexpert (gratis 15-minuters konsultation).

Så fungerar det

En ny bild hamnar i din Drive-mapp. Arbetsflödet använder en Google Drive-trigger för att upptäcka nya filer i en specifik mapp, så att du inte skannar hela din Drive och hoppas att inget missas.

Filen hämtas för bearbetning. n8n laddar ner bildinnehållet så att det kan skickas till OCR.space som en binär fil, vilket OCR-tjänster normalt förväntar sig.

OCR extraherar japansk text, och sedan rensas den upp. HTTP-förfrågan skickar bilden till OCR.space och får tillbaka extraherad text. Ett litet rensningssteg validerar resultatet och tar bort uppenbart skräp, så att nästa steg inte sammanfattar skräpdata.

AI sammanfattar och allt loggas. En AI-agent kopplad till en OpenRouter-chatmodell skapar en kort sammanfattning, och sedan får Google Sheets en ny rad med filnamn, sammanfattning och bearbetningsdatum. Gmail skickar en klart-notis så att du vet att det är redo.

Du kan enkelt ändra sammanfattningsstilen till mer ”punktlista med action items” eller mer ”abstract i ett stycke” beroende på behov. Se hela implementationsguiden nedan för anpassningsalternativ.

Steg-för-steg-guide för implementering

Steg 1: konfigurera Drive-triggern

Konfigurera arbetsflödet så att det startar varje gång en ny bild läggs till i er Google Drive-mapp.

Lägg till noden Drive File Intake Trigger.
Ställ in Event på fileCreated.
Ställ in Trigger On på specificFolder.
Välj mappen i Folder to Watch och ställ in den på [YOUR_ID].
Autentiseringsuppgifter krävs: Anslut era Google Drive-autentiseringsuppgifter.

Steg 2: anslut Google Drive och extrahera OCR-text

Ladda ned bildfilen och skicka den till OCR-API:t för textextrahering.

Lägg till Fetch Image File och anslut den efter Drive File Intake Trigger.
Ställ in Operation på download.
Ställ in File ID på ={{ $json.id }}.
Ställ in Binary Property Name på data.
Autentiseringsuppgifter krävs: Anslut era Google Drive-autentiseringsuppgifter.
Lägg till OCR Text Extraction efter Fetch Image File.
Ställ in URL på https://api.ocr.space/parse/image och Method på POST.
Aktivera Send Body och ställ in Content Type på multipart-form-data.
Konfigurera body-parametrar: apikey [CONFIGURE_YOUR_API_KEY], language jpn, isOverlayRequired false, och file som binär med Input Data Field Name data.

⚠️ Vanlig fallgrop: OCR-API-nyckeln krävs. Ersätt [CONFIGURE_YOUR_API_KEY] med en giltig nyckel, annars kommer anropet att misslyckas.

Steg 3: rensa OCR-resultatet och konfigurera AI-sammanfattning

Normalisera OCR-resultatets text och skapa en kort sammanfattning med hjälp av AI-agenten.

Lägg till Clean OCR Output efter OCR Text Extraction.
Klistra in JavaScript-koden i JS Code exakt som den är angiven för att normalisera blanksteg och fånga filnamnet.
Lägg till AI Summary Generator och anslut den efter Clean OCR Output.
Ställ in Prompt Type på define.
Ställ in Text på =以下の文章を簡潔に要約してください： {{ $if( $('Clean OCR Output').first()?.json?.extractedText, $('Clean OCR Output').first().json.extractedText, "（テキストが見つかりませんでした）" ) }}.
Säkerställ att OpenRouter Chat Engine är ansluten som språkmodell för AI Summary Generator.
Autentiseringsuppgifter krävs: Anslut era openRouterApi-autentiseringsuppgifter i OpenRouter Chat Engine (AI-verktygets autentiseringsuppgifter ställs in på den överordnade modellnoden, inte på agenten).

Tips: Om OCR returnerar tom text kommer agenten automatiskt att använda reservmeddelandet som är angivet i uttrycket.

Steg 4: logga resultat till Google Sheets och skicka e-post

Lägg till sammanfattningen i ett Google Sheet och avisera via Gmail.

Lägg till Append Sheet Record efter AI Summary Generator.
Ställ in Operation på append.
Ställ in Document ID på [YOUR_ID] och Sheet Name på gid=0 (cachat namn: 要約).
Mappa kolumner: 処理日 till ={{ $now.toISO().split('T')[0] }}, 要約結果 till ={{ $('AI Summary Generator').first().json.output }}, och ファイル名 till ={{ $('Clean OCR Output').first().json.fileName }}.
Autentiseringsuppgifter krävs: Anslut era Google Sheets-autentiseringsuppgifter.
Lägg till Send Gmail Notice efter Append Sheet Record.
Ställ in Send To på [YOUR_EMAIL].
Ställ in Subject på =OCR処理完了: {{ $('Clean OCR Output').first().json.fileName }}.
Ställ in Message på =画像ファイル「{{ $('Clean OCR Output').first().json.fileName }}」のOCR処理が完了しました。【要約】 {{ $('AI Summary Generator').first().json.message.content }} 【Google Docs】新規ドキュメントを作成しました。ドキュメントID: {{ $('Google Docs へ要約を追記').first().json.documentId }}.
Autentiseringsuppgifter krävs: Anslut era Gmail-autentiseringsuppgifter.
Lägg till Completion Marker efter Send Gmail Notice för att avsluta flödet.

⚠️ Vanlig fallgrop: E-postmeddelandet refererar till Google Docs へ要約を追記, men den noden finns inte i detta arbetsflöde. Ta bort eller ersätt det uttrycket för att undvika körningsfel.

Steg 5: testa och aktivera ert arbetsflöde

Verifiera hela flödet innan ni slår på det för användning i produktion.

Klicka på Execute Workflow och ladda upp en ny bild i den övervakade Drive-mappen.
Bekräfta att Fetch Image File laddar ned filen och att OCR Text Extraction returnerar tolkad text.
Verifiera att Clean OCR Output matar ut extractedText och fileName, och att AI Summary Generator skapar en sammanfattning.
Kontrollera att Append Sheet Record lägger till en rad i kalkylarket och att Send Gmail Notice levererar e-postmeddelandet.
När allt fungerar, växla arbetsflödet till Active för kontinuerlig bearbetning.

🔒

Lås upp fullständig steg-för-steg-guide

Få den kompletta implementeringsguiden + nedladdningsbar mall

Vanliga fallgropar

Google Drive-inloggningar kan löpa ut eller behöva specifika behörigheter. Om det slutar fungera, kontrollera först n8n:s sida för Credentials och bekräfta sedan att den bevakade mappen fortfarande är åtkomlig för det Google-kontot.
Om du använder Wait-noder eller extern rendering varierar bearbetningstiderna. Öka väntetiden om nedströms-noder fallerar på tomma svar.
Standardprompter i AI-noder är generiska. Lägg in er tonalitet tidigt, annars kommer du att redigera utdata för alltid.

Vanliga frågor

Hur lång tid tar det att sätta upp den här automatiseringen för Drive OCR-sammanfattningar?

Cirka 30 minuter om du redan har dina API-nycklar.

Behöver jag kunna koda för att automatisera Drive OCR-sammanfattningar?

Nej. Du kopplar konton och klistrar in ett par API-nycklar.

Är n8n gratis att använda för det här arbetsflödet för Drive OCR-sammanfattningar?

Ja. n8n har ett gratis self-hosted-alternativ och en gratis provperiod på n8n Cloud. Cloud-planer startar på 20 USD/månad för högre volym. Du behöver också räkna med användningskostnader för OCR.space och OpenRouter, som beror på hur många bilder du bearbetar.

Var kan jag hosta n8n för att köra den här automatiseringen?

Två alternativ: n8n Cloud (hanterat, enklast att komma igång) eller self-hosting på en VPS. För self-hosting är Hostinger VPS prisvärd och klarar n8n bra. Self-hosting ger dig obegränsade körningar men kräver grundläggande serveradministration.

Kan jag anpassa det här arbetsflödet för Drive OCR-sammanfattningar för längre sammanfattningar och utdata på engelska?

Ja, men du gör det i AI-prompten. I steget AI Summary Generator (AI-agenten kopplad till OpenRouter-chatmodellen) ändrar du prompten så att den ber om en längre sammanfattning och anger utdata-språk (till exempel: ”Summarize in English in 5 bullet points”). Du kan också lägga till en ”confidence”-rad eller spara hela OCR-texten i en annan kolumn i arket om du vill ha råtext plus sammanfattning.

Varför misslyckas min Google Drive-anslutning i det här arbetsflödet?

Oftast beror det på att Googles auktorisering i n8n:s credentials har gått ut eller ändrats. Anslut Google Drive-kontot på nytt och bekräfta sedan att mapp-ID:t fortfarande pekar på en mapp som kontot har åtkomst till. Om det fungerade tidigare och plötsligt slutade, kontrollera också om mappen flyttades, bytte namn eller om någon annan stramade åt behörigheterna.

Hur många bilder kan den här automatiseringen för Drive OCR-sammanfattningar hantera?

På n8n Cloud Starter kan du vanligtvis köra några tusen exekveringar per månad, och varje bild är normalt en exekvering.

Är den här automatiseringen för Drive OCR-sammanfattningar bättre än att använda Zapier eller Make?

Ofta ja, eftersom det här arbetsflödet behöver några ”mellansteg” (ladda ner den binära filen, rensa OCR-resultat och sedan skicka det vidare till en AI-agent) som blir klumpiga i enklare verktyg. n8n ger dig också ett self-host-alternativ, vilket betyder att du inte betalar mer varje gång volymen ökar. Zapier och Make kan fortfarande fungera om ditt flöde är väldigt enkelt, men OCR + AI + loggning tenderar att bli dyrt eller skört där. Om du är osäker: titta på hur många bilder du bearbetar per vecka och hur strikt utdataformat du behöver. Prata med en automationsexpert så får du en rak rekommendation.

När det här väl rullar slutar Drive vara en dumpningsplats och börjar fungera som ett inflödessystem. Arbetsflödet tar hand om det repetitiva, och du får ett strukturerat ark du faktiskt kan använda.

Google Drive till Google Sheets: OCR-sammanfattningar loggas

Så fungerar den här automatiseringen

n8n Workflow Template: Google Drive till Google Sheets: OCR-sammanfattningar loggas

Problemet: bilder blir ”mörk data”

Lösningen: Google Drive → OCR → AI-sammanfattning → Google Sheets

Vad du får: automatisering kontra resultat

Exempel: så här ser det ut

Det här behöver du

Så fungerar det

Steg-för-steg-guide för implementering

Steg 1: konfigurera Drive-triggern

Steg 2: anslut Google Drive och extrahera OCR-text

Steg 3: rensa OCR-resultatet och konfigurera AI-sammanfattning

Steg 4: logga resultat till Google Sheets och skicka e-post

Steg 5: testa och aktivera ert arbetsflöde

Lås upp fullständig steg-för-steg-guide

Vanliga fallgropar

Vanliga frågor

Kontakta oss

Kontakta oss

Google Drive till Google Sheets: OCR-sammanfattningar loggas

Så fungerar den här automatiseringen

n8n Workflow Template: Google Drive till Google Sheets: OCR-sammanfattningar loggas

Problemet: bilder blir ”mörk data”

Lösningen: Google Drive → OCR → AI-sammanfattning → Google Sheets

Vad du får: automatisering kontra resultat

Exempel: så här ser det ut

Det här behöver du

Så fungerar det

Steg-för-steg-guide för implementering

Steg 1: konfigurera Drive-triggern

Steg 2: anslut Google Drive och extrahera OCR-text

Steg 3: rensa OCR-resultatet och konfigurera AI-sammanfattning

Steg 4: logga resultat till Google Sheets och skicka e-post

Steg 5: testa och aktivera ert arbetsflöde

Lås upp fullständig steg-för-steg-guide

Vanliga fallgropar

Relaterade arbetsflöden

Vanliga frågor

Kontakta oss

Använd mall