Att stämma av insättningar från PDF:er med kontoutdrag är den sortens jobb som i tysthet saboterar hela veckan. Du laddar ner ett utdrag, kisar på en tabell, kopierar rader till ett kalkylark och upptäcker sedan att kolumnerna har förskjutits och att hälften av beloppen hamnade på fel ställe.
Den här Drive Sheets deposits-automationen träffar bokförare först, om vi ska vara ärliga. Men ekonomiansvariga och operativa team som ”bara behöver siffrorna i Google Sheets” känner av det också, särskilt när månadsbokslutet redan är tajt.
Det här arbetsflödet hämtar kontoutdrags-PDF:er från Google Drive, konverterar dem till läsbara sidbilder, använder en multimodal AI-modell för att extrahera insättningsrader och loggar dem i Google Sheets. Du får se hur det fungerar, vad du behöver och var team oftast snubblar.
Så här fungerar automationsflödet
Se hur detta löser problemet:
n8n Workflow Template: Google Drive till Google Sheets, bokför insättningar
flowchart LR
subgraph sg0["When clicking ‘Test workflow’ Flow"]
direction LR
n0@{ icon: "mdi:play-circle", form: "rounded", label: "When clicking ‘Test workflow’", pos: "b", h: 48 }
n1@{ icon: "mdi:brain", form: "rounded", label: "Google Gemini Chat Model", pos: "b", h: 48 }
n2@{ icon: "mdi:cog", form: "rounded", label: "Sort Pages", pos: "b", h: 48 }
n3@{ icon: "mdi:cog", form: "rounded", label: "Get Bank Statement", pos: "b", h: 48 }
n4["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/httprequest.dark.svg' width='40' height='40' /></div><br/>Split PDF into Images"]
n5@{ icon: "mdi:cog", form: "rounded", label: "Extract Zip File", pos: "b", h: 48 }
n6["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/code.svg' width='40' height='40' /></div><br/>Images To List"]
n7@{ icon: "mdi:cog", form: "rounded", label: "Resize Images For AI", pos: "b", h: 48 }
n8@{ icon: "mdi:brain", form: "rounded", label: "Google Gemini Chat Model1", pos: "b", h: 48 }
n9@{ icon: "mdi:cog", form: "rounded", label: "Combine All Pages", pos: "b", h: 48 }
n10@{ icon: "mdi:robot", form: "rounded", label: "Extract All Deposit Table Rows", pos: "b", h: 48 }
n11@{ icon: "mdi:robot", form: "rounded", label: "Transcribe to Markdown", pos: "b", h: 48 }
n2 --> n7
n6 --> n2
n5 --> n6
n9 --> n10
n3 --> n4
n7 --> n11
n4 --> n5
n11 --> n9
n1 -.-> n11
n8 -.-> n10
n0 --> n3
end
%% Styling
classDef trigger fill:#e8f5e9,stroke:#388e3c,stroke-width:2px
classDef ai fill:#e3f2fd,stroke:#1976d2,stroke-width:2px
classDef aiModel fill:#e8eaf6,stroke:#3f51b5,stroke-width:2px
classDef decision fill:#fff8e1,stroke:#f9a825,stroke-width:2px
classDef database fill:#fce4ec,stroke:#c2185b,stroke-width:2px
classDef api fill:#fff3e0,stroke:#e65100,stroke-width:2px
classDef code fill:#f3e5f5,stroke:#7b1fa2,stroke-width:2px
classDef disabled stroke-dasharray: 5 5,opacity: 0.5
class n0 trigger
class n10,n11 ai
class n1,n8 aiModel
class n4 api
class n6 code
classDef customIcon fill:none,stroke:none
class n4,n6 customIcon
Utmaningen: att strukturera insättningstabeller från PDF:er
Kontoutdrag ser enkla ut tills du försöker göra om dem till strukturerad data. Insättningsdelen är oftast en tabell med flera kolumner, och PDF:er är experter på att ”se rätt ut” samtidigt som de är en enda röra under ytan. Traditionell OCR kan feltolka siffror, byta plats på kolumner eller slå ihop rader, och då sitter du fast med exakt den efterbearbetning du försökte slippa. Ännu värre: varje manuell copy-paste ökar risken att du stämmer av mot fel total och lägger en extra timme på att jaga en ”saknad” insättning som aldrig saknades. Den blev bara felregistrerad.
Det eskalerar snabbt. Här är var det brukar fallera i verkliga team.
- Du måste skriva om insättningsrader eftersom OCR-utdata inte håller tabellkolumnerna i linje.
- En enda felsläst siffra kan slå ut en avstämning, och fixen blir oftast manuellt detektivarbete.
- Utdrag kommer i olika layouter, så ”så som du gjorde förra månaden” fungerar inte alltid.
- Även när du outsourcar datainmatning granskar du fortfarande allt eftersom källan är svårtolkad.
Lösningen: extrahera insättningsrader med multimodal AI
Det här arbetsflödet tar en kontoutdrags-PDF från Google Drive och gör om den till en strukturerad, kalkylarksredo uppsättning insättningsrader. I stället för att pressa PDF:en genom skör textkonvertering konverteras varje sida först till en bild (via en PDF-till-bild-tjänst) och sedan skickas sidbilderna till en multimodal AI-modell som faktiskt kan ”se” tabellayouten. Modellen skapar en konsekvent transkribering sida för sida, och arbetsflödet slår ihop innehållet till en gemensam helhet. Till sist plockar ett informationsutdragssteg fram bara det du bryr dig om (insättningsrader) och förbereder dem för loggning. Slutresultatet är ett Google Sheet som är redo för avstämning utan den vanliga kolumnröran.
Arbetsflödet startar när ditt kontoutdrag hämtas från Google Drive. Därifrån konverterar Stirling PDF det till sidbilder i rätt ordning, n8n ändrar storlek på dem för hastighet och Gemini läser sidorna tillförlitligt. De extraherade insättningsraderna kan sedan skrivas in i Google Sheets så att teamet slipper repetitiv efterstädning.
Vad som förändras: före vs. efter
| Det här elimineras | Effekten du märker |
|---|---|
|
|
Effekt i verkligheten
Säg att du stämmer av ett kontoutdrag i veckan och att det har ungefär 30 insättningsrader. Manuellt kan du lägga runt 3 minuter per rad på att läsa PDF:en, mata in data och fixa justeringsproblem, vilket blir cirka 90 minuter, plus ytterligare 30 minuter för att dubbelkolla totalsummor. Med det här arbetsflödet lägger du PDF:en i Drive, låter konvertering och AI-tolkning köra, och spenderar sedan cirka 10 minuter på att granska de extraherade raderna i Google Sheets. Det är nästan 2 timmar tillbaka en vanlig vecka.
Krav
- n8n-instans (testa n8n Cloud gratis)
- Alternativ för egen drift om du föredrar det (Hostinger fungerar bra)
- Google Drive för att lagra och hämta kontoutdrags-PDF:er
- Google Sheets för att logga extraherade insättningsrader
- Google Gemini API-nyckel (hämta den i Google AI Studio)
- Stirling PDF för att konvertera PDF:er till sidbilder
Kompetensnivå: Medel. Du kopplar konton, lägger in API-uppgifter och bekräftar output-schemat som ska in i ditt sheet.
Behöver du hjälp att implementera detta? Prata med en automationsexpert (gratis 15-minuters konsultation).
Flödet i arbetsflödet
Inläsning av kontoutdrag från Google Drive. Körningen startar med att hämta kontoutdrags-PDF:en från en Drive-plats du kontrollerar (en mapp, en fil eller en definierad källa som ni standardiserar internt).
PDF-till-bild-konvertering för pålitlig läsning. Arbetsflödet skickar PDF:en till en Stirling PDF-endpoint via en HTTP-request, packar sedan upp det returnerade arkivet så att varje sida blir en separat bild. Bilderna sorteras för att behålla sidorna i rätt ordning.
Multimodal tolkning med Gemini. Varje sidbild får ändrad storlek (så att den håller sig inom modellens gränser och inte blir långsam) och skickas sedan in i Gemini för att skapa en transkribering. När alla sidor har bearbetats slår arbetsflödet ihop texten till ett samlat dokument.
Extrahering av insättningar och Google Sheets-redo output. Ett informationsutdragssteg plockar fram insättningsrader från den sammanställda texten och förbereder fälten så att de kan loggas konsekvent i Google Sheets.
Du kan enkelt justera insättningsschemat så att det matchar din kontoplan eller ditt avstämningsformat utifrån dina behov. Se hela implementationsguiden nedan för anpassningsalternativ.
Steg-för-steg-guide för implementering
Steg 1: konfigurera den manuella triggern
Det här arbetsflödet startar manuellt så att ni kan validera PDF-tolkning och extrahering innan ni schemalägger det.
- Lägg till Manual Execution Start som er triggernod.
- Lämna standardinställningarna som de är i Manual Execution Start.
- Koppla Manual Execution Start till Fetch Statement PDF.
Steg 2: anslut Google Drive för att ladda ned kontoutdraget
Ladda ned kontoutdragets PDF från Google Drive innan konvertering.
- Lägg till Fetch Statement PDF och ställ in Operation på
download. - Ställ in File ID till dokument-ID:t och ersätt
[YOUR_ID]med er fils ID. - Autentisering krävs: Anslut era googleDriveOAuth2Api-uppgifter.
- Koppla Fetch Statement PDF till Convert PDF to Images.
http://stirling-pdf:8080/api/v1/convert/pdf/img. Säkerställ att den här tjänsten är nåbar från er n8n-instans.Steg 3: konvertera, packa upp och ordna sidbilder
Det här steget konverterar PDF:en till bilder, packar upp dem och ordnar sidorna för konsekvent bearbetning.
- I Convert PDF to Images, ställ in URL på
http://stirling-pdf:8080/api/v1/convert/pdf/imgoch Method påPOST. - Aktivera Send Body och ställ in Content Type på
multipart-form-data. - Lägg till body-parametrar: fileInput som
formBinaryDatamed Input Data Field Namedata, samt imageFormatjpg, singleOrMultiplemultipleoch dpi300. - Koppla Convert PDF to Images → Unzip Image Archive → List Image Items → Order Page Files.
- I Order Page Files, lägg till ett sorteringsfält med Field Name
fileName.
Steg 4: förbered bilder och transkribera med Gemini
Skala bilder och transkribera varje sida till markdown med Gemini.
- I Scale Images for Model, ställ in Operation på
resize, Resize Option påpercentoch ställ in Width och Height på75. - Koppla Order Page Files till Scale Images for Model och sedan till Generate Markdown Transcript.
- I Generate Markdown Transcript, ställ in Text på
transcribe the image to markdown.och lämna Prompt Type somdefine. - Bekräfta att meddelandemallen innehåller transkriptionsinstruktionerna och bildinmatningen för HumanMessagePromptTemplate.
- Autentisering krävs: Anslut era googlePalmApi-uppgifter i Gemini Chat Model Primary.
- Säkerställ att Gemini Chat Model Primary är ansluten som språkmodell för Generate Markdown Transcript (uppgifter läggs till i Gemini Chat Model Primary, inte i chain-noden).
Steg 5: aggregera text och extrahera insättningsrader
Slå ihop sidtranskript och extrahera insättningsrader till strukturerad data.
- Koppla Generate Markdown Transcript till Aggregate Page Text.
- I Aggregate Page Text, ställ in Field To Aggregate på
textoch Output Field Name påpages. - Koppla Aggregate Page Text till Extract Deposit Rows.
- I Extract Deposit Rows, ställ in Text på
{{ $json.pages.join('---') }}. - Behåll Schema Type som
manualoch klistra in det angivna JSON-schemat för Input Schema. - Autentisering krävs: Anslut era googlePalmApi-uppgifter i Gemini Chat Model Secondary.
- Säkerställ att Gemini Chat Model Secondary är ansluten som språkmodell för Extract Deposit Rows (uppgifter läggs till i Gemini Chat Model Secondary, inte i extraktornoden).
Steg 6: testa och aktivera ert arbetsflöde
Kör ett manuellt test för att bekräfta att PDF-konvertering, transkribering och extrahering fungerar hela vägen.
- Klicka på Execute Workflow och verifiera att Fetch Statement PDF laddar ned filen.
- Bekräfta att Convert PDF to Images returnerar en ZIP och att Unzip Image Archive ger ut flera bilder.
- Kontrollera att Generate Markdown Transcript producerar markdown för varje sida och att Aggregate Page Text ger ut en
pages-array. - Verifiera att Extract Deposit Rows returnerar strukturerade poster med
date,descriptionochamount. - När detta är bekräftat, spara och aktivera arbetsflödet för produktionskörningar.
Se upp med
- Google Drive-behörigheter kan vara luriga. Om arbetsflödet inte kan hämta PDF:en, kontrollera Drive-anslutningen i n8n först och bekräfta sedan att filen ligger i en mapp som det anslutna Google-kontot kommer åt.
- Om du konverterar stora kontoutdrag med Stirling PDF varierar processingtiderna. Öka väntetiden (eller höj inställningar för request-timeout) om efterföljande noder fallerar för att zip-filen inte är klar ännu.
- Gemini-prompter spelar större roll än många tror. Standardprompten för transkribering är generell, så lägg in dina föredragna fältnamn och exempel tidigt, annars kommer du fortsätta ”fixa” output-format i Google Sheets.
Vanliga frågor
Cirka 30 minuter om dina Google-konton och din Gemini-nyckel är redo.
Ja, men du vill ha någon som är bekväm med API-nycklar och att testa några exempelutdrag. Ingen kodning, dock.
Ja. n8n har ett gratis alternativ för egen drift och en gratis provperiod på n8n Cloud. Cloud-planer börjar på 20 USD/månad för högre volymer. Du behöver också räkna med användning av Google Gemini API (oftast liten för några få utdrag, högre om du bearbetar många sidor).
Två alternativ: n8n Cloud (hanterat, enklast att komma igång) eller egen drift på en VPS. För egen drift är Hostinger VPS prisvärd och klarar n8n bra. Egen drift ger dig obegränsade körningar men kräver grundläggande serverhantering.
Du kan justera vad som extraheras genom att ändra mappningen i ”Extract Deposit Rows” och prompten som används i ”Generate Markdown Transcript”. Vanliga anpassningar är att lägga till en bankkontoidentifierare, fånga datum för kontoutdragsperiod, extrahera uttag också och tvinga fram ett strikt output-format som matchar dina kolumner i Google Sheets.
Oftast handlar det om behörigheter eller att sökvägen till filen har ändrats. Återanslut Google Drive i n8n, bekräfta att det anslutna Google-kontot kan öppna kontoutdrags-PDF:en i Drive och säkerställ att arbetsflödet pekar på rätt mapp eller fil-ID.
Det beror främst på hur många sidor du tolkar per kontoutdrag. På n8n Cloud begränsas du av dina månatliga körningar, medan egen drift inte har någon körningsgräns (servern är gränsen). I praktiken kör de flesta team några få utdrag per dag utan någon justering. Om du börjar bearbeta stora batcher vill du lägga till köhantering och hålla koll på Geminis rate limits.
För det här flödet har n8n några fördelar: hanterar binära filer (PDF:er och bilder) snyggt, kan kedja AI-tolkning i flera steg utan att du betalar per steg och ger dig möjlighet till egen drift för känsliga finansiella dokument. Zapier eller Make kan fungera för enklare flöden av typen ”PDF kommer in → notifiera mig”, men det här är mer än så. Du konverterar filer, sorterar sidor, ändrar storlek på bilder och extraherar strukturerade radposter, så du får nytta av n8n:s kontroll. Om du är osäker, prata med en automationsexpert så stresstestar vi din setup. Det är ett snabbt samtal.
När det här väl är igång slutar loggning av insättningar att vara ett återkommande måsten. Arbetsflödet tar hand om det tråkiga så att du kan stämma av med trygghet och gå vidare.
Kontakta oss
Hör av dig, så diskuterar vi hur just din verksamhet kan dra nytta av alla fantastiska möjligheter som AI skapar.