Behöver ert företag hjälp med att implementera AI? Kontakta oss och få prisoffert här →
AI Skolan
januari 22, 2026

Webbplatskarta till Drive, rensad markdown per sida

Rickard Andersson Partner, Nodenordic.se

Innehållsgranskningar låter enkla tills du faktiskt drar igång en. Du öppnar 40 flikar, kopierar textstycken till slumpmässiga dokument, tappar bort vad du redan har fångat och kan ändå inte svara på grundfrågor som “Vilka sidor är tunna?”

sitemap markdown automation är den tråkiga lösningen som gör verklig skillnad. SEO-ansvariga som jagar en migrationsdeadline märker det först, men marknadschefer och byråteam som städar upp gamla sajter hamnar i samma röra.

Det här arbetsflödet tar en webbplats XML-sitemap, hämtar varje sida, extraherar läsbart innehåll och sparar sedan en korrekt formaterad markdown-fil per URL i Google Drive. Du får se vad det gör, vad du får ut och hur du kör det på ett säkert sätt.

Så här fungerar automatiseringen

Hela n8n-flödet, från trigger till slutresultat:

n8n Workflow Template: Webbplatskarta till Drive, rensad markdown per sida

Problemet: granska sidor utan en pålitlig export

När du behöver innehåll från en hel sajt är första instinkten ofta manuell: öppna en URL, kopiera huvudtexten, klistra in i ett dokument, upprepa. Det är långsamt, men det värsta är inkonsekvensen. En person tar med H1, en annan tar title-taggen. Någon glömmer att ta bort navigationstext. Plötsligt är din “granskning” full av brus och dina ordantal är i praktiken påhittade. Samtidigt bryr sig inte deadlinen. Migrationer, omskrivningar och konsolideringsprojekt stannar av eftersom ingen litar på inventeringen.

Friktionen växer snabbt. Här är var det faller isär.

  • Du lägger ungefär 5 minuter per sida bara på att kopiera, klistra in och namnge filer, vilket blir timmar även på en mindre sajt.
  • Sidtitlar registreras på tre olika sätt, så senare kan du inte med säkerhet matcha “Home” till rätt URL.
  • Ordantal går inte att lita på när sidhuvuden, sidfötter och cookie-banners smyger sig in i texten.
  • Du missar sidor helt eftersom “listan med URL:er” aldrig var komplett från början.

Lösningen: gör om en sitemap till markdown-filer redo för Drive

Det här arbetsflödet börjar med den enda källan som oftast säger sanningen: din XML-sitemap. n8n hämtar sitemap:en, parsar den till en strukturerad lista med URL:er och besöker sedan varje sida med en standardiserad, webbläsarlik förfrågan så att du får samma HTML som en riktig användare skulle få. Därifrån extraherar det det meningsfulla innehållet, identifierar en rimlig titel (med flera vanliga signaler) och genererar en markdown-fil med konsekvent struktur. Varje fil innehåller användbar metadata som ordantal och svarsinformation, så att du kan bedöma kvalitet utan att gissa. Till sist sparas allt i en dedikerad Google Drive-mapp, en sida per fil, och sedan väntar flödet några sekunder innan nästa URL hämtas.

Flödet startar när du fyller i din sitemap-länk och klickar på kör. Det itererar igenom URL:er i kontrollerade batchar, hämtar HTML, konverterar till läsbar text och lagrar sedan en snyggt formaterad markdown-fil i Google Drive. En inbyggd fördröjning (3 sekunder) gör insamlingen respektfull och stabil.

Det du får: automatisering vs. resultat

Exempel: så här ser det ut

Säg att du ska granska en marknadsföringssajt med 120 sidor inför en redesign. Manuellt tar även en snabb process cirka 5 minuter per sida (öppna, kopiera, rensa, namnge, spara), vilket blir runt 10 timmar monotont arbete. Med det här flödet klistrar du in sitemap-URL:en en gång, kör och låter det bearbeta sekventiellt med den inbyggda 3-sekundersfördröjningen. Körningen kan ta ett par timmar beroende på sajten, men din aktiva tid är närmare 15 minuter, och i Drive landar 120 korrekt formaterade markdown-filer redo att granska.

Det här behöver du

  • n8n-instans (testa n8n Cloud gratis)
  • Alternativ för egen hosting om du föredrar det (Hostinger fungerar bra)
  • Google Drive för att lagra en markdown-fil per sida.
  • Målsajtens sitemap-URL för att definiera vilka sidor som ska exporteras.
  • Google-inloggning i n8n (skapa under n8n:s Credentials och välj sedan i Drive-noden).

Svårighetsgrad: Nybörjare. Du klistrar in en sitemap-URL, kopplar Google Drive och justerar vid behov gränser och fördröjningar.

Vill du inte sätta upp detta själv? Prata med en automatiseringsexpert (gratis 15-minuters konsultation).

Så fungerar det

Du anger sitemap-URL:en. Flödet startar med en manuell trigger och sätter sedan sitemap-länken du vill bearbeta (vanliga sökvägar är /sitemap.xml eller /page-sitemap.xml).

Sitemap:en hämtas och expanderas till URL:er. n8n laddar ner XML:en, parsar den och gör om den till en lista med sidlänkar så att du slipper gissningar eller ett halvt färdigt kalkylark.

Varje sida skrapas och rensas. Flödet loopar igenom URL:er i batchar, hämtar HTML och kör sedan ett extraktionsskript som letar efter titel och meningsfull sidtext. Det fångar även metadata som statuskoder och ordantal.

Markdown-filer skapas och sparas i Google Drive. Ett markdown-dokument sätts ihop (med metadata i frontmatter-stil), sparas i din valda Drive-mapp och sedan väntar flödet 3 sekunder innan det går vidare.

Du kan enkelt ändra URL-taket för att testa på 5 sidor först och sedan skala upp till hela sitemap:en när du litar på resultatet. Se hela implementationsguiden nedan för anpassningsalternativ.

Steg-för-steg-guide för implementation

Steg 1: konfigurera den manuella triggern

Starta workflowet manuellt och ange den initiala sitemap-URL:en som används genom hela körningen.

  1. Öppna Manual Start Trigger och behåll den som startpunkt för körningar vid behov.
  2. I Assign Sitemap Link anger ni värdet för sitemap_url till https://yourwebsitehere.com/page-sitemap.xml.
  3. Bekräfta att exekveringsflödet startar Manual Start TriggerAssign Sitemap Link.

Den fästa anteckningen Flowpast Branding är endast informativ och kan lämnas oförändrad eller tas bort utan att påverka exekveringen.

Steg 2: anslut Google Drive

Konfigurera utdatamålet där Markdown-filer lagras.

  1. Öppna Store in Drive Folder och välj målmappen i folderId (just nu YOUR_GOOGLE_DRIVE_FOLDER_ID_HERE).
  2. Låt operation vara satt till createFromText så att varje sida blir en Markdown-fil.
  3. Verifiera att name använder uttrycket {{ $('Batch URL Iterator').item.json.loc.replace(/https?:\/\//, '').replace(/\//g, '_') }}_sitemap.md.
  4. Verifiera att content använder uttrycket {{ $json.formatted }}.
  5. Inloggningsuppgifter krävs: anslut era googleDriveOAuth2Api-inloggningsuppgifter.

Steg 3: konfigurera hämtning av sitemap

Hämta sitemapen, avkoda den och expandera URL-poster till individuella objekt.

  1. I Retrieve Sitemap File ställer ni url till {{ $json.sitemap_url }}.
  2. I Decode Sitemap XML låter ni standardinställningarna vara kvar för att parsa XML-innehållet till JSON.
  3. I Expand Sitemap Entries ställer ni fieldToSplitOut till urlset.url.
  4. I Optional URL Cap ställer ni maxItems till 20 om ni vill begränsa antalet URL:er (obs: den här noden är för närvarande inaktiverad).
  5. Säkerställ att flödet fortsätter Assign Sitemap LinkRetrieve Sitemap FileDecode Sitemap XMLExpand Sitemap EntriesOptional URL CapBatch URL Iterator.

⚠️ Vanlig fallgrop: om Optional URL Cap är inaktiverad kommer workflowet att försöka skrapa varje URL i sitemapen. Aktivera den vid testning för att undvika långa körningar.

Steg 4: konfigurera hämtning och parsning av sidor

Iterera genom sitemapens URL:er, hämta HTML och extrahera läsbart innehåll.

  1. I Batch URL Iterator lämnar ni standardinställningarna för att behandla en URL per batch-cykel.
  2. I Fetch Page HTML ställer ni url till {{ $json.loc }} och behåller sendHeaders aktiverat.
  3. Bekräfta att request-headers i Fetch Page HTML inkluderar User-Agent, Accept, Accept-Language, Accept-Encoding, Cache-Control och Pragma enligt konfiguration.
  4. I Parse Page Content behåller ni JavaScript-koden som extraherar titel, innehåll och metadata från HTML-responsen.
  5. Bekräfta exekveringsflödet Batch URL IteratorFetch Page HTMLParse Page Content.

Steg 5: konfigurera utdata och rate limiting

Formatera siddata som Markdown, lagra det i Drive och begränsa anropshastigheten mellan sidor.

  1. I Compose Markdown Output behåller ni JavaScript-koden som bygger YAML-frontmatter och formaterad Markdown.
  2. Verifiera flödet Parse Page ContentCompose Markdown OutputStore in Drive Folder.
  3. I Pause Between Pages ställer ni amount till 3 för att vänta 3 sekunder mellan anrop.
  4. Bekräfta att loopen Store in Drive FolderPause Between PagesBatch URL Iterator är kopplad.

Steg 6: testa och aktivera ert workflow

Kör ett kontrollerat test för att bekräfta att sitemapen bearbetas och att filer skapas i Drive.

  1. Klicka på Execute Workflow för att köra Manual Start Trigger och bearbeta sitemapen.
  2. Verifiera att Store in Drive Folder skapar Markdown-filer med namn som example.com_page_sitemap.md i er valda Drive-mapp.
  3. Kontrollera exekveringsdata i Parse Page Content för success = true och rimligt wordCount.
  4. När allt är validerat, slå på workflowet Active för att möjliggöra användning i produktion.
🔒

Lås upp fullständig steg-för-steg-guide

Få den kompletta implementeringsguiden + nedladdningsbar mall

Vanliga fallgropar

  • Google Drive-credentials kan gå ut eller kräva specifika behörigheter. Om det strular, kontrollera först n8n:s Credentials-panel och noden “Store in Drive Folder”.
  • Om du använder Wait-noder eller extern rendering varierar processtiderna. Öka väntetiden om nedströmsnoder misslyckas på tomma svar.
  • Standardprompter i AI-noder är generiska. Lägg in din tonalitet tidigt, annars kommer du att redigera utdata i all evighet.

Vanliga frågor

Hur lång tid tar det att sätta upp denna sitemap markdown automation-automatisering?

Cirka 20 minuter om ditt Google Drive redan är anslutet.

Behöver jag kunna koda för att automatisera sitemap markdown automation?

Nej. Du klistrar i huvudsak in sitemap-URL:en och väljer rätt Google Drive-mapp. Extraktionskoden ingår redan i arbetsflödet.

Är n8n gratis att använda för det här sitemap markdown automation-arbetsflödet?

Ja. n8n har ett gratis alternativ för egen hosting och en gratis provperiod på n8n Cloud. Cloud-planer börjar på 20 USD/månad för högre volym. Du bör också budgetera för lagring i Google Drive om du exporterar hundratals sidor.

Var kan jag hosta n8n för att köra den här automatiseringen?

Två alternativ: n8n Cloud (hanterat, enklast att komma igång) eller egen hosting på en VPS. För egen hosting är Hostinger VPS prisvärd och klarar n8n bra. Egen hosting ger obegränsade körningar men kräver grundläggande serveradministration.

Kan jag anpassa det här sitemap markdown automation-arbetsflödet för att spara i undermappar per kategori?

Ja, men du behöver göra en liten justering. Använd URL-sökvägen från steget “Parse Page Content” för att ta fram ett mappnamn och justera sedan noden “Store in Drive Folder” så att den skapar eller väljer en matchande undermapp innan uppladdning. Vanliga anpassningar är att separera /blog/ från /docs/, skriva en enda indexfil och lägga till extra fält i markdownens frontmatter.

Varför misslyckas min Google Drive-anslutning i det här flödet?

Oftast handlar det om en credential som gått ut eller att fel Google-konto är valt i n8n. Öppna noden “Store in Drive Folder”, välj credential på nytt och bekräfta att Drive-mappens ID är korrekt. Om du nyligen ändrade behörigheter på den mappen kan du behöva autentisera igen så att n8n kan skriva filer. Kontrollera också din körlogg efter meddelanden som “insufficient permissions”, eftersom de brukar vara väldigt tydliga.

Hur många sidor kan denna sitemap markdown automation-automatisering hantera?

Om du kör med egen hosting finns ingen körningsgräns (det beror främst på din server och hur länge du vill låta den gå). I n8n Cloud beror din månatliga körningsgräns på din plan, men det här flödet kör ungefär en exekvering per sida plus den initiala sitemap-hämtningen. I praktiken går hundratals sidor bra; tusentals kan ta tid på grund av den inbyggda 3-sekundersfördröjningen.

Är denna sitemap markdown automation-automatisering bättre än att använda Zapier eller Make?

För sitemap-baserad skrapning och filgenerering är n8n oftast det smidigare valet. Du kan styra batchning, timeouts och fördröjningar utan att betala extra för varje villkorsgren, och du kan köra med egen hosting när du behöver långa körningar. Zapier och Make är utmärkta för enkel app-till-app-synk, men blir klumpiga när du loopar över hundratals URL:er och bygger ihop markdown. Om du är osäker, prata med en automatiseringsexpert och beskriv din sajtstorlek och ditt mål, så får du ett rakt svar.

När detta väl är igång slutar din innehållsgranskning att vara en skattjakt. Du får en prydlig Drive-mapp med markdown-filer och en mycket tydligare bild av vad som behöver åtgärdas.

Kontakta oss

Hör av dig, så diskuterar vi hur just din verksamhet kan dra nytta av alla fantastiska möjligheter som AI skapar.

×

Använd mall

Få direkt tillgång till denna n8n-arbetsflödes JSON-fil

Launch login modal Launch register modal