Du hittar en lovande arXiv-artikel, sparar länken någonstans “säkert”, och sedan försvinner den i en flik-kyrkogård. Nästa vecka letar du igen, laddar ner PDF:en på nytt och försöker minnas varför den ens var viktig.
Det är här arXiv-sammanfattningsautomatisering verkligen levererar. Produktmarknadsförare märker det när trendrapporter ska in. Grundare märker det när de behöver snabb signal, inte ännu en läslista. Och analytiker som bygger research-baserat innehåll? Samma röra, annan deadline.
Det här arbetsflödet hämtar nya arXiv-listningar, gör om PDF:er till lättlästa sammanfattningar med OpenAI, loggar allt i Google Sheets och pingar dig i Telegram. Du får se vad det gör, varför det är värdefullt och hur du anpassar det till din egen research-pipeline.
Så fungerar automatiseringen
Här är hela arbetsflödet du kommer att sätta upp:
n8n Workflow Template: OpenAI till Google Sheets: arXiv-sammanfattningar
flowchart LR
subgraph sg0["Timed Automation Flow"]
direction LR
n0@{ icon: "mdi:play-circle", form: "rounded", label: "Timed Automation Trigger", pos: "b", h: 48 }
n1@{ icon: "mdi:cog", form: "rounded", label: "Fetch arXiv Listings", pos: "b", h: 48 }
n2@{ icon: "mdi:robot", form: "rounded", label: "Extract Paper Entries", pos: "b", h: 48 }
n3@{ icon: "mdi:swap-vertical", form: "rounded", label: "Unpack Article List", pos: "b", h: 48 }
n4@{ icon: "mdi:swap-vertical", form: "rounded", label: "Iterate Paper Batches", pos: "b", h: 48 }
n5@{ icon: "mdi:brain", form: "rounded", label: "OpenAI Chat Engine", pos: "b", h: 48 }
n6@{ icon: "mdi:database", form: "rounded", label: "Append to Sheets", pos: "b", h: 48 }
n7["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/telegram.svg' width='40' height='40' /></div><br/>Telegram Update Alert"]
n8@{ icon: "mdi:robot", form: "rounded", label: "Summarize Paper Text", pos: "b", h: 48 }
n9["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/httprequest.dark.svg' width='40' height='40' /></div><br/>Retrieve PDF File"]
n10@{ icon: "mdi:cog", form: "rounded", label: "Convert PDF to Text", pos: "b", h: 48 }
n11@{ icon: "mdi:swap-vertical", form: "rounded", label: "Map Text Field", pos: "b", h: 48 }
n12["<div style='background:#f5f5f5;padding:10px;border-radius:8px;display:inline-block;border:1px solid #e0e0e0'><img src='https://flowpast.com/wp-content/uploads/n8n-workflow-icons/html.dark.svg' width='40' height='40' /></div><br/>Parse HTML Segment"]
n13@{ icon: "mdi:brain", form: "rounded", label: "OpenAI Mini Engine", pos: "b", h: 48 }
n1 --> n12
n9 --> n10
n3 --> n4
n10 --> n11
n4 --> n7
n4 --> n9
n2 --> n3
n8 --> n6
n0 --> n1
n5 -.-> n8
n11 --> n8
n6 --> n4
n13 -.-> n2
n12 --> n2
end
%% Styling
classDef trigger fill:#e8f5e9,stroke:#388e3c,stroke-width:2px
classDef ai fill:#e3f2fd,stroke:#1976d2,stroke-width:2px
classDef aiModel fill:#e8eaf6,stroke:#3f51b5,stroke-width:2px
classDef decision fill:#fff8e1,stroke:#f9a825,stroke-width:2px
classDef database fill:#fce4ec,stroke:#c2185b,stroke-width:2px
classDef api fill:#fff3e0,stroke:#e65100,stroke-width:2px
classDef code fill:#f3e5f5,stroke:#7b1fa2,stroke-width:2px
classDef disabled stroke-dasharray: 5 5,opacity: 0.5
class n0 trigger
class n2,n8 ai
class n5,n13 aiModel
class n6 database
class n9 api
classDef customIcon fill:none,stroke:none
class n7,n9,n12 customIcon
Varför det här är viktigt: häng med på nya papers utan att bränna timmar
Att hålla sig uppdaterad på AI-forskning låter enkelt tills du faktiskt försöker göra det konsekvent. Nya papers släpps, trådar drar i väg, någon delar en “måste-läsa”, och nu har du tio PDF:er som väntar på en lugn eftermiddag som aldrig kommer. Den verkliga kostnaden är inte bara tid. Det är det konstanta kontextbytet, dubbelarbetet (ladda ner, skumma, kopiera anteckningar) och den långsamma förskjutningen mot “jag tar igen det senare”. Senare blir aldrig. Och när du väl behöver en referens eller länk är den utspridd över bokmärken, chattar och halvfärdiga anteckningar.
Det växer snabbt. Här är var det brukar fallera i verkligheten.
- Du lägger cirka 10 minuter per paper bara på att hitta PDF:en, öppna den och få ut en användbar länk till senare.
- Att skumma abstracts räcker inte, men att läsa hela PDF:er för varje uppdatering skapar garanterat en backlogg.
- Anteckningar hamnar på för många ställen, vilket gör att du inte kan söka i ditt eget “bibliotek” när du skriver eller presenterar.
- Utan en konsekvent fångstprocess stannar de bästa insikterna i huvudet (och försvinner efter mötet).
Vad du bygger: en automatiserad arXiv-researchlogg med AI-sammanfattningar
Det här arbetsflödet körs enligt schema och kontrollerar arXiv efter nya listningar i den kategori du bryr dig om. Det använder Decodo för att hämta listningarna på ett stabilt sätt och extraherar sedan varje papers titel och PDF-länk till en felfri, strukturerad lista. Därifrån laddar det ner PDF:en, konverterar den till text och skickar texten genom en AI-sammanfattningskedja som drivs av en OpenAI-chatmodell. Till sist lägger det till en ny rad i Google Sheets med paper-metadata och sammanfattningen, och skickar därefter en Telegram-notis så att du vet att nya sammanfattningar väntar. Slutresultatet är ett sökbart researchbibliotek som håller sig uppdaterat utan att du behöver passa det.
Arbetsflödet startar med en tidsstyrd trigger och går sedan igenom “samla → extrahera → sammanfatta → logga”. När datan landar i Sheets kan du filtrera på ämne, sortera på datum eller kopiera en sammanfattning direkt in i en brief utan att öppna PDF:en igen.
Det du bygger
| Vad som automatiseras | Vad du uppnår |
|---|---|
|
|
Förväntade resultat
Säg att du vill följa 10 nya arXiv-papers varje vecka. Manuellt, räkna med cirka 10 minuter per paper för att hitta PDF:en, skumma, kopiera länken och skriva en snabb sammanfattning. Det är ungefär 100 minuter per vecka, och “var sparade jag den?”-problemet finns fortfarande kvar. Med det här arbetsflödet är din aktiva tid nära noll efter uppsättning: den schemalagda triggern kör, PDF:erna sammanfattas och du skannar bara Telegram-notisen och Google Sheet. De flesta team får tillbaka cirka 2 timmar per vecka, plus mer ordnade anteckningar.
Innan du börjar
- n8n-instans (testa n8n Cloud gratis)
- Self-hosting-alternativ om du föredrar det (Hostinger fungerar bra)
- Decodo för att hämta arXiv-listningar i större skala
- OpenAI (eller kompatibel modell) för att skapa paper-sammanfattningar
- Google Sheets för att lagra ditt researchbibliotek
- Telegram-botuppgifter (skapa i Telegram via BotFather)
- Decodo API-uppgifter (hämta dem i din Decodo-dashboard)
Kunskapsnivå: Medel. Du kopplar några konton, lägger in API-uppgifter och är bekväm med att testa en körning av ett arbetsflöde.
Vill du att någon bygger detta åt dig? Prata med en automationsexpert (kostnadsfri 15-minuters konsultation).
Steg för steg
En schemalagd trigger startar allt. Du väljer hur ofta arXiv ska kontrolleras (dagligen, bara vardagar, två gånger per dag). När den är aktiv kör arbetsflödet utan att du behöver öppna n8n.
arXiv-listningar hämtas och städas upp. Decodo hämtar listningssidan, sedan extraherar ett HTML-parsningssteg rätt segment. Därefter gör en extraktor om sidan till en strukturerad lista med paper-poster som du faktiskt kan jobba med.
Varje paper bearbetas i batchar. Arbetsflödet delar upp listan i hanterbara chunkar, laddar ner PDF:en för varje paper (HTTP Request) och konverterar filen till text. Ett “map fields”-steg säkerställer att sammanfattaren får rätt innehåll, inte en rörig blob.
OpenAI sammanfattar, Sheets lagrar, Telegram notifierar. Sammanfattningskedjan genererar en kort sammanfattning, sedan lägger Google Sheets till en ny rad i din researchdatabas. Telegram skickar en uppdatering så att du vet att det finns något värt att skanna.
Du kan enkelt ändra arXiv-kategori och sammanfattningsformat utifrån dina behov. Se hela implementationsguiden nedan för anpassningsalternativ.
Steg-för-steg-guide för implementering
Steg 1: Konfigurera schema-triggern
Det här arbetsflödet startar enligt ett schema med Timed Automation Trigger.
- Lägg till eller öppna Timed Automation Trigger.
- Ställ in schemaregeln så att den körs månadsvis genom att behålla regelns intervallfält som
months. - Koppla Timed Automation Trigger till Fetch arXiv Listings.
Steg 2: Koppla arXiv-hämtning och HTML-parsning
Det här steget hämtar arXivs listningssida och extraherar det relevanta HTML-segmentet.
- Öppna Fetch arXiv Listings och ställ in URL till
https://arxiv.org/list/cs.AI/recent?skip=0&show=25. - Autentiseringsuppgifter krävs: Anslut era decodoApi-uppgifter i Fetch arXiv Listings.
- Öppna Parse HTML Segment och ställ in Operation till
extractHtmlContent. - Ställ in Data Property Name till
results[0].content. - I Parse HTML Segment ställer ni in Extraction Values med key
articles, cssSelector#articlesoch skipSelectorsh3. - Koppla Fetch arXiv Listings → Parse HTML Segment.
Steg 3: Sätt upp AI-extraktion och hantering av artikellista
Arbetsflödet använder AI för att extrahera paper-poster och delar sedan upp dem i objekt för bearbetning.
- Öppna Extract Paper Entries och ställ in Text till
{{ $json.articles }}. - Ställ in Schema Type till
fromJsonoch behåll JSON-schemaexemplet som det är för att extraheratitleochpdf_link. - Säkerställ att OpenAI Mini Engine är ansluten som språkmodell för Extract Paper Entries.
Autentiseringsuppgifter krävs: Anslut era openAiApi-uppgifter i OpenAI Mini Engine (inte i Extract Paper Entries). - Öppna Unpack Article List och ställ in Field to Split Out till
output.articles. - Koppla Parse HTML Segment → Extract Paper Entries → Unpack Article List → Iterate Paper Batches.
Steg 4: Konfigurera PDF-hämtning och sammanfattning
Det här steget laddar ner varje papers PDF, extraherar text och sammanfattar den.
- Öppna Retrieve PDF File och ställ in URL till
{{ $json['output.articles'].pdf_link }}. - Öppna Convert PDF to Text och ställ in Operation till
pdf. - Öppna Map Text Field och lägg till en tilldelning: Name
text, Value{{ $json.text }}. - Öppna Summarize Paper Text och ställ in Chunk Size till
10000och Chunk Overlap till2000. - Säkerställ att OpenAI Chat Engine är ansluten som språkmodell för Summarize Paper Text.
Autentiseringsuppgifter krävs: Anslut era openAiApi-uppgifter i OpenAI Chat Engine (inte i Summarize Paper Text). - Koppla Iterate Paper Batches → Retrieve PDF File → Convert PDF to Text → Map Text Field → Summarize Paper Text.
Iterate Paper Batches skickar utdata både till Telegram Update Alert och Retrieve PDF File parallellt.
Steg 5: Konfigurera utdata-destinationer
Sammanfattningar lagras i Google Sheets och en Telegram-notis meddelar er när uppdateringarna är klara.
- Öppna Append to Sheets och behåll Operation inställd på
append. - Autentiseringsuppgifter krävs: Anslut era googleSheetsOAuth2Api-uppgifter i Append to Sheets.
- Ställ in Document ID till er Google Sheet-URL eller ert ID (för närvarande tomt).
- Ställ in Sheet Name till
paper research. - Mappa kolumner till värden: url →
{{ $('Iterate Paper Batches').item.json['output.articles'].pdf_link }}, title →{{ $('Iterate Paper Batches').item.json['output.articles'].title }}, summary →{{ $json.output.text }}, extracted date →{{ DateTime.now().format('yyyy-MM-dd') }}. - Öppna Telegram Update Alert och ställ in Text till
🚨Latest Summary Papers are updated on google sheets🚨 Happy learning!. - Ställ in Chat ID till ert Telegram-användar- eller grupp-ID (ersätt
[YOUR_ID]). - Autentiseringsuppgifter krävs: Anslut era telegramApi-uppgifter i Telegram Update Alert.
- Koppla Summarize Paper Text → Append to Sheets → Iterate Paper Batches.
[YOUR_ID] kommer arbetsflödet att misslyckas med att skriva resultat eller skicka aviseringar.Steg 6: Testa och aktivera ert arbetsflöde
Verifiera flödet från början till slut och aktivera det sedan för schemalagda körningar.
- Klicka på Execute Workflow för att köra ett manuellt test.
- Bekräfta att Append to Sheets lägger till rader med title, url, summary och extracted date.
- Kontrollera att Telegram Update Alert publicerar notifieringsmeddelandet i er chatt.
- Om resultat saknas, granska HTML-parsningen och PDF-länkvärdena som genereras av Extract Paper Entries.
- Växla arbetsflödet till Active så att Timed Automation Trigger kör det enligt schemat.
Felsökningstips
- Behörigheter i Google Sheets orsakar tysta fel oftare än man tror. Om rader inte dyker upp, kontrollera vilket Google-konto som är kopplat och att kalkylarket är korrekt delat.
- Om du använder Wait-noder eller extern rendering varierar processtider. Öka väntetiden om noder längre fram misslyckas på tomma svar.
- OpenAI-uppgifter och kvoter kan avbryta körningar mitt i en batch. Om sammanfattningar kommer tillbaka tomma, verifiera att din API-nyckel är giltig och att du inte har slagit i dagens rate limits.
Snabba svar
Räkna med cirka 30 minuter om du redan har dina konton och API-nycklar.
Nej. Du kopplar främst in uppgifter och väljer ditt kalkylark. Logiken är redan inbyggd i arbetsflödet.
Ja. n8n har ett gratis self-hosted-alternativ och en gratis provperiod på n8n Cloud. Cloud-planer börjar på 20 USD/månad för högre volym. Du behöver även räkna in OpenAI API-kostnader, som oftast ligger på några cent per paper beroende på längd.
Två alternativ: n8n Cloud (hanterat, enklast uppsättning) eller self-hosting på en VPS. För self-hosting är Hostinger VPS prisvärd och hanterar n8n bra. Self-hosting ger dig obegränsat antal körningar men kräver grundläggande serverhantering.
Ja, och det bör du. Du kan ändra schema-triggern så att den kör oftare eller mer sällan, byta arXiv-kategori i steget “Fetch arXiv Listings” och skriva om sammanfattningsprompten i kedjan “Summarize Paper Text” så att den ger bullets, en TL;DR eller ett strukturerat abstract. Många lägger också till extra kolumner i steget “Append to Sheets”, som “Use case”, “Prioritet” eller “Dela med”. Om Telegram blir för stökigt kan du stänga av noden “Telegram Update Alert” och bara använda kalkylbladet.
Oftast handlar det om behörigheter. Återanslut Google Sheets-uppgiften i n8n, bekräfta att du skriver till rätt kalkylark och flik, och kontrollera att det anslutna kontot kan redigera filen. Om du lägger till många rader i en körning kan Google också strypa anrop, så att sprida ut batchar (eller lägga in en kort väntan) hjälper.
Om du self-hostrar n8n finns ingen exekveringsgräns, så den praktiska gränsen är din server och API:ernas rate limits.
För det här use caset, oftast ja. Du hanterar flerstegsbearbetning (hämta listningar, parsa HTML, ladda ner en PDF, extrahera text, sammanfatta, lägga till i Sheets, notifiera), och n8n hanterar den typen av förgreningar och batchning snyggt. Zapier och Make kan göra delar av det, men PDF-till-text plus AI-kedjor blir ofta krångligt, dyrt eller skört när du skalar bortom en handfull papers. Dessutom bygger det här arbetsflödet på en community-nod (Decodo), vilket är mer naturligt i n8n än i de flesta no-code-verktyg. Om du bara behöver en enkel “skicka mig nya arXiv-länkar”-notis kan de verktygen fungera fint. Prata med en automationsexpert om du vill ha hjälp att välja.
När det här väl är igång växer ditt researchbibliotek tyst i bakgrunden. Du får sammanfattningarna, länkarna och historiken, utan den veckovisa stressen.
Kontakta oss
Hör av dig, så diskuterar vi hur just din verksamhet kan dra nytta av alla fantastiska möjligheter som AI skapar.