Behöver ert företag hjälp med att implementera AI? Kontakta oss och få prisoffert här →
AI Skolan
januari 22, 2026

Gemini AI till Google Docs, regler för ikonplacering

Rickard Andersson Partner, Nodenordic.se

Ikoner i verktygsfältet är den typen av detalj som ”ser okej ut” tills en intressent frågar varför Bakåt-knappen flyttade igen, eller varför Spara gömmer sig på fel sida. Sedan är du tillbaka i skärmdumpshelvetet, argumenterar utifrån minnet och tar om Apple HIG-regler du redan kan.

Det här drabbar produktdesigners först, om vi ska vara ärliga. Men design leads som försöker driva igenom konsekvens och mobilutvecklare som implementerar ännu en uppdatering av verktygsfältet känner också av det. Med den här Gemini Docs-automationen förvandlar du UI-skärmdumpar och ikonuppsättningar till tydliga placeringsrekommendationer som du kan dela.

Du får se vad workflowet gör, vad du behöver och hur det går från ”här är en skärm” till ”här är ikonernas roller, den rekommenderade ordningen och placeringsnoteringar som följer Apple HIG”.

Så fungerar den här automatiseringen

Här är hela workflowet som du kommer att sätta upp:

n8n Workflow Template: Gemini AI till Google Docs, regler för ikonplacering

Varför det här spelar roll: placering av verktygsfältsikoner fortsätter att glida

Om du bygger iOS-skärmar i någon vettig takt så staplas beslut kring verktygsfält snabbt på varandra. En skärm levereras med ikoner som är ”ungefär rätt”, sedan lägger nästa iteration till en åtgärd, sedan känns grupperingen fel, och sedan märker någon att primära åtgärder inte är konsekventa mellan flöden. Det jobbiga är att granskningen är repetitiv men ändå högrisk. En felplacerad ikon kan skapa friktion för användare, och den skapar också friktion i teamet: fler kommentarer, mer pingpong, fler ”kan du flytta den till trailing-sidan?”-meddelanden som sabbar dagen.

Friktionen byggs på. Så här faller det isär i praktiken.

  • Du granskar samma verktygsfältsmönster på flera skärmar, och det blir ungefär 2 timmar i veckan av små beslut.
  • Ikonernas intention går förlorad när skärmdumpar skickas via Slack eller mejl utan kontext, så utvecklare implementerar fel gruppering.
  • Apple HIG-tolkningar skiljer sig mellan personer, vilket gör att ”konsekvent” blir subjektivt.
  • Omordning baserat på användning händer sällan eftersom ingen har tid att diskutera det skärm för skärm.

Vad du bygger: skärmdump-till-HIG verktygsfältsrekommendationer i Google Docs

Det här workflowet börjar med en enkel inlämning: du skickar in en UI-skärmdump och den uppsättning verktygsfältsikoner du vill få granskad. Gemini analyserar skärmens kontext och klassificerar varje ikon i en roll (som primär åtgärd, navigering, bekräftelse eller systemliknande åtgärder). Därefter tillämpar workflowet strukturerad placeringslogik baserat på Apples Human Interface Guidelines och mappar ikoner till rätt verktygsfältszoner (leading, trailing, center, bottom eller systemstyrt). Sedan gör en andra AI-passering omordning baserat på förväntad användningsfrekvens så att de viktigaste åtgärderna hamnar där användare tittar först. Slutligen genererar workflowet felfria, strukturerade rekommendationer som du kan klistra in i dokumentation, dela med teamet eller spara för konsekvens mellan skärmar.

Workflowet startar med en formulärtrigger där du skickar in dina underlag. Gemini hanterar klassificering och omordningsbeslut, medan kodsteg tolkar AI-utdata till tillförlitlig JSON. Sista steget förvandlar det strukturerade resultatet till läsbar UI-vägledning som du kan föra över till Google Docs för delning och granskning.

Vad du bygger

Förväntade resultat

Säg att du granskar 10 skärmar i en sprint och att varje verktygsfält tar ungefär 20 minuter att diskutera, annotera och dubbelkolla när ändringar har landat. Det är runt 3 timmar fokus, utspritt över Slack-trådar och kommentarer. Med det här workflowet kan inlämningen av en skärm ta 2 minuter, sedan väntar du på AI-bearbetning och tolkning (ofta under 10 minuter), och du får en konsekvent placeringsrekommendation plus vägledning för omordning. Du fattar fortfarande slutgiltigt beslut, men du börjar inte från noll varje gång.

Innan du börjar

  • n8n-instans (prova n8n Cloud gratis)
  • Alternativ för self-hosting om du föredrar det (Hostinger fungerar bra)
  • Google Gemini för skärmdumpsförståelse och klassificering
  • Google Docs för att dela riktlinjer med teamet
  • Gemini API-nyckel (hämta den från Google AI Studio)

Svårighetsgrad: Medel. Du kopplar upp credentials, klistrar in prompts och verifierar tolkade JSON-utdata en gång.

Vill du att någon bygger detta åt dig? Prata med en automationsexpert (gratis 15-minuters konsultation).

Steg för steg

En formulärinlämning drar igång allt. Du laddar upp en UI-skärmdump och anger ikonerna (eller en ikonlista) du vill få utvärderade för skärmens verktygsfält.

Gemini klassificerar ikonernas intention. AI-agenten läser skärmdumpens kontext och tilldelar varje ikon en roll som navigering, primär åtgärd, bekräftelse eller systemnivåbeteende, så att du inte behöver gissa.

Regler för placering och ordning tillämpas. Ett tolkningssteg gör om AI-utdata till strukturerad JSON, och sedan prioriterar en omordningskedja ikonerna utifrån sannolik användningsfrekvens och Apple HIG-förväntningar.

Du genererar vägledning som går att dela. Den sista kedjan tar fram UI-vägledningstext (plus strukturerad output) som är redo att lägga in i Google Docs, skicka via mejl eller spara för återanvändning.

Du kan enkelt anpassa placeringsreglerna så att de matchar ert interna designsystem och behålla Apple HIG-mappningen som baslinje. Se hela implementationsguiden nedan för anpassningsalternativ.

Steg-för-steg-guide för implementering

Steg 1: Konfigurera triggern för formulärinskick

Det här arbetsflödet startar när en användare skickar in ett formulär med en skärmbild och ikonfiler.

  1. Lägg till noden Form Submission Trigger som trigger.
  2. Ställ in Form TitleIcon submission.
  3. Ställ in Form DescriptionPlease upload: - the screen; - the set of icons for the screen..
  4. Under Form Fields lägger ni till ett filfält med etiketten The screen (en fil, obligatoriskt).
  5. Lägg till ytterligare ett filfält med etiketten Icons (obligatoriskt, flera filer kan tillåtas om ni vill).

Säkerställ att fältetiketterna matchar exakt (t.ex. The screen och Icons), eftersom AI-prompten i Icon Role Classifier refererar till dem direkt.

Steg 2: Anslut Google Gemini-inloggningsuppgifter

AI-komponenterna använder Gemini-chattmodeller för klassificering, omordning och generering av vägledning.

  1. Öppna Gemini Chat Engine och välj era Google Gemini-inloggningsuppgifter.
  2. Credential Required: Anslut era googlePalmApi-inloggningsuppgifter.
  3. Öppna Gemini Reorder Engine och välj samma Google Gemini-inloggningsuppgifter.
  4. Credential Required: Anslut era googlePalmApi-inloggningsuppgifter.
  5. Öppna Gemini Chat Model Core och välj samma Google Gemini-inloggningsuppgifter.

Credential Required: Anslut era googlePalmApi-inloggningsuppgifter. Dessa används av AI-modellkopplingarna för Icon Role Classifier, Reorder LLM Chain och Generate UI Guidance—inloggningsuppgifter måste läggas till på Gemini-modellnoderna, inte på AI chain/agent-noderna.

Steg 3: Konfigurera klassificering av ikonroller och parsing

Det här steget klassificerar ikoner efter roll och extraherar strukturerad JSON för vidare bearbetning.

  1. Öppna Icon Role Classifier och ställ in Text till den angivna prompten, inklusive uttrycken för de uppladdade filerna.
  2. Bekräfta att uttrycksreferenserna inkluderar {{ $json['The screen'].filename }} och {{ JSON.stringify($json.Icons) }}.
  3. Verifiera att Gemini Chat Engine är ansluten som språkmodell för Icon Role Classifier (inloggningsuppgifter ställs in på Gemini Chat Engine).
  4. Öppna Parse Categorizer Output och behåll JavaScript Code som det är för att ta bort code block-omslag och parsa JSON.
  5. Säkerställ att körflödet kopplar Form Submission TriggerIcon Role ClassifierParse Categorizer Output.

⚠️ Vanlig fallgrop: Om Icon Role Classifier returnerar text som inte är JSON kommer Parse Categorizer Output att fallera. Låt radens ”Output strictly in JSON format” i prompten vara intakt.

Steg 4: Konfigurera omordning av ikoner och parsing

Arbetsflödet omordnar ikoner inom placeringar baserat på användningsfrekvens och tolkar resultatet inför det avslutande vägledningssteget.

  1. Öppna Reorder LLM Chain och ställ in Text till prompten som innehåller placeringsarrayerna.
  2. Behåll placeringsuttrycken intakta: {{ $json.placement.Left }}, {{ $json.placement.Right }}, {{ $json.placement.Center }}, {{ $json.placement.Bottom }}, {{ $json.placement["System-decided"] }}.
  3. Verifiera att Gemini Reorder Engine är ansluten som språkmodell för Reorder LLM Chain (inloggningsuppgifter ställs in på Gemini Reorder Engine).
  4. Öppna Parse Reorder Result och behåll JavaScript Code som tar bort code block-markörer och parsar JSON.
  5. Säkerställ att körflödet kopplar Parse Categorizer OutputReorder LLM ChainParse Reorder Result.

Steg 5: Konfigurera generering av UI-vägledning

Det här steget genererar det slutliga strukturerade designförslaget baserat på Apple HIG och den kategoriserade ikondata.

  1. Öppna Generate UI Guidance och ställ in Text till den angivna prompten.
  2. Bekräfta att det inbäddade uttrycket finns med: {{ $('Icon Role Classifier').item.json.output }}.
  3. Verifiera att Gemini Chat Model Core är ansluten som språkmodell för Generate UI Guidance (inloggningsuppgifter ställs in på Gemini Chat Model Core).
  4. Säkerställ att körflödet kopplar Parse Reorder ResultGenerate UI Guidance.

Steg 6: Testa och aktivera ert arbetsflöde

Validera hela flödet med ett verkligt formulärinskick innan ni går live.

  1. Klicka på Execute Workflow och skicka in formuläret från Form Submission Trigger med en skärmbild och en uppsättning ikoner.
  2. Bekräfta att Icon Role Classifier producerar JSON i output, och att Parse Categorizer Output returnerar screen, groups och placement.
  3. Kontrollera att Reorder LLM Chain returnerar JSON och att Parse Reorder Result parsar den till strukturerade fält.
  4. Verifiera att Generate UI Guidance matar ut ett strukturerat designförslag baserat på Apple HIG.
  5. Växla arbetsflödet till Active för att aktivera användning i produktion.
🔒

Lås upp fullständig steg-för-steg-guide

Få den kompletta implementeringsguiden + nedladdningsbar mall

Felsökningstips

  • Google Gemini-credentials kan gå ut eller få fel scope. Om klassificeraren plötsligt returnerar tom output, kontrollera först Gemini API-nyckeln och projektbehörigheter i dina Google AI credential-inställningar.
  • Om du förlitar dig på AI:s ”väntetid” implicit så varierar processtider med bildstorlek och modellbelastning. När efterföljande steg fallerar på saknade fält, kör om med mindre bilder eller lägg till en längre väntan innan tolkning.
  • Standardprompts i AI-noder är generiska. Lägg in er app-terminologi (vad ni kallar primära åtgärder, destruktiva åtgärder och bekräftelseflöden) tidigt, annars kommer du lägga tiden på att skriva om rekommendationerna.

Snabba svar

Hur lång tid tar det att sätta upp den här Gemini Docs-automationen?

Cirka 30 minuter om din Gemini-nyckel och ditt Google-konto är redo.

Krävs det kodning för den här automatiseringen för placering av verktygsfältsikoner?

Nej. Du kommer mest att koppla credentials och justera prompts. Kodnoderna ingår redan i workflowet.

Är n8n gratis att använda för det här Gemini Docs automation-workflowet?

Ja. n8n har ett gratis self-hosted-alternativ och en gratis provperiod på n8n Cloud. Cloud-planer börjar på 20 USD/månad för högre volym. Du behöver också räkna in Gemini API-kostnader, som beror på bildstorlek och anropsvolym.

Var kan jag hosta n8n för att köra den här automatiseringen?

Två alternativ: n8n Cloud (hanterad, enklast att komma igång) eller self-hosting på en VPS. För self-hosting är Hostinger VPS prisvärd och hanterar n8n bra. Self-hosting ger dig obegränsat antal körningar men kräver grundläggande serverhantering.

Kan jag anpassa det här Gemini Docs automation-workflowet för andra use case?

Ja, och det bör du förmodligen. Du kan justera prompten för ikonroller i agenten Icon Role Classifier och sedan finjustera omordningsbeteendet i Reorder LLM Chain. Vanliga justeringar är att lägga till egna regler för ”destruktiva åtgärder”, att tvinga fram vänster/höger-konventioner för din app och att ändra formatet på den slutliga vägledningen så att den matchar din checklista för designgranskning.

Varför misslyckas min Gemini-anslutning i det här workflowet?

Oftast beror det på en ogiltig eller utgången API-nyckel, eller att nyckeln är kopplad till ett projekt som saknar rätt AI-åtkomst. Uppdatera Gemini-credentials i n8n och kör sedan igen med en mindre testskärmdump för att bekräfta att modellen kan hantera bilder. Om fel bara uppstår vid hög belastning kan du slå i rate limits, så det hjälper att sprida ut anropen.

Vilken volym kan det här Gemini Docs automation-workflowet hantera?

Med n8n Cloud Starter kan du köra några tusen körningar per månad, vilket vanligtvis räcker gott för designgranskningsworkflows.

Är den här Gemini Docs-automationen bättre än att använda Zapier eller Make?

Ofta, ja, eftersom den här typen av flöde behöver flera AI-steg, tolkning och förgrening som lätt blir klumpigt (och dyrt) någon annanstans. n8n trivs med mönster som ”agent → tolka → kedja → tolka → generera”, och du kan self-hosta om du vill ha obegränsat antal körningar. Zapier eller Make kan fortfarande fungera om du håller det väldigt enkelt, som ”skicka in skärmdump → få ett svar”. Men när du bryr dig om strukturerad JSON och förutsägbart format upplevs n8n ofta som mindre skört. Prata med en automationsexpert om du vill ha en snabb rekommendation baserat på din volym och ert arbetssätt.

När det här är på plats slutar du att förklara verktygsfältsregler på varje skärm. Workflowet ger dig konsekventa riktlinjer som är redo att delas, och du får tillbaka granskningstid för de beslut som faktiskt kräver en människa.

Kontakta oss

Hör av dig, så diskuterar vi hur just din verksamhet kan dra nytta av alla fantastiska möjligheter som AI skapar.

×

Använd mall

Få direkt tillgång till denna n8n-arbetsflödes JSON-fil

Launch login modal Launch register modal