我做了一个 Skill,让本地Gemma4模型也能用上大厂 UI设计技巧
首页 / AI工具 / 文章

我做了一个 Skill,让本地Gemma4模型也能用上大厂 UI设计技巧

把本地部署的 Gemma 4、开源的 design.md 设计参考体系,以及我自己做的 Skill 调用链路,真正串成了一套能日常使用的工作流。本地模型负责高频执行,design.md 负责提供 UI 设计约束,Skill 负责把整个过程自动化

原创 超级猛 2026年4月9日 13:12

最近我把几样比较火的技术真正接到了一起,也把它们落成了一条能日常使用的 AI 页面生成工作流。

简单说,就是把本地部署的 Gemma 4、开源的 design.md 设计参考体系,以及我自己做的 Skill 调用链路,真正串成了一套能日常使用的工作流。

它最让我满意的地方,不是又跑出了一个 demo,而是这次三层能力终于接上了:本地模型负责高频执行, design.md 负责提供 UI 设计约束,Skill 负责把整个过程自动化。页面生成这件事,也第一次从“试试看”慢慢变成了“可以稳定复用”。

这篇文章我想重点讲的,也正是这三层价值:

  • 本地模型
  • UI生成能力
  • 自动化调用。

它们单独看都不新鲜,但真正接起来之后,整个工作流的效率、稳定性和 token 使用方式都会不一样。


先把 AI 做页面那股“通用模板味”解决掉#

我一直觉得,AI 生成页面最大的问题,从来不是不会写 HTML,而是太容易写出一份“完整但普通”的东西:结构都有,模块也齐,但就是不像一个真实品牌会发出来的页面。

后来我看到 VoltAgent/awesome-design-md 这个开源项目,感觉一下就对了。它把很多品牌和厂商的设计语言整理成可供 AI 参考的 DESIGN.md ,这比一句“做高级一点”“做得像大厂官网一点”有效得多。

但它也有一个很现实的问题: 流程偏手动

你还是要自己挑风格、找厂商、看设计描述,再把这些内容塞回当前任务里。做一次没问题,做多了就会发现,这一步很打断节奏。

所以我后来没有重新发明什么方法,而是把这套能力做成了自己的 Design System Picker Skill。

它做的事情很简单:把“我想要更像 Stripe 的开发者产品感”、“我想要 Claude 那种克制、温和的表达”、“我想要更偏 Apple 的简洁科技感”这种模糊要求,先映射到对应的设计系统参考,再自动送进后面的生成链路。

这一步一旦 Skill 化,意义就变了。

design.md 不再只是一个临时查阅的资料库,而是一个可以稳定调用、反复复用的 UI 生成能力。

这套 Skill 我也准备在下一篇文章里免费放出来,等我把跨平台兼容性再测稳一点、确认不同环境下都没问题之后,就会整理出来分享。

下面是用这套流程生成的3个Demo页面

1、Claude风格的网站首页#

图片
图片

2、Stripe风格的网站首页#

图片
图片

3、苹果风格的【超级猛】个人网站首页#

图片
图片


为什么 Gemma 4 是我现在最满意的本地模型#

这次我的环境很直接: Mac Studio M3 Ultra 96G

模型用的是 google/gemma-4-26b-a4b

根据 Google 在 2026 年 4 月 2 日公开发布 Gemma 4 时给出的信息,这一代强调的是多模态、长上下文和开发者可集成性。官方资料提到,Gemma 4 的大模型支持最高 256K 上下文,覆盖 140+ 种语言;而 26B A4B 这个版本是 MoE 结构,模型卡给出的信息是总参数约 25.2B ,每个 token 推理时激活约 3.8B 参数。

对我来说,参数不是最重要的。更重要的是,它在本地可用性和结果质量之间找到了一个很实用的平衡。

至少到目前为止,Gemma 4 是我在这台 Mac Studio 上跑出来最满意的模型。它不是那种“演示一下很惊艳,真正做事就不稳定”的类型,而是真的能接住日常任务:结构化输出比较稳,页面生成不会太飘,配合设计约束之后也能产出更像样的结果。

运行时我看了一下机器状态,GPU 基本能冲到接近满载,这也说明本地模型一旦进入实战,硬件压力是很真实的。

图片
图片


本地模型的边界也很清楚:长会话更吃力#

如果会话太长、上下文塞得太多、分支太杂,本地模型的问题就会慢慢出来:更吃性能,也更容易出现幻觉、漂移和“前面说过,后面又忘了”的情况。

所以我现在对 Gemma 4 的定位很明确:

它更适合处理较短上下文、边界清晰、可拆解的任务,而不是硬扛一整个超长会话。

这也是我现在更推荐的工作方式:先用 API 模型把复杂任务的大方向跑通,把目标、结构和关键约束理清;然后把那些高频、小块、重复但又要求不能太差的任务,尽量交给 Gemma 4 去处理。

这样做其实非常划算。复杂推理留给更适合的模型,日常执行交给本地模型,既能把成本压下来,也能把工作流跑顺。


真正有价值的,是三层能力终于接成了一条线#

这次我确实也跑了3个单页面 demo,说明这套流程已经不只是概念,而是能产出结果。

但 demo 不是重点。

重点在于,这次我终于把三层能力接成了一条线。

  • 第一层是本地模型,也就是 Gemma 4。它解决的是“不是所有任务都值得联网、都值得烧昂贵 token”这个问题。
  • 第二层是 UI 生成能力,也就是 design.md 。它解决的是“为什么 AI 能写完整页面,却总写不出真实产品感”的问题,因为真正缺的往往不是代码,而是设计约束。
  • 第三层是自动化调用,也就是 Skill 体系。它解决的是“明明知道正确方法,但每次都要手工重复一遍”的问题。只有把这部分固化下来,它才可能真正进入日常生产流。

当这三层接起来之后,页面生成才真正从“让 AI 帮我写一份 HTML”,变成“让 AI 按一套设计语言替我跑出第一版可用结果”。


这段时间我越来越在意:高效使用 token#

这段时间我最大的体会是,模型不一定非得只靠一个,关键是能不能把它们配合起来,把一件事情用更少的 token 做完。

我现在越来越在意的,不是“这次我用了哪个最强模型”,而是“这个任务有没有被拆到最合理,每一步有没有交给最合适的模型”。

复杂规划、长上下文、高稳定性任务,先交给 API 模型;本地 Gemma 4 则去承接那些短链路、可拆解、日常高频的工作。

这样用下来,我越来越确认一件事:高效使用 token,本身就是一项非常重要的技能。

最少的 token,实现最佳的效果。我知道token会越来越便宜,但我要表达的是一种精准制导,而非狂轰乱炸一顿乱问。

谁越早形成这种意识,谁就越容易把模型真正接进长期工作流,而不是停留在“今天试一个新模型、明天试一个新提示词”的热闹阶段。


最后想说#

如果要我用一句话总结这次实践,那就是:真正产生价值的,不是 Gemma 4、 design.md 或 Skill 中的任何一个单点,而是本地模型、UI 生成能力和自动化调用这三层能力接起来之后,开始稳定地服务真实工作。

这比单独跑出几个好看的 demo 更重要。


关注我,下一篇文章邀请你体验这个skill

作者提示: 个人观点,仅供参考

继续滑动看下一个

超级猛

向上滑动看下一个


AI 总结#

我做了一个 Skill,让本地Gemma4模型也能用上大厂 UI设计技巧#

核心思想#

这篇文章介绍了作者将本地部署的 Gemma 4 模型、开源的 design.md 设计参考体系和自定义的 Skill 调用链路整合为一套可日常使用的 AI 页面生成工作流。通过三层能力的协同——本地模型负责高频执行、design.md 提供设计约束、Skill 实现自动化——页面生成从”试试看”变成了”可以稳定复用”的生产工具。


我的理解#

这篇文章最有价值的地方,不在于展示了一个新的技术demo,而在于它提出了一种非常务实的 AI 工作流思路:不追求用一个模型解决所有问题,而是通过组合不同层级的能力(本地模型 + 设计知识 + 自动化),形成一个既高效又可控的生产 pipeline。这种分层协作的思路,其实比单纯追求”最强模型”更有实际意义。


主要内容#

问题背景:AI 生成页面的”通用模板味”#

AI 生成页面最大的问题不是不会写 HTML,而是太容易写出”完整但普通”的页面:结构都有,模块也齐,但就是不像真实品牌会发布的页面。缺的不是代码能力,而是具体的设计约束。

解决方案:三层能力整合#

第一层:design.md 设计参考体系#

  • 来自 VoltAgent/awesome-design-md 开源项目
  • 将各大品牌和厂商的设计语言整理成可供 AI 参考的 DESIGN.md
  • 比”做高级一点”这种模糊提示有效得多
  • 但原项目流程偏手动,需要自己挑风格、找厂商、看描述

第二层:Design System Picker Skill#

  • 作者自己开发的 Skill,将手动流程自动化
  • 把模糊需求(“更像 Stripe 的开发者产品感”、“Claude 那种克制温和的表达”、“Apple 的简洁科技感”)映射到对应的设计系统参考
  • 自动送入后续生成链路
  • 让 design.md 从临时查阅的资料库变成可稳定调用、反复复用的 UI 生成能力

第三层:本地 Gemma 4 模型#

硬件环境:

  • Mac Studio M3 Ultra 96G
  • 使用 google/gemma-4-26b-a4b 模型

Gemma 4 的特点:

  • MoE 结构,总参数约 25.2B,每个 token 推理时激活约 3.8B 参数
  • 支持最高 256K 上下文,覆盖 140+ 种语言
  • 在本地可用性和结果质量之间找到了实用平衡
  • 结构化输出稳定,页面生成不会太飘
  • 配合设计约束后能产出像样的结果
  • GPU 基本能冲到接近满载

Gemma 4 的边界:

  • 长会话更吃力,上下文太多、分支太杂时容易出现幻觉、漂移
  • 更适合处理较短上下文、边界清晰、可拆解的任务

推荐的工作方式#

  1. 先用 API 模型:把复杂任务的大方向跑通,理清目标、结构和关键约束
  2. 再用本地模型:把高频、小块、重复但要求不能太差的任务交给 Gemma 4
  3. 收益:复杂推理留给更适合的模型,日常执行交给本地模型,既能压低成本,也能跑顺工作流

三层能力的价值#

层级作用解决的问题
本地模型 Gemma 4高频执行不是所有任务都值得联网、都值得烧昂贵 token
UI 生成能力 design.md提供设计约束为什么 AI 能写完整页面,却总写不出真实产品感
自动化调用 Skill 体系固化流程明明知道正确方法,但每次都要手工重复一遍

我的理解#

这篇文章提出的”三层架构”思路非常值得借鉴。它不是在追求某个单一维度的最优(比如最强的模型、最全的设计库),而是在构建一个系统:

  1. 分层决策:把”做什么”(设计约束)和”怎么做”(代码生成)分开,把”想清楚”(API模型)和”勤动手”(本地模型)分开
  2. 能力固化:通过 Skill 把最佳实践固化下来,避免每次都要重新思考流程
  3. 成本意识:明确意识到 token 也是成本,高效使用 token 本身就是一项重要技能

这种思路其实可以泛化到很多 AI 应用场景,而不仅仅是页面生成。


总结#

这篇文章展示了一个非常务实的 AI 工作流实践:通过整合本地 Gemma 4 模型、design.md 设计约束和自定义 Skill 自动化,形成了一套可日常使用的页面生成 pipeline。作者强调真正有价值的不是任何一个单点技术,而是三层能力接起来之后能稳定服务真实工作的系统。


我的扩展总结#

从”模型优先”到”系统优先”的范式转变#

这篇文章最让我认同的是它体现了一种从”模型优先”到”系统优先”的思维转变。很多人在做 AI 应用时,第一反应是”我要找一个最强的模型”,但这篇文章告诉我们:比单个模型更重要的是系统设计

这让我想到软件工程的发展历史:早期我们追求单个程序员的能力,后来发现真正能规模化产出高质量软件的,是好的架构设计、开发流程和协作机制。AI 应用的发展可能也在走类似的路径。

关于”高效使用 token”的深层思考#

作者提到”高效使用 token,本身就是一项非常重要的技能”,这个观点非常有启发性。这里的”高效”其实有几层含义:

  1. 经济效率:用更少的钱办成事
  2. 时间效率:本地模型可能更快,不用排队等 API
  3. 隐私安全:敏感数据不需要上传到第三方
  4. 可靠性:不依赖网络连接,不会因为 API 故障而中断

但更深层的是,这是一种”精准制导”vs”狂轰乱炸”的思维差异。当我们习惯了”有问题就问大模型”时,往往会忘记思考:这个问题真的需要大模型吗?有没有更轻量的解决方案?

Skill 作为”知识载体”的价值#

作者把 design.md 从一个”资料库”变成一个”可调用的能力”,这个转变很关键。这让我想到:Skill 不仅仅是自动化脚本,它更是一种知识载体

当我们把”如何挑选设计风格”、“如何应用设计约束”这些知识编码到 Skill 中时,这些知识就从”某个人的经验”变成了”可复用的系统能力”。这可能是 Skill 体系最有价值的地方——它让知识可以被固化、被传播、被迭代。

对未来工作流的想象#

沿着这个思路,我们可以想象未来的 AI 工作流可能是这样的:

  1. 任务分解层:用大模型把复杂任务拆成小任务
  2. 能力选择层:根据任务特点选择最合适的模型/工具
  3. 知识约束层:注入领域知识、设计规范、质量标准
  4. 执行层:用本地或云端模型执行具体任务
  5. 验收层:用另一套 Skill 检查输出质量

这篇文章其实已经在做这样的尝试,只是还比较初步。


本文档基于 https://mp.weixin.qq.com/s/7tctB4Iubfrg3dbPFKmiwQ 整理总结,并加入了扩展理解


原文链接:https://mp.weixin.qq.com/s/7tctB4Iubfrg3dbPFKmiwQ