想建个网站养老却没头绪？以nanobanana为例的超全灵感与案例分享

https://mp.weixin.qq.com/s/2AG_41e_gw2zlQNwJffI_A

继续分享找需求系列，上次发过一篇这个：

做个网站养老之发现简单、实用、易复制的需求的方法

里面有一个Claude的“案例库”：

哪怕你只学会了简单的html生成术，你也能做出很多有意思的应用出来，所以我会经常把这个页面发给跟我学陪跑的同学，找找灵感。

google的Nano-Banana 发出来之后，我看到它也有一个类似的案例库，甚至比Claude更有价值。

就是aistudio里面的这个build，然后你会看到它能实现的各种应用示例。它可以直接在线修改，下载源码直接部署，妥妥的拎包入住了，我们拿这个「Past Forward」的应用来举例。

功能就是用户上传照片，AI生成复古宝丽来风格图像，模拟不同年代风格。

我们可以在左侧直接在线AI编程，比如我要它文案都改成中文，设计风格变成新粗野主义（Neo-Brutalism）。

同样，我们也可以直接把代码下载下来在本地用 AI 编程工具运行并调试。

比如我用trae来修改，运行，我们需要在.env.local文件里输入对应的API的key。

当前默认是google官方的，如果你要改成第三方的（目前看到的第三方的价格约￥0.07~￥0.14/次），直接让ai给你改即可。

这是我改到第三方API平台之后一次性消耗的积分。

提示词在这个页面里，你可以自己定义相关信息，完整提示词如下：

「Reimagine the person in this photo in the style of the ${decade}. This includes clothing, hairstyle, photo quality, and the overall aesthetic of that decade. The output must be a photorealistic image showing the person clearly」

翻译就是：将照片中的人重新想象成${decade}年代的风格，包括服装、发型、照片质量和那个年代的整体美感。输出必须是清晰展示人物的逼真照片。

改提示词就是「改应用」，比如我们扩展下，是不是可以：

– 尝试不同的发型或者叫自动推荐最适合你的发型。

– 将您的宠物变成卡通人物甚至真人。

– 创造一个幻想版的自己。

– 根据您的照片设计一位超级英雄。

– 将自己置身于著名的历史事件中。

– 生成一个自定义的视频游戏头像。

买个域名，部署到服务器上，是不是就变成了一个你上传自己的照片，然后直接给你生成当前最流行或者最适合你脸型的六款发型了，选一个喜欢的，跟你的托尼小哥说：我就要这个发型。

做个小程序，一次9.9，你还能挣3块（不算其他成本）。

你要是看不上，我再给分享点思路，我为什么特别喜欢看到生图技术的进步，就是因为基于这个玩意儿搞出来的衍生品太好玩了，如果把我做的这些算到用 AI 写 100 个有用的应用要多久？里，我直接就打满了……

类似的就多了，什么纹身效果图～

用户上传自己想纹身的身体部位图，再上传一张想要纹上去的图片或者随机推荐，一次也可以生成多张。

试妆，换装（给不会穿搭衣服的人根据自己的身材相貌搭配合适的衣服，可以根据场合等等）

基本上就是一套代码换个皮肤跟提示词就完事儿了～

– 传一张你的照片+9张不同地点的照片（也可以是餐厅等其他任何地方），直接就生成你跟这些地方的合影九宫格。（当然也可以直接输入想去的地方或者随机）

提示词：图1的人物坐在图2位置微笑着用餐。（这个餐厅的照片是我从小红书上搜餐厅复制的别人的……），就可以生成这样的图：

要是我们再用上图生视频～就是探店系列了……

很多原理都是一样的，包括我之前一键生成，让你“活在名画里”。

还有布料效果图～

除此之外，我们再看看aistudio案例库还有些什么～我挑几个拆一下～

– GemBooth：通过摄像头实时生成AI特效图像，使用原生图像模型。提供实时个性化视觉特效，增强互动性。用到的能力- Gemini 2.5 Flash Image：实时图像生成与角色一致性，支持摄像头输入。

可以生成一个gif动画～

– Home Canvas：拖放产品图像到用户个人空间（如家居场景）进行可视化。帮助用户预览产品效果，降低购买决策难度。

用到的能力：

Gemini 2.5 Flash Image：图像编辑与生成，融合用户上传的房间照片与产品图像。

Gemini 2.5 Flash-Lite：轻量化处理，优化移动端AR渲染。

多模态能力：结合文本提示（如“现代风格”）进行场景优化。

把左边的拖到右侧的任意位置～

– Pixshop：AI照片编辑器，通过文本提示修图、应用创意滤镜、专业调整。简化专业图像编辑，降低技术门槛。

用到的能力：

Gemini 2.5 Flash Image：图像编辑与生成，支持角色一致性。

多模态能力：文本提示驱动图像处理（如“增强亮度”）。

– Chat with Docs：通过URL Context工具，与Gemini交互，快速理解Gemini API文档。降低API学习曲线，提高效率。

用到的能力：

Gemini 2.5 Flash：文本生成与理解，解析URL中的API文档。

URL Context：处理外部文档内容，生成自然语言解答。

这个值得看一下的，可以直接利用 AI 的能力做一个建议的垂类知识库，比如为企业提供内部文档查询工具。

– VibeCheck：批量测试视觉输出提示，验证AI生成效果。优化提示设计，减少试错时间。

用到的能力：

Gemini 2.5 Pro/Flash：图像生成与文本处理，批量生成视觉输出。

代码生成：自动化测试脚本生成。

– Infinite Wiki：生成动态wiki，每个词语链接到实时生成的描述。提供无限扩展的知识库，简化信息检索。

用到的能力：

Gemini 2.5 Flash-Lite：轻量化文本生成，实时创建wiki内容。

多模态能力：结合文本与超链接生成动态内容。

这个也非常有意思！

– Gemini OS功能：模拟动态生成的用户界面，基于用户交互生成UI。

用到的能力：

Gemini 2.5 Flash-Lite：生成式UI，动态生成交互界面。

多模态能力：结合文本与视觉输入生成UI。

后面还有一个叫Gemini 95的，也是类似的界面实现。

– Live Audio：实时语音聊天，3D视觉随对话动态反应。

用到的能力：

Gemini 2.5 Flash Audio：实时语音处理。

Live API：支持3D视觉与语音同步。

就是一个实时对话的，可以用来当虚拟人陪伴，学英语讲故事都行，界面挺科幻的。

– MCP Maps 3D：通过自然语言生成3D地图，结合Gemini与MCP工具。快速生成3D地图，降低空间设计成本。

用到的能力：

Gemini 2.5 Flash：文本处理与地图生成。

Google Maps API：提供地图数据与3D渲染。

MCP：增强空间数据处理。

– Tiny Cats：以可爱猫咪插图讲解复杂话题。灵感就是可以开发儿童教育APP，结合AI生成趣味科普内容。为科普平台提供AI讲解工具。同样的，我们也可以用这个方法来做公众号或者短视频的素材内容。

用到的能力：

Gemini 2.0 Flash：文本生成与图像生成。

Native Image Gen：生成猫咪插图。

– Magical GIF Maker：将文本提示转为动画GIF。开发营销GIF生成工具，快速生成品牌动画。为社交平台提供GIF创作插件。

用到的能力：

Native Image Gen：生成动画GIF。

Gemini 2.5 Flash：文本提示驱动图像生成。

强烈建议把案例里的每一个都点开体验体验，不光可以看到别人做了什么，更方便去理解这个「技术的边界」。

大部分人都是看个热闹，自娱自乐一下，剩下的一小部分人知道如何用这个结合到自己的业务或者吃到这波流量去，看到别人的案例或者社交媒体上的需求马上就知道如何利用这个「技术」来举一反三了。所以有时候带着去挣钱或者搞成产品的角度去体验，感受会有很大的不同。

哪怕光一个合照环节都可以延伸出无数个细分～情侣纪念照生成、宠物与主人合影、已故亲人”重聚”照片、明星粉丝合照等等。

当然，即便看到这里，依然会有很多人嗤之以鼻，说：就这？我随便用个 AI 工具做出来不香么？还要花钱来找你这里做的？

别人“傻”到投广告去抢这个词～下个月数据更新的时候，我们会看到这个山寨网站会有多少流量～

再想想上一次4o画图惊艳全球的时候，光一个吉卜力图片转换，很多人就做了很多产品～吃到了很多红利。

总有人像狗一样用他灵敏的嗅觉到处抓机会，同样也有人永远站在旁边各种看不上。特别像最近又因为 vibe coding 吵起来的所谓正统程序员和只会用AI编程的，核心矛盾就是双方认知上的“傲慢”——觉得自己了解的代表全部，别人用的工具或方法不符合自己的预期就开喷。

永远都是那些能快速适应、灵活运用新工具的人，能抓住时间窗口获得先发优势。

🙏感谢捧场。

https://mp.weixin.qq.com/s/2AG_41e_gw2zlQNwJffI_A