AI 产品沉思录：使用篇

https://mp.weixin.qq.com/s/GzvOjrE69z1zykTFhCtEDQ

这一年多来，我坚持的最久的事情应该就是更新《 AI 日报》了，除了个别时间实在搞不过来，说日更了三百多天也不过份。

倒也没挣什么钱，但坚持一件事情必须靠正反馈来支撑，挣钱不算，那就要强行指定一个，比如近一万的关注，认识了一些人，更要紧的是实实在在的体验了各种各样的AI产品。

AI相关产品更新太快，我也跟着一直在更新，所以也乐于隔三差五的记录下当时当刻的想法。所以，今天又来碎碎念了……

分两部分，这篇主要讲我怎么用，下一篇再讲怎么做。

几个目前用的比较多几个AI相关的产品：

1，ChatGPT类

彻底被ChatGPT“伤害”了，主动送了三次钱，全被封号了（还没退钱！），现在只用它的 API + 第三方的套壳工具。

客户端是「Opencat」：这个我是付了费升级到pro版本的，68块，可以多个设备同步。我主要用来通过不同的AI角色来进行比较长的对话，包括在做一些应用的时候，都会在这里进行prompt的效果测试，响应快，随开随用。

浏览器插件用的是「Glarity」：也是另一个高频使用的工具，在浏览网页的时候会用它来做一些总结（包括一些视频网站等），和双语翻译。

这两个产品的「成功」某种程度上就是够早上线，第一时间吃到红利。哪怕opencat的作者也在产品发布没多久之后在他社交媒体上说：

「OpenCat 次日留存率 62%，可以说是我数据最好的产品了，但是我一点感受不到兴奋和鼓舞。这是我做的最没技术含量或者说没有我个人烙印的产品了，就是一个 api wrapper 而已。我只感受到了热点的力量，没有感受到我的力量。这种感觉让我很是迷茫。@waylybaye」

但转念一想，能够第一时间发布让用户体验到时下最火的AI，何尝不是很好地解决了用户需求，按现在流行的说法，就是找到了PMF(产品市场契合度)呢？所以，即便第一版本都很「粗糙」，就一个 UI + Key，依然获得很多用户都喜欢和推荐。

哪怕是现在，这个赛道依然卷的厉害，五花八门的，很多后来者，功能也丰富（复杂）了很多。当然这也符合很多产品演进模式：从一个简单功能进化成复杂的全家桶。

大概是两种形态：一个是横向的聚合各家大模型，另一个就是纵向的拓展，加入除了聊天之后的很多其他AI相关的工具。

截了两类代表的图⬆️

这里有个商业模式简单来说就是挣差价，简单来说就是我用200块钱每个月从官方能买到对应的token量足以覆盖住30个订阅用户（比如10元/每月），订阅时间越长，盈利空间可能就越大，因为这个就跟很多人「知识付费」、「健身房办卡」一样，钱是花了，课却没上几节。

同样的，用这种也有个风险，因为你自己的key也有可能被产品反撸，毕竟这样更「挣钱」。

这类型的就有个专有名词，叫「套壳」，发展到现在门槛已经相当的低了，甚至UI界面都有很多用户体验做的很好的开源作品，也正如此，这个路径下就有很多聪明人顺其自然的做了或者准备好了画图的Midjourney套壳，音乐生成的sunoAI套壳，甚至还没发布的sora都万事俱备只欠API了。

虽然OpenAI的CEO奥特曼几个月前就说过「套壳ChatGPT注定消亡」，但目前看来更像我在一期播客节目里听到Perplexity的CEO说的这句话：「拥有十万用户的套壳产品比拥有自有模型却没有用户更有意义」。

2，国内的

月之暗面的kimi.ai应该算是我最近一个月使用频次比较高的产品了，用的最多的功能就是联网、上传文档，归纳总结。

这种支持100mb的文档解读还免费，那基本上就没有chatpdf这类产品什么事儿了。（有意思的是，貌似从它开始国内各大模型公司都开始卷超长上下文了……）

这倒是让我总结了条经验，就是不能重仓未来可能财大气粗的大厂也会做的应用场景，因小步快跑吃到的红利（大量用户）一定要快速拓展更多用户场景，价值最大化。

另一款国内的大模型产品是阿里系的，通义千问+通义听悟。

我一般用通义千问来解图，特别适合给图片创造出「原创」的文本，它能拯救你匮乏的语言。

用通义听悟拆解录音（比如播客，会议），效率高太多了，还能丰富你「可搜索」的知识库。

3，画图的

Midjourney 这个应该是截止到目前续费持续最久的（30美金/月），从体验到质量应该算是画图届顶流了。去年的一篇百万+的文章也是因为写它带来的，从这个角度来看，它带来的收入已经足够覆盖为它付出的成本了。

它能干的事儿就多了，公众号配图，长的，方的，logo，壁纸，插画各种风格，要啥有啥。

甚至还可以用它做表情包，提交到微信表情商店。

除了这个商业化的Midjourney，还有一个开源的 Stable Diffusion，老实讲，对大部分人来说门槛有点高，不光对你设备有要求，动手能力也需要，相对mj优势就是免费，你要是乐于折腾就可以玩一下ComfyUI，简单来说就是更先进的Stable Diffusion用户操作图形界面，把各个节点连接起来变成一个流程图的工作模式。

大概是这样的。换个角度来看，其实是更复杂了……于是就出现了像模型一样专门分析画图流程的平台。

有意思的是，一些「专业」人士反倒是对 Midjourney 嗤之以鼻，但凡有人惊叹它更新了什么新功能，都会看到有人在下面评论说，这玩意儿Stable Diffusion早就有了。可现实情况是，Stable Diffusion 的母公司 Stability.AI 核心团队都快走光了，而 Midjourney 却蒸蒸日上。

也说明一个道理，咱搞产品不如放弃那些钱少事儿多的「专业」人士，直接把产品做的傻瓜化卖给小白用户反而能挣钱。就好像除了卖课，很多人都不愿意给程序员做软件产品，因为他们说「程序员的钱比马桶还难掏」。

同样是做图，反而是这种能好挣钱。这也是我一开始就老强调的，我就不搞成大杂烩了，一个小工具专门解决某一类需求。这也能从某种程度上解释了很多套壳产品能获得用户的缘由，因为很多人很想体验，但过高的使用门槛或者成本太贵把他们挡在了外面，而这种傻瓜式的就解决了这个问题，反倒是那些自己动手能力强的并不是此类型产品的用户，你要是把目标用户放在后面这拨人身上，大概率是光被白嫖了。

4，音视频

相对前面那些，这块儿无论是对C还是B，在目前这个阶段，应该是更偏向于纯体验和展示的了，哪怕是Sora那么惊艳的，也是秀个肌肉。

我自己用的频次相对高的：

pika.art + runwayml，更多的是用来测试现在这个视频生成效果到什么程度了，偶尔也会利用它做动态表情包。（大部分是切换账号白嫖，runwayml冲过一次钱。）

最近有个domoai挺有意思，它出来的视频起码放到短视频平台上「容易火」，它目前也只能在discord上体验。

早期体验heygen和d-id也挺多，也充过钱，后来新鲜感过去之后，就几乎没去了。

我对这类产品的疑问就是，除非它搞出个什么「遥遥领先」的能力，否则这个在独立场景下貌似也没有太大的商业空间，反倒是像抖音剪映这种有现成平台的，加一个这个功能（甚至还是免费的），直接就是百万用户规模了。比如我自己现在用一些声音克隆之类的都主要用剪映了。

倒是这几天更新后的做音乐的suno.ai很惊艳，我甚至想用它做一张专辑试试提交到网易云音乐看看效果。

最后：

我浏览器里有个收藏夹，名叫「AI相关有意思的项目」，目前已经有将近100个了，体验一圈下来，那是真涨了不少见识，也偷到了很多技能。相信后面会有更多有创意的项目出现在这个列表里，也愿我自己能借着AI之力折腾些叫好又叫座的东西。

https://mp.weixin.qq.com/s/GzvOjrE69z1zykTFhCtEDQ

AI 产品