https://mp.weixin.qq.com/s/GzvOjrE69z1zykTFhCtEDQ
这一年多来,我坚持的最久的事情应该就是更新《 AI 日报 》了,除了个别时间实在搞不过来,说日更了三百多天也不过份。倒也没挣什么钱,但坚持一件事情必须靠正反馈来支撑,挣钱不算,那就要强行指定一个,比如近一万的关注,认识了一些人,更要紧的是实实在在的体验了各种各样的AI产品。AI相关产品更新太快,我也跟着一直在更新,所以也乐于隔三差五的记录下当时当刻的想法。所以,今天又来碎碎念了……彻底被ChatGPT“伤害”了,主动送了三次钱,全被封号了(还没退钱!),现在只用它的 API + 第三方的套壳工具。客户端是「Opencat」:这个我是付了费升级到pro版本的,68块,可以多个设备同步。我主要用来通过不同的AI角色来进行比较长的对话,包括在做一些应用的时候,都会在这里进行prompt的效果测试,响应快,随开随用。浏览器插件用的是「Glarity」:也是另一个高频使用的工具,在浏览网页的时候会用它来做一些总结(包括一些视频网站等),和双语翻译。这两个产品的「成功」某种程度上就是够早上线,第一时间吃到红利。哪怕opencat的作者也在产品发布没多久之后在他社交媒体上说:「OpenCat 次日留存率 62%,可以说是我数据最好的产品了,但是我一点感受不到兴奋和鼓舞。这是我做的最没技术含量或者说没有我个人烙印的产品了,就是一个 api wrapper 而已。我只感受到了热点的力量,没有感受到我的力量。这种感觉让我很是迷茫。@waylybaye」但转念一想,能够第一时间发布让用户体验到时下最火的AI,何尝不是很好地解决了用户需求,按现在流行的说法,就是找到了PMF(产品市场契合度)呢?所以,即便第一版本都很「粗糙」,就一个 UI + Key,依然获得很多用户都喜欢和推荐。哪怕是现在,这个赛道依然卷的厉害,五花八门的,很多后来者,功能也丰富(复杂)了很多。当然这也符合很多产品演进模式:从一个简单功能进化成复杂的全家桶。大概是两种形态:一个是横向的聚合各家大模型,另一个就是纵向的拓展,加入除了聊天之后的很多其他AI相关的工具。这里有个商业模式简单来说就是挣差价,简单来说就是我用200块钱每个月从官方能买到对应的token量足以覆盖住30个订阅用户(比如10元/每月),订阅时间越长,盈利空间可能就越大,因为这个就跟很多人「知识付费」、「健身房办卡」一样,钱是花了,课却没上几节。同样的,用这种也有个风险,因为你自己的key也有可能被产品反撸,毕竟这样更「挣钱」。这类型的就有个专有名词,叫「套壳」,发展到现在门槛已经相当的低了,甚至UI界面都有很多用户体验做的很好的开源作品,也正如此,这个路径下就有很多聪明人顺其自然的做了或者准备好了画图的Midjourney套壳,音乐生成的sunoAI套壳,甚至还没发布的sora都万事俱备只欠API了。虽然OpenAI的CEO奥特曼几个月前就说过「套壳ChatGPT注定消亡」,但目前看来更像我在一期播客节目里听到Perplexity的CEO说的这句话:「拥有十万用户的套壳产品比拥有自有模型却没有用户更有意义」。月之暗面的kimi.ai应该算是我最近一个月使用频次比较高的产品了,用的最多的功能就是联网、上传文档,归纳总结。这种支持100mb的文档解读还免费,那基本上就没有chatpdf这类产品什么事儿了。(有意思的是,貌似从它开始国内各大模型公司都开始卷超长上下文了……)这倒是让我总结了条经验,就是不能重仓未来可能财大气粗的大厂也会做的应用场景,因小步快跑吃到的红利(大量用户)一定要快速拓展更多用户场景,价值最大化。
另一款国内的大模型产品是阿里系的,通义千问+通义听悟。我一般用通义千问来解图,特别适合给图片创造出「原创」的文本,它能拯救你匮乏的语言。用通义听悟拆解录音(比如播客,会议),效率高太多了,还能丰富你「可搜索」的知识库。Midjourney 这个应该是截止到目前续费持续最久的(30美金/月),从体验到质量应该算是画图届顶流了。去年的一篇百万+的文章也是因为写它带来的,从这个角度来看,它带来的收入已经足够覆盖为它付出的成本了。它能干的事儿就多了,公众号配图,长的,方的,logo,壁纸,插画各种风格,要啥有啥。除了这个商业化的Midjourney,还有一个开源的 Stable Diffusion,老实讲,对大部分人来说门槛有点高,不光对你设备有要求,动手能力也需要,相对mj优势就是免费,你要是乐于折腾就可以玩一下ComfyUI,简单来说就是更先进的Stable Diffusion用户操作图形界面,把各个节点连接起来变成一个流程图的工作模式。大概是这样的。 换个角度来看,其实是更复杂了……于是就出现了像模型一样专门分析画图流程的平台。有意思的是,一些「专业」人士反倒是对 Midjourney 嗤之以鼻,但凡有人惊叹它更新了什么新功能,都会看到有人在下面评论说,这玩意儿Stable Diffusion早就有了。可现实情况是,Stable Diffusion 的母公司 Stability.AI 核心团队都快走光了,而 Midjourney 却蒸蒸日上。也说明一个道理,咱搞产品不如放弃那些钱少事儿多的「专业」人士,直接把产品做的傻瓜化卖给小白用户反而能挣钱。就好像除了卖课,很多人都不愿意给程序员做软件产品,因为他们说「程序员的钱比马桶还难掏」。同样是做图,反而是这种能好挣钱。这也是我一开始就老强调的,我就不搞成大杂烩了,一个小工具专门解决某一类需求。这也能从某种程度上解释了很多套壳产品能获得用户的缘由,因为很多人很想体验,但过高的使用门槛或者成本太贵把他们挡在了外面,而这种傻瓜式的就解决了这个问题,反倒是那些自己动手能力强的并不是此类型产品的用户,你要是把目标用户放在后面这拨人身上,大概率是光被白嫖了。相对前面那些,这块儿无论是对C还是B,在目前这个阶段,应该是更偏向于纯体验和展示的了,哪怕是Sora那么惊艳的,也是秀个肌肉。
pika.art + runwayml,更多的是用来测试现在这个视频生成效果到什么程度了,偶尔也会利用它做动态表情包。(大部分是切换账号白嫖,runwayml冲过一次钱。)
最近有个domoai挺有意思,它出来的视频起码放到短视频平台上「容易火」,它目前也只能在discord上体验。早期体验heygen和d-id也挺多,也充过钱,后来新鲜感过去之后,就几乎没去了。我对这类产品的疑问就是,除非它搞出个什么「遥遥领先」的能力,否则这个在独立场景下貌似也没有太大的商业空间,反倒是像抖音剪映这种有现成平台的,加一个这个功能(甚至还是免费的),直接就是百万用户规模了。比如我自己现在用一些声音克隆之类的都主要用剪映了。倒是这几天更新后的做音乐的suno.ai很惊艳,我甚至想用它做一张专辑试试提交到网易云音乐看看效果。我浏览器里有个收藏夹,名叫「AI相关有意思的项目」,目前已经有将近100个了,体验一圈下来,那是真涨了不少见识,也偷到了很多技能。相信后面会有更多有创意的项目出现在这个列表里,也愿我自己能借着AI之力折腾些叫好又叫座的东西。
https://mp.weixin.qq.com/s/GzvOjrE69z1zykTFhCtEDQ