https://mp.weixin.qq.com/s/66HEtcn2fVmzgTRl1EKMkA
最近有个叫「沉浸式翻译」出了大事儿了,因为「泄露用户数据」。这个产品之前口碑特别的好,很多人都推荐过,我也用过一段时间,它甚至还登录过 Google chrome 的2024 年优秀扩展程序第九的位置(一共 12 款插件)。现在出事儿了,再去他的评论区,最新显示的就全是打一星顺便骂街的了~当然不乏有真用户觉得受伤,但更多的估计是趁火打劫和落井下石的……(毕竟正常人谁会特意去把人家快照信息全部打包成一个几百兆的文件到处传播呢…)先不管因为什么原因导致的,出了这种搬石头砸脚的事儿,就只能认。用户才不会去深究你哲理发生数据泄露的细节(如是否因自身操作失误),只关心「我的信息不安全」,会直接将问题归咎于产品。再加上你的竞争对手虎视眈眈等着你犯错,可算逮到了,添油加醋之后,「产品=泄露用户数据」的印象一旦形成,通过社交媒体这种负面舆论就非常容易被放大,很难通过解释来扭转了,因为用户更倾向于情绪化判断,而非理性分析……简单来说,就是它搞了一个可以把分享的内容生成一个网页分享的功能,实际上很多产品都有类似功能,比如 ChatGPT 也有:生成后,任何人都可以通过这个网址打开并看到你的内容。「就是豆包通过平台上的智能体生成了海量的数据,这些数据被包括 Google 和百度在内的搜索引擎收录了」沉浸式翻译这回的事儿本质上差不多,就是有运营想用 SEO 的方式搞增长(甚至还特意搞了个独立于主站的新域名,也知道万一被搜索引擎惩罚也不会影响自己主站),因为对于这种工具类型的,正常来说不会有那么多内容被搜索引擎收录,于是把「用户的」变成产品的内容就变成了常规操作。(ps:你说你一个工具好好做翻译呗,怎么就贪多呢~这是有增长压力么~)毕竟这样可以获得大量的网页内容,被搜索引擎收录了,才可能被用户搜到,而海量下网页收录就意味着关联海量的长尾关键词,那就可能带来大量的自然搜索流量。即便现在关了,但还有一些反应没那么快的搜索引擎可以看到相关记录~Google 反应是最快的,现在基本上都没有记录了。所以哪怕从我2007 年接触 SEO 开始,很多工具类型的网站都会搞一个 blog用来更新内容,道理都是一样的 。1,不管你怎么唱衰 SEO,但利用用户生成内容(UGC)获取长尾关键词流量仍然是一种高效的SEO策略,能够帮助网站或平台精准捕捉用户需求,降低竞争难度,并提升转化率。 我之前给某汽车品牌 App 的运营负责人给的建议也是这个逻辑。2,要把用户当小白看待,宁可低估也不能高估用户的「智商」,这种涉及到用户隐私的(自己用的)分享,一定要默认关闭,采用渐进式授权的方式,比如需用户主动开启并通过多步确认(如“分享将公开内容,确认?”),并在在分享界面添加显眼警告,如“此链接可被搜索引擎收录,请勿分享敏感信息”。点一下用户可以说是误操作,点三下再说是误操作肯定就解释不通了。3,所有的事情都有两面性,所谓有得必有失,尤其是有名气了,攻防思维就很重要了……加某个功能或者开放某个权限,除了算明白得到什么好处,也要算一下最大的风险,这个风险往往不是来自于用户的不小心,更大的可能是对你怀有敌意的人钻这个空子想砸掉你的饭碗,大家可记得几年前有人去竞品公司的学生用的学习软件里传不健康的图片再随手一个举报的~4,简单的 SEO 教学,如屏蔽搜索引擎爬虫的方法:– 在网站根目录创建一个叫robots.txt的文本文件,写上规则。比如:
User-agent: * # 针对所有爬虫
Disallow: /private/ # 禁止爬虫访问/private/目录下的内容
Disallow: /secret.html # 禁止爬某个具体页面
注意:
robots.txt是“建议”,大部分正规爬虫会遵守,但恶意爬虫可能无视。
不能完全保证隐私,敏感内容还是得靠其他方式保护。
(现在的 AI 大模型也同理)
– 在网页的部分加一句代码:
这表示“别把这个页面收录到搜索引擎”。
– 给页面加个访问权限,比如只有登录用户才能看,或者需要输入密码。爬虫一般没账号密码,访问不了自然就抓不到。
– site: 是搜索引擎的一个高级搜索指令,专门用来查看某个网站在搜索引擎里的收录情况,如果你直接搜索 site:zlbigger.com,不加关键词,搜索引擎会列出这个网站被收录的所有页面,即「我只想看这个网站上的东西,其他的别给我看!」
那么就会有一些用法,比如你输入 「site:zlbigger.com 人工智能」 去搜索,搜索引擎会只返回 zlbigger.com 这个网站上跟“人工智能”相关的内容,过滤掉其他网站的杂乱信息。这对于快速找到某个网站上的特定信息特别有用。

在沉浸式翻译里找敏感信息的人也是用这个命令去找的~
5,我们自己在用一些 AI 产品的时候,尤其是第三方的,还是要注意下敏感内容或者隐私信息不要随随便便就给,哪怕不会像沉浸式翻译这样直接暴露在前端,但后台还是很容易看到你输入的内容的。大厂肯定会更可信一些。
这事儿不仅是技术层面的教训(准确的说也不是技术上的问题,主要还是舆论上……),更提醒工具类产品在追求增长(如SEO流量)时,必须将用户隐私放在首位。否则,一次失误可能导致信任崩塌,得不偿失。
https://mp.weixin.qq.com/s/66HEtcn2fVmzgTRl1EKMkA