AI战略深度解析, NoteLLM, 产品经理友好版。

新闻中心

您的位置：

绍兴网

AI战略深度解析, NoteLLM, 产品经理友好版。

2025-11-05 14:20:34

来源：

AI战略深"度解析," NoteLLM、, 产。品经理友好，版

大家好，我是喜欢研究AI的一枚产品经理

平时主要从事与AI、大模型、智能座舱等相关工作。在这里，我会持续跟大家分享AI相关的前沿技术、产品体验、个人心得等有营养有价值的信息

另外，我还超爱自驾游~

序

前天写了一篇文章→ 小红书AI战略深度解析 | 2027年，小红书将成为中国第一大移动搜索引擎！，这里面重点写了两件事儿：

从技术的角度，解析了小红书内部NoteLLM的工作原理。同时，我也追加了DeepSeep-COR对小红书NoteLLM进一步降本增效的说明。

从产品的角度，讲述了小红书现在的AI现状，并推理和给出了一些小红书未来2年的AI发展路线，以及围绕着AI衍生出来的一些具体场景和具体功能。

然后转发个身边一些小伙伴，很多人看完后表示看不太懂[我想静静]哈哈，因为我自己是技术出身，后转产品，而身边多是产品经理，可能技术上有一些盲点。所以，这一篇文章，我会进一步的，站在产品经理的角度，去解析和重述NoteLLM，用产品经理的视角，讲述NoteLLM是怎么工作的，以及它在具体的使用场景中，是如何赋能小红书App的。

这篇文章内容还是比较多，所以开始前，先列一下内容结构（注意这不是目录，是本文的核心内容，以及内容的讲述顺序）：

问题导向：NoteLLM要解决什么问题

传统方案痛点：BERT为什么不够、LLM为什么太贵

核心创意：一箭双雕的多任务学习思想

两个巧妙设计：GCL + CSFT如何相互强化

具体应用：美妆推荐、美食推荐等真实场景解析

NoteLLM-2升级：多模态融合如何避免"文本压制图像"

PM必知5点：关键认知和避坑指南

NoteLLM：产品经理友好版讲解

我尽量用产品经理能理解的语言解释NoteLLM的实现原理和产品价值，不涉及复杂数学，只讲产品逻辑。

一、问题导向：NoteLLM要解决什么问题？

背景问题

小红书的推荐系统需要做一件事：当一个用户看了笔记A后，系统要推荐给ta最相关的笔记B。

这个问题叫I2I推荐（Item-to-Item）。

传统方案的痛点

旧方案用什么？ BERT模型

优点：成熟稳定，能提取文本特征

缺点：理解能力不足，无法充分利用笔记中的丰富信息

为什么BERT不够？

想象用户看了一篇"Chanel香奈儿包包推荐"的笔记。BERT只能理解文字"包包、奢侈品、推荐"这些关键词，但看不到图片中的色号、材质、搭配效果。

而这些视觉信息往往比文字更重要。所以BERT推荐的"相关笔记"可能风格完全不搭。

为什么不直接用大模型？

可能有人会说："那就用LLM（大语言模型）吧，它比BERT强得多啊。"

没错！可问题是：

LLM的成本太高（训练、推理都贵）

直接从LLM提取embedding效果不一定好（LLM不是为推荐任务设计的）

需要大规模数据，小红书可能并不想投这么多成本

NoteLLM的创意方案

核心思想："用LLM做其他事情，顺便生成embedding。"

换个角度：生成hashtag/category 和生成笔记embedding 的本质是一样的，都是把笔记信息压缩。

如果一个模型能学会"给笔记生成合适的hashtag"，那这个过程中它必然深度理解了笔记的内容。而这种理解，就可以用来生成推荐用的embedding。

这就是NoteLLM的创意：一箭双雕。

二、解决方案：NoteLLM的两个巧妙设计

核心概念：Note Compression Prompt（NCP）

想象你要把一个笔记的所有信息浓缩到一个特殊的字符上。

笔记原文：

"小白鞋这个款百搭又舒适，我的Adidas Stan Smith已经穿了5年，

无论搭配连衣裙还是阔腿裤都很协调。适合上班、约会、旅游。"

NCP处理方式：

↓

通过LLM处理

↓

提取特殊token[EMB]的表征

↓

这个表征就是"笔记embedding"

产品意义：这个embedding可以用来做什么？

找"相似笔记"（I2I推荐）

找"风格搭配笔记"（个性化)

找"时尚建议笔记"(垂直搜索)

设计1：GCL - 用用户行为指导模型学习

问题："什么样的两篇笔记应该被推到一起？"

传统方案：人工定义规则（太主观）

NoteLLM的方案：让用户行为说话

具体怎么做？

系统会记录："哪些笔记经常被同一个用户看"。比如：

用户A看了"小白鞋推荐"后，经常看"Adidas搭配"

用户B看了"Chanel包包"后，经常看"奢侈品护理"

系统把这些共现关系作为"信号"告诉模型：

"老铁，经过我的长期观察和深度分析，这两篇笔记经常被一起看，你学着让它们的embedding更接近吧。"

模型学习的过程就是对比学习（Contrastive Learning）：

正样本（应该接近）：

- "小白鞋推荐" vs "Adidas搭配"

- 计算它们的embedding相似度

- 让相似度尽可能高

负样本（应该远离）：

- "小白鞋推荐" vs "护肤攻略"

- 计算它们的embedding相似度

- 让相似度尽可能低

为什么这个设计聪明？

不需要人工标注"什么笔记相关"

直接用真实用户行为作为真理

模型学到的是推荐意义上的相似性，不是语义相似性

（"语义相似性"可能是"都是美食"，"推荐相似性"可能是"风格搭配"——两者不一样）

设计2：CSFT - 生成任务反哺embedding质量

问题："仅用GCL好吗？"

答案：还不够。GCL只让embedding"满足用户行为"，但可能理解得不够深。

举个例子：

Embedding A 和 Embedding B 相似度高 ✓（满足GCL要求）

但它们表达的内容完全不同 ✗（没理解笔记真实含义）

CSFT的想法：强制模型深度理解笔记

"既然你说两篇笔记相关，那你给我生成一下它们的hashtag吧。如果你理解不透彻，生成的hashtag会南辕北辙很奇怪。"

具体怎么做？

输入：一篇笔记 + 目标hashtag

过程：LLM预测"下一个token应该是什么"

（类似玩"填空游戏"）

输出：生成正确的hashtag

例子：

笔记：小白鞋这个款百搭又舒适...

目标hashtag：#小白鞋 #穿搭 #日常

↓ LLM预测

输出：#小白鞋 (√正确)

#穿搭 (√正确)

#日常 (√正确)

为什么有效？

要生成正确的hashtag，LLM必须：

理解笔记讲的是什么（"小白鞋搭配"）

抓住关键点（"百搭"、"日常"）

转化为可搜索的标签

这个过程中，LLM的内部表征（embedding）会被不断强化，变得"理解更深"。

两个设计的协同作用

为什么要同时做GCL和CSFT？

它们共享同一个LLM编码器！

GCL任务：

笔记 → LLM编码 → embedding

↑

这部分被强化

CSFT任务：

笔记 → LLM编码 → 预测token → 生成hashtag

↑

这部分也被强化

结果：

GCL告诉编码器："这两个笔记应该接近"

CSFT告诉编码器："你要理解笔记的关键概念"

两者合力→embedding既满足推荐逻辑，又有深度理解

三、两个任务的详细对比

[上图，GCL vs CSFT 任务对比]

GCL任务（图片左侧流）：学习推荐逻辑

CSFT任务（图片右侧流）：增强理解深度

总损失函数（关键设计）

总Loss = L_gcl + α × (L_gen / (1 + α))

为什么这样设计？

- L_gcl：对比学习任务的损失

- L_gen：生成任务的损失

- α：可调的权重系数

- (1+α)在分母：确保权重不会无限放大

实际应用：

- 当α=1时，两个任务权重相等

- 当α>1时，更重视生成任务

- 当α<1时，更重视对比学习任务

产品含义：通过调整α，可以控制"推荐逻辑"和"内容理解"的平衡。

四、NoteLLM-1.0的产品效果

离线指标（数据层面）

在线指标（用户层面）

产品反馈：用户发现推荐给她的笔记"风格更搭""更实用"。

五、NoteLLM在产品中的应用

应用1：美妆推荐场景

用户行为：看了"极简穿搭"笔记

NoteLLM做什么：

提取"极简穿搭"笔记的embedding

找embedding相似的笔记

推荐给用户

为什么有效：

GCL学到了"极简穿搭"和"小白鞋搭配"的关联（用户共见）

CSFT强化了"极简风格"的理解

embedding既理解风格，又理解搭配逻辑

用户感受：推荐的都是自己喜欢的风格，太懂我了！

应用2：美食推荐场景

用户行为：看了"宁夏路日料推荐"

NoteLLM做什么：

理解"日料""宁夏路"等特征

找相似的本地美食笔记

推荐其他"日料"或"宁夏路附近"的笔记

为什么有效：

同一个embedding既包含"美食类别"信息，又包含"地理位置"信息

GCL和CSFT联合优化，信息更完整

应用3：品牌忠诚度场景

用户行为：经常看"Adidas穿搭"

NoteLLM做什么：

绍兴网版权与免责声明：

① 凡本网注明“稿件来源：绍兴市新闻传媒中心”的所有文字、图片和音视频稿件，版权均属绍兴网所有，任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本网协议授权的媒体、网站，在下载使用时必须注明“稿件来源：绍兴网”，违者本网将依法追究责任。 ② 本网未注明“稿件来源：绍兴市新闻传媒中心”的文/图等稿件均为转载稿，本网转载出于传递更多信息之目的，并不意味着赞同其观点或证实其内容的真实性。如其他媒体、网站或个人从本网下载使用，必须保留本网注明的“稿件来源”，并自负版权等法律责任。如擅自篡改为“稿件来源：绍兴网”，本网将依法追究责任。如对稿件内容有疑议，请及时与我们联系。③ 如本网转载稿涉及版权等问题，请作者在两周内速来电或来函与绍兴网联系。（联系电话：0575-88624101 ）

越牛新闻客户端
越牛新闻微信
绍兴发布微信
越牛新闻微博
绍兴发布微博

爆料

新闻热线

0575-88880000

投稿信箱

zjsxnet@163.com