graph LR
A[海量用户] --> C[推荐系统]
B[海量物品] --> C
C --> D[个性化匹配]
D --> E[提升转化]
D --> F[增加粘性]
D --> G[发现长尾]
为什么需要推荐系统?
痛点
推荐解决方案
业务价值
信息过载
过滤无关内容
提升用户效率
找不到想要的
主动推送匹配内容
提升满意度
冷启动
基于画像推断偏好
降低流失率
长尾挖掘
发现小众但匹配的内容
提升覆盖率
推荐系统架构
经典四层架构
graph TB
subgraph 召回层
A[多路召回] --> A1[协同过滤]
A --> A2[内容召回]
A --> A3[热门召回]
A --> A4[实时召回]
end
subgraph 粗排层
B[粗排模型] --> B1[快速筛选<br/>千级→百级]
end
subgraph 精排层
C[精排模型] --> C1[精细打分<br/>百级→几十]
end
subgraph 重排层
D[重排策略] --> D1[多样性]
D --> D2[去重打散]
D --> D3[业务规则]
end
A1 --> B
A2 --> B
A3 --> B
A4 --> B
B --> C
C --> D
D --> E[最终推荐结果]
graph TD
A[模型选择] --> B{数据规模}
B -->|小规模| C[LR/GBDT]
B -->|中规模| D{特征工程能力}
D -->|强| E[GBDT+LR]
D -->|弱| F[DeepFM]
B -->|大规模| G{行为序列重要性}
G -->|一般| H[Wide&Deep]
G -->|重要| I[DIN/DIEN]
特征工程实践
特征分类
特征类型
示例
作用
用户特征
年龄、性别、城市、偏好标签
用户画像
物品特征
类目、品牌、价格、标签
物品属性
上下文特征
时间、位置、设备、场景
环境信息
交叉特征
用户×类目偏好度
精细匹配
统计特征
物品CTR、用户活跃度
先验信息
序列特征
最近浏览序列
实时兴趣
高价值特征示例
特征
计算方式
预测价值
用户-类目偏好度
历史点击/购买占比
极高
物品历史CTR
曝光点击率
高
价格敏感度
购买价格分布
高
品牌偏好
品牌购买占比
中高
时间衰减行为
加权近期行为
高
业务场景实践
电商推荐场景
场景
特点
优化目标
首页推荐
用户意图模糊
点击率、停留时长
详情页推荐
明确兴趣方向
关联购买率
购物车推荐
接近转化
客单价提升
搜索结果
强意图
转化率、相关性
个人中心
历史偏好
复购率
内容推荐场景
场景
特点
优化目标
信息流
消费型
时长、完播率
短视频
沉浸式
互动率、分享率
文章推荐
阅读型
阅读完成率
音乐推荐
情境型
播放完成率、收藏
场景化策略
冷启动解决方案
冷启动类型
类型
场景
挑战
用户冷启动
新用户
无历史行为
物品冷启动
新商品/新内容
无交互数据
系统冷启动
新平台
无任何数据
解决策略
graph TD
A[冷启动问题] --> B{类型}
B -->|用户冷启动| C[引导获取偏好]
C --> C1[注册问卷]
C --> C2[热门推荐]
C --> C3[基于画像]
B -->|物品冷启动| D[挖掘物品信息]
D --> D1[内容特征]
D --> D2[类似物品迁移]
D --> D3[探索流量]
B -->|系统冷启动| E[外部数据]
E --> E1[行业基准]
E --> E2[规则策略]