Case Study · 012024.08 — NowLive in Production

小红书智能内容矩阵
从 0 到 10k 篇 / 月

基于 LLM + 风格迁移的自动化内容生产系统,覆盖选题、撰写、配图、发布全链路。在不扩大团队的前提下,让一个 PM + 一台机器持续生产符合品牌调性的爆款内容。

AI MarketingLLM PipelinePrompt EngineeringGrowthLive
10k+
月产内容
↑ 24× vs baseline
87%
人工时长↓
40h → 5h/week
3.2×
爆款率
行业基线 4.7%
¥0.18
单篇成本
↓ 92% vs 外包
01 / Problem

为什么我们需要"会自己生长"的内容矩阵

小红书是品牌触达 Z 世代最有效的阵地之一,但传统内容生产存在三个结构性问题

  • 产能瓶颈:一个内容运营每周稳定产出 8-12 篇,规模化边际成本极高。
  • 风格漂移:多人写作导致品牌调性不稳定,每篇像"不同人写的"。
  • 选题失灵:依赖人工拍脑袋,爆款率低于 2%,且无法从历史数据中持续学习。
"我们不缺写手,缺的是一个能持续学习、复制风格、自动迭代选题的内容大脑。"
— 早期访谈,品牌方负责人
02 / Insight

用户洞察:爆款不是"写得好",是"猜得准"

分析 8,000 条头部博主笔记后发现一个反直觉事实:

💡
爆款笔记的内容质量并不显著高于平均水平,但它们在"标题钩子 + 封面情绪 + 痛点共鸣"三件事上几乎从不失手。换言之,"爆款" = 工程问题,不是艺术问题。
  • 标题模式可被结构化:87% 的爆款标题落在 12 种句式模板内。
  • 封面有情绪密度阈值:高互动笔记封面平均含 1.8 个表情/惊叹符号 + 强对比色块。
  • 痛点 ≠ 需求:最高互动笔记触及"被忽视的具体场景"而非宽泛痛点。
03 / PRD Excerpt

PRD 节选:核心功能模块

PRD-XHS-001 / 选题引擎 v1.2P0 · Shipped
输入近 30 天行业头部笔记 + 品牌历史爆款 + 实时热搜
处理语义聚类 → 趋势话题;标题模板匹配 → 候选 prompt;品牌向量余弦相似度打分
输出每日 30 个带评分的选题候选 + 推荐撰写模板
成功指标Top-10 选题 7 天内爆款率 ≥ 12%
异常处理合规过滤(敏感词/政策红线)+ 重复度去重(cosine > 0.85 拦截)
⚖️
关键权衡:多模型方案让单篇成本从 ¥0.05 涨到 ¥0.18,但爆款率从 1.4% 提升到 4.7%。换算后 ROI 提升 ~3 倍——成本绝不是越低越好。
04 / Prototype

系统流程与原型展示

Step 01
趋势抓取
爬取头部笔记 + 实时热搜 + 评论高频词
Step 02
选题生成
LLM 聚类 + 模板匹配 + 品牌打分
Step 03
内容撰写
Claude 撰文 + 风格迁移 + 合规过滤
Step 04
配图发布
MJ + SDXL + 智能排版 + 定时发布
content-matrix · daily queue (32 pending)
AI · 92%
3天我用 AI 把购物清单减半的真实结果
爆款分 8.6 · 适配率 91%
AI · 88%
不是我吹,这个 prompt 我用了半年
爆款分 7.9 · 适配率 88%
AI · 95%
作为 PM 我私藏的 5 个 AI 工具
爆款分 9.1 · 适配率 95%
05 / Data

数据复盘:上线 6 个月的真实表现

指标v1.0v2.0v3.0 (Now)Δ
月产笔记4203,80010,240↑ 24×
爆款率1.4%3.8%4.7%↑ 3.4×
单篇成本¥2.10¥0.32¥0.18↓ 92%
人工审核耗时15min/篇3min/篇40s/篇↓ 96%
06 / Reflection

复盘:做对了什么,踩了什么坑

✓ What Worked

多模型流水线 > 单模型大力出奇迹

不同环节交给最擅长的模型,每环节有独立 eval,系统可观测、可迭代。

✓ What Worked

把"爆款"建模成工程问题

放弃浪漫主义叙事,把所有"创意"环节拆成可量化子任务。

⚠ What Didn't

低估了合规风险

v1.0 上线两周吃了一次平台限流,补救:建立四层合规过滤体系。

⚠ What Didn't

过度自动化反而降低创意上限

完全去人工后头部内容质量下滑,最终保留"人工把脉头部 5%"的混合策略。

Want to build something similar?

正在做内容、增长或 AI 应用?欢迎一起聊聊。