和乐晟科技 · ToC AIGC 内容生成 · 2025.01 — 2026.05
RedPulse · 小红书 AI 文案助手
数据驱动 + 广告法合规 · 2873 条美妆护肤爆款样本 · 风格评分 4.26 · RAG + 双层 Guardrails
2873
有效训练样本
5155 条原始数据清洗
4.26
风格评分均值
满分 5 分,门槛 ≥3.8
94.9%
A级+爆款潜力
门槛 ≥50%
65%
文案采纳率
不改或轻改直接发布
100%
合规检测通过
双层 Guardrails
↓85%
创作耗时
2 小时 → 5-10 分钟
01 · 核心痛点 & 产品定位
小红书美妆运营痛点 & 差异化切入
小红书美妆运营的核心痛点
- 手工撰写种草文案需要 1-2 小时,且因缺乏爆款规律经验难以获得自然流量
- 内容重复、模板化明显,同质化严重导致平台降权
- 广告法用词边界模糊,"最嫩""美白极佳"等表述容易踩坑被限流
- 风格迁移难:不同品类(护肤/彩妆/个护)口吻、卖点表达方式完全不同
- 配图选题、话题标签选择依赖人工经验,效率低下
产品定位与差异化
核心差异:内容生成后立即联动违禁词扫描,实现"边写边审"闭环——非简单套模板生成,而是数据驱动的爆款结构复现 + 广告法合规一体化。
- MVP 聚焦:美妆个护品类(精华/面霜/防晒/彩妆),不做抖音/微博等多平台
- 不做自动代发布:防止被小红书识别为机器账号,保留用户对内容的最终确认
- 产品形态:PC 端 Web SaaS(全功能)+ 移动端 H5(轻量监控 + 极简生成)
02 · 数据标注与评测体系
5155 条原始数据 → 2873 条有效训练样本
围绕美妆个护品类制定小红书营销文案数据标准,覆盖采集、清洗、标注、评测与训练集构建完整链路
数据处理流程
采集 5155 条小红书美妆护肤笔记(原始数据)
↓
去重 + 质检:删除 1536 条重复,标记 746 条无效
↓
最终有效训练样本:2873 条(质检全部通过验收门槛)
↓
多维度标注:文案类型、开头钩子、结构模式、合规风险
评测结果(v6)
| 评测指标 | 结果 | 门槛 | 状态 |
|---|---|---|---|
| 风格评分均值 | 4.26 / 5.0 | ≥ 3.8 | ✅ |
| ≥4 分占比 | 85.9% | ≥ 50% | ✅ |
| A级以上爆款潜力 | 94.9% | ≥ 50% | ✅ |
| 内容可分享性 | 100% | ≥ 90% | ✅ |
| 综合爆款命中率 | 100% | ≥ 70% | ✅ |
爆款文案结构分布(2873 条有效样本)
开头钩子类型
- 场景代入:27.6%(最高频)
- 痛点提问:11.9%
- 个人宣言:11.1%
- 对比反差:10.6%
- 情绪共鸣:10.5%
文案结构模式
- 种草推荐型:68.7%
- 情绪种草型:8.3%
- 干货分析型:7.9%
- 反转对比型:7.7%
- 故事种草型:7.2%
文案类型覆盖
- 风格强化型:17.0%
- 感性种草型:14.9%
- 问题解决型:13.3%
- 干货教程型:12.4%
- 好物分享等:42.4%
03 · 技术架构
RAG + 结构化 Prompt + 双层广告法合规检查
三层技术设计保障生成质量:RAG 注入真实话术防幻觉、结构化 Prompt 复现爆款结构、双层 Guardrails 确保广告法合规
用户输入
产品信息
产品信息
→
品类+卖点
RAG 检索
RAG 检索
→
动态 Prompt
生成
生成
→
LLM 调用
(模型路由)
(模型路由)
→
第一层合规
LLM 自约束
LLM 自约束
→
第二层合规
Guardrails
Guardrails
→
输出 + 配图
一键发布
一键发布
RAG 知识库设计
- 类目话术库:按品类(护肤/彩妆/个护/香水)维护卖点词汇、效果表达和人群词
- 爆款样本库:按文案类型和开头钩子分类的 2873 条标注样本
- 话题标签库:高频标签按品类和风格分类,动态匹配生成
- 禁用词表:广告法绝对化用语 + 医疗功效宣称 + 平台规则违规词
为什么需要 RAG:AI 容易编造不存在的卖点或使用不符合类目风格的表达;RAG 注入真实话术库后,幻觉率显著降低,采纳率从初版的约 40% 提升至约 65%。
双层合规检查
第一层:LLM 自约束(Prompt 层)
System Prompt 中明确标注广告法红线:绝对化用语(最/第一/顶级/唯一/100%)、医疗功效宣称(治疗/治愈/消炎/根治)、虚假数据承诺;让模型在生成时主动规避
第二层:Guardrails 自动检查
生成后自动运行禁用词表扫描,标红高亮违规词并提供替换建议;不合规内容触发重新生成或强制提示,确保 100% 合规检测通过率
模型路由策略
| 文案风格 | 路由模型 | 单次成本 |
|---|---|---|
| 种草文(详细) | GPT-4o | ~$0.030 |
| 种草文(正常) | GPT-4o-mini | ~$0.0015 |
| 测评文 / 好物分享 | Claude 3.5 | ~$0.008 |
04 · 产品演示
种草文案生成器
填入产品信息,AI 即可一键生成合规爆款文案——标题 + 正文 + 话题标签,并展示合规状态
05 · 技术挑战与设计决策
三个核心设计问题
🧠 为什么需要 RAG 而不是直接 Prompt?
纯 Prompt 方案的问题:AI 容易编造不存在的卖点,且无法学习类目特定的表达习惯(护肤品"水光感" vs 彩妆"显白" vs 香水"木质调")
- RAG 检索注入真实话术库,减少幻觉;类目话术动态匹配,提升平台感
- 爆款样本库让 LLM 学习平台风格:开头 3 秒钩子结构、情绪词密度、互动引导方式
- 采纳率从初版约 40% 提升至约 65% 的核心原因正是 RAG 的引入
⚖️ 为什么需要双层合规检查?
单层检查的问题:只靠 Prompt 约束时,模型仍会在创意型文案中偶发使用"超级""无敌"等边缘用词;只靠规则检查则无法理解上下文语义
- 第一层(LLM 自约束):Prompt 中明确列出广告法红线,让模型在生成阶段主动规避
- 第二层(Guardrails):自动化词表检查,拦截 LLM 可能遗漏的绝对化用语和医疗功效宣称
- 不合规内容触发重新生成(最多 2 次),保证 100% 合规交付给用户
💰 数据标注体系为什么要这样设计?
普通爬取数据直接用作训练样本的问题:含大量低质文案(模板化、卖点虚假、口播不自然),不清洗和标注会污染模型风格学习
- 制定多维度标注标准:文案类型、开头钩子类型、文案结构、爆款潜力、合规性
- 建立风格评分体系(1-5 分),门槛 ≥3.8 分才入训练集,最终均值 4.26
- 5155 条原始数据 → 2873 条高质量样本,所有样本通过 6 项验收门槛中的 5 项