和乐晟科技 · ToC AIGC 内容生成 · 2025.01 — 2026.05

RedPulse · 小红书 AI 文案助手

数据驱动 + 广告法合规 · 2873 条美妆护肤爆款样本 · 风格评分 4.26 · RAG + 双层 Guardrails

数据标注体系 Prompt Engineering RAG 广告法合规模型路由 AIGC 内容生成

2873

有效训练样本

5155 条原始数据清洗

4.26

风格评分均值

满分 5 分，门槛 ≥3.8

94.9%

A级+爆款潜力

门槛 ≥50%

65%

文案采纳率

不改或轻改直接发布

100%

合规检测通过

双层 Guardrails

↓85%

创作耗时

2 小时 → 5-10 分钟

01 · 核心痛点 & 产品定位

小红书美妆运营痛点 & 差异化切入

小红书美妆运营的核心痛点

手工撰写种草文案需要 1-2 小时，且因缺乏爆款规律经验难以获得自然流量
内容重复、模板化明显，同质化严重导致平台降权
广告法用词边界模糊，"最嫩""美白极佳"等表述容易踩坑被限流
风格迁移难：不同品类（护肤/彩妆/个护）口吻、卖点表达方式完全不同
配图选题、话题标签选择依赖人工经验，效率低下

产品定位与差异化

核心差异：内容生成后立即联动违禁词扫描，实现"边写边审"闭环——非简单套模板生成，而是数据驱动的爆款结构复现 + 广告法合规一体化。

MVP 聚焦：美妆个护品类（精华/面霜/防晒/彩妆），不做抖音/微博等多平台
不做自动代发布：防止被小红书识别为机器账号，保留用户对内容的最终确认
产品形态：PC 端 Web SaaS（全功能）+ 移动端 H5（轻量监控 + 极简生成）

02 · 数据标注与评测体系

5155 条原始数据 → 2873 条有效训练样本

围绕美妆个护品类制定小红书营销文案数据标准，覆盖采集、清洗、标注、评测与训练集构建完整链路

数据处理流程

采集 5155 条小红书美妆护肤笔记（原始数据）

↓

去重 + 质检：删除 1536 条重复，标记 746 条无效

↓

最终有效训练样本：2873 条（质检全部通过验收门槛）

↓

多维度标注：文案类型、开头钩子、结构模式、合规风险

评测结果（v6）

评测指标	结果	门槛	状态
风格评分均值	4.26 / 5.0	≥ 3.8	✅
≥4 分占比	85.9%	≥ 50%	✅
A级以上爆款潜力	94.9%	≥ 50%	✅
内容可分享性	100%	≥ 90%	✅
综合爆款命中率	100%	≥ 70%	✅

爆款文案结构分布（2873 条有效样本）

开头钩子类型

场景代入：27.6%（最高频）
痛点提问：11.9%
个人宣言：11.1%
对比反差：10.6%
情绪共鸣：10.5%

文案结构模式

种草推荐型：68.7%
情绪种草型：8.3%
干货分析型：7.9%
反转对比型：7.7%
故事种草型：7.2%

文案类型覆盖

风格强化型：17.0%
感性种草型：14.9%
问题解决型：13.3%
干货教程型：12.4%
好物分享等：42.4%

03 · 技术架构

RAG + 结构化 Prompt + 双层广告法合规检查

三层技术设计保障生成质量：RAG 注入真实话术防幻觉、结构化 Prompt 复现爆款结构、双层 Guardrails 确保广告法合规

用户输入
产品信息

→

品类+卖点
RAG 检索

→

动态 Prompt
生成

→

LLM 调用
（模型路由）

→

第一层合规
LLM 自约束

→

第二层合规
Guardrails

→

输出 + 配图
一键发布

RAG 知识库设计

类目话术库：按品类（护肤/彩妆/个护/香水）维护卖点词汇、效果表达和人群词
爆款样本库：按文案类型和开头钩子分类的 2873 条标注样本
话题标签库：高频标签按品类和风格分类，动态匹配生成
禁用词表：广告法绝对化用语 + 医疗功效宣称 + 平台规则违规词

为什么需要 RAG：AI 容易编造不存在的卖点或使用不符合类目风格的表达；RAG 注入真实话术库后，幻觉率显著降低，采纳率从初版的约 40% 提升至约 65%。

双层合规检查

第一层：LLM 自约束（Prompt 层）

System Prompt 中明确标注广告法红线：绝对化用语（最/第一/顶级/唯一/100%）、医疗功效宣称（治疗/治愈/消炎/根治）、虚假数据承诺；让模型在生成时主动规避

第二层：Guardrails 自动检查

生成后自动运行禁用词表扫描，标红高亮违规词并提供替换建议；不合规内容触发重新生成或强制提示，确保 100% 合规检测通过率

模型路由策略

文案风格	路由模型	单次成本
种草文（详细）	GPT-4o	~$0.030
种草文（正常）	GPT-4o-mini	~$0.0015
测评文 / 好物分享	Claude 3.5	~$0.008

04 · 产品演示

种草文案生成器

填入产品信息，AI 即可一键生成合规爆款文案——标题 + 正文 + 话题标签，并展示合规状态

产品名称

产品品类

价格区间

目标人群

核心卖点（用顿号分隔）

文案风格（影响模型路由）

文章长度

05 · 技术挑战与设计决策

三个核心设计问题

🧠 为什么需要 RAG 而不是直接 Prompt？

纯 Prompt 方案的问题：AI 容易编造不存在的卖点，且无法学习类目特定的表达习惯（护肤品"水光感" vs 彩妆"显白" vs 香水"木质调"）

RAG 检索注入真实话术库，减少幻觉；类目话术动态匹配，提升平台感
爆款样本库让 LLM 学习平台风格：开头 3 秒钩子结构、情绪词密度、互动引导方式
采纳率从初版约 40% 提升至约 65% 的核心原因正是 RAG 的引入

⚖️ 为什么需要双层合规检查？

单层检查的问题：只靠 Prompt 约束时，模型仍会在创意型文案中偶发使用"超级""无敌"等边缘用词；只靠规则检查则无法理解上下文语义

第一层（LLM 自约束）：Prompt 中明确列出广告法红线，让模型在生成阶段主动规避
第二层（Guardrails）：自动化词表检查，拦截 LLM 可能遗漏的绝对化用语和医疗功效宣称
不合规内容触发重新生成（最多 2 次），保证 100% 合规交付给用户

💰 数据标注体系为什么要这样设计？

普通爬取数据直接用作训练样本的问题：含大量低质文案（模板化、卖点虚假、口播不自然），不清洗和标注会污染模型风格学习

制定多维度标注标准：文案类型、开头钩子类型、文案结构、爆款潜力、合规性
建立风格评分体系（1-5 分），门槛 ≥3.8 分才入训练集，最终均值 4.26
5155 条原始数据 → 2873 条高质量样本，所有样本通过 6 项验收门槛中的 5 项