慧融媒平台需求文档(PRD)
版本:V0.4(删除 §1.4 脑图;保留 §8.3 周期规划)
日期:2026-03-18
范围:覆盖“策→采→编→发”全流程的内容生产管理平台 + 智能化能力套件(含 SaaS 多租户形态)
1. 背景与目标
1.1 项目背景
建设覆盖“策→采→编→发”全流程的内容生产管理平台,将内容生产运营从“数字化”推向“智能化”。
1.2 核心目标(原文归纳)
- 平台搭建:打造“三个一”核心成果
- 统一应用知识库:融合知识库、语料库、图片库等,打通内部数据,实现内部数据互通
- 慧融媒平台功能升级:优化“内脑 + 外脑”结合机制
- 落地“小兴e”智体:推进实际应用
- 技术输出:平台 SaaS 化,采用 多租户 设计,支持县级融媒体中心共享使用;提供 付费订阅 与 增值服务 收费模式
1.3 成功指标(建议用于验收/运营)
- 使用指标:日/周活、内容生产工单数、媒资入库量、检索使用次数、AI 工具调用次数
- 效率指标:选题策划平均产出耗时、文稿产出耗时、视频成片耗时、审校/合规问题拦截率
- 质量指标:审校命中准确率、人工修订率、重复素材/版权风险拦截率
2. 产品范围与边界
2.1 本期(V1)范围(按方案列出的核心功能)
- 智能策划(网友/热门/时效/新颖视角选题 + 选题策划提案生成)
- 智能配音(声音复刻 + 音频合成)
- 数字人(音频驱动口型/脸部动画 + 输出数字人视频)
- 智能文稿(智能写作、标题生成、内容润色、文风改写)
- 智能创作(文生图、文生视频、图生视频;接入“即梦AI”等)
- 智能剪辑(打通剪映企业版;云空间、脚本、审阅、资产互通;商用素材;资产导出;安全控制)
- 智能工具(智能审校、音乐生成、录音文件识别/语音转文字)
- 智能媒资(结构化管理、智能处理、检索、分发、二次创作;融合知识/语料/图片库,打通内部数据)
- SaaS 多租户能力(数据隔离、权限控制、计费/订阅)
2.2 明确不在本期(需后续确认/补齐)
以下内容在方案中未给出明确功能细节,本 PRD 暂以“待明确”处理:
- 采集端:采集渠道(网页/客户端/第三方平台)、采集规则、采集审核与入库流程
- 编审发工作流:多级审核、排版模板、发布渠道(公众号/视频号/客户端/网站/大屏等)、发布回流数据
- “小兴e”智体:具体形态(聊天助手/工作台插件/机器人)、接入范围、知识检索与权限策略
3. 用户与角色权限(建议)
3.1 角色定义
- 系统超管(平台方):SaaS 全局配置、租户管理、计费套餐、运营数据
- 租户管理员(融媒中心管理员):租户内组织/用户/权限、资源配额、审校规则、素材库管理
- 策划/编辑:选题策划、文稿创作、素材检索与使用、发起审校
- 视频制作:配音/数字人/生成式创作/剪辑协同、导出与媒资归档
- 审核员/合规:审校规则维护、审校复核、政敏/合规处理、留痕审计
- 普通浏览者:只读检索、查看素材与知识库(受权限控制)
3.2 权限模型(建议采用 RBAC + 资源维度)
- 基础权限:菜单/页面/操作权限(创建、编辑、删除、导出、发布、配置)
- 资源权限:按 栏目/项目/资产库/素材标签/知识库域 进行访问控制
- 租户隔离:租户数据与配置严格隔离;平台方仅可在授权/审计下访问
4. 功能需求明细
4.1 智能策划
4.1.1 视角选题(四类)
- 功能说明:围绕某一话题/选题,提供不同“视角”切入,辅助找到热点与潜力角度
- 视角类型与规则
- 网友视角选题:聚合该选题下所有新闻的网友观点;统计主要观点/态度;列出占比前 80% 的态度;支持继续生成选题策划
- 热门视角选题:给出当前话题下热度最高的多条新闻切入选题,帮助洞察最高热度的视角
- 时效视角选题:给出当前话题下最近前 10 条发表新闻切入选题,辅助掌握最新风向
- 新颖视角选题:给出该选题下“尚无媒体用过”的新颖切入点(需定义判定口径/数据源)
- 输入:话题关键词/事件线索/指定新闻集合(可选)
- 输出:视角列表(每条含:视角名称、代表新闻/观点、热度/时间/新颖度解释、建议切入点)
- 边界/约束(待明确)
- 热度来源与口径(平台内阅读/互动?第三方热榜?)
- 网友观点来源(评论区?论坛?微博?)及采集合法合规
- “尚无媒体用过”的判定(全网检索?内部库比对?)
- 验收标准(示例)
- 输入一个话题,能生成四类视角列表;网友视角能输出“态度 Top 列表(累计≥80%)”
- 时效视角固定返回最近 10 条(不足 10 条时返回实际条数并提示)
4.1.2 选题策划提案生成
- 功能说明:基于用户选择的视角方向与新闻素材,生成策划提案
- 输入:选中的视角(单选/多选待定)、素材集合(新闻正文/链接/摘录/媒资)、写作目标(可选)
- 输出:策划提案(包含:主题、主题摘要、段落大纲、大纲描述等)
- 关键交互(建议)
- 支持“改写/补充/扩展/缩短/换风格”的二次生成
- 支持一键转入“智能文稿”生成正文/脚本
- 验收标准(示例)
- 提案结构完整,字段齐全;大纲层级清晰(≥2 级)
4.2 智能配音
4.2.1 声音复刻
- 功能说明:高度还原真人音色特点、说话风格、口音与声学环境
- 输入:音频样本(时长/格式阈值待定)、授权声明(必填)
- 输出:可用声音模型(含:名称、语言/口音标签、适配场景、创建时间、使用范围)
- 安全与合规(必须)
- 声音复刻需提供 授权凭证/确认流程;记录审计日志
- 支持租户级“禁用声音复刻”开关(可选)
- 验收标准(示例)
- 创建后可在音频合成中选择该声音;可删除/停用并留痕
4.2.2 音频合成(TTS)
- 功能说明:多场景模板适配、语音参数动态调节、快速合成
- 输入:文本、声音(默认/复刻)、模板(新闻播报/短视频旁白等)、参数(语速/语调/停顿/情绪等,具体待定)
- 输出:音频文件(含字幕时间轴可选)、预览与下载
- 验收标准(示例)
- 支持至少 1 个模板 + 参数调整;合成结果可预览与导出
4.3 数字人
- 功能说明:用用户音频 + 数字人模板视频生成口型/脸部动画,融合模板躯体,输出完整数字人视频
- 应用场景:新闻播报、短视频、教育培训、企业营销宣传、医疗健康等
- 输入:音频、数字人模板(视频/形象)、输出参数(分辨率/比例/背景等待定)
- 输出:数字人视频文件(可带字幕/封面待定)
- 验收标准(示例)
- 选择模板 + 上传音频后可生成可播放视频;支持下载与入库媒资
4.4 智能文稿
- 功能说明:面向传媒文本创作辅助,覆盖多文体:时政稿件、时事评论、视频脚本、报告、请示、通知、方案等
- 功能点
- 智能写作:给主题/素材生成正文
- 标题生成:多候选标题与理由(建议)
- 内容润色:语法/表达/结构优化
- 文风改写:按指定风格/媒体口径改写
- 输入:主题/提纲/素材(可引用媒资/知识库)、文体、字数、风格、禁用词/术语库(来自审校/专有名词)
- 输出:文稿(支持多版本、差异对比、引用来源标注待定)
- 验收标准(示例)
- 至少覆盖“写作/标题/润色/改写”四类操作,结果可保存为版本
4.5 智能创作(生成式多模态)
- 功能说明:文生图、文生视频、图生视频;接入“即梦AI”,并可覆盖音乐音效生成等能力
- 输入
- 文生图:提示词、风格、尺寸、张数、参考图(可选)
- 文生视频:提示词、时长、比例、风格、镜头(可选)
- 图生视频:输入图片、运动方式/风格、时长等
- 输出:图片/视频资产;生成记录;一键入库媒资
- 验收标准(示例)
- 三种生成入口可用;生成结果可入库、可检索、可二次创作
4.6 智能剪辑(剪映企业版协同)
- 功能说明:打通剪映企业版,提供视频创作管理一站式协同平台
- 功能点(来自方案)
- 强化协作能力:云空间、在线脚本、在线审阅、资产互通
- 企业商用素材:可使用版权方授权素材用于商业投放
- 企业资产管理能力:资产互通;支持拉取第三方业务系统媒资;导出到企业内部指定系统路径
- 高级安全控制:数据隔离、传输存储加密、身份绑定、数据留痕
- 关键集成需求(待明确)
- 账号体系:剪映账号与平台用户如何绑定(SSO/授权码/手动绑定)
- 资产互通:媒资格式规范、元数据字段映射、权限继承规则
- 导出路径:支持 S3/OSS/NAS/FTP/本地挂载等(待定)
- 验收标准(示例)
- 在平台可发起项目协作并同步剪映云空间资产;审阅意见可留痕
4.7 智能工具
4.7.1 智能审校
- 功能说明:支持文稿基础质量、安全合规、政敏性内容、企业专业知识、图片等审核;支持自定义规则与专有名词;覆盖广、准确率高
- 输入:文稿/图片/素材;审校规则集;专有名词/禁用词库
- 输出:问题清单(问题类型、位置、风险级别、建议修改);可一键应用修订(可选)
- 管理能力(建议)
- 规则配置:租户管理员/合规人员可配置规则、白名单、专有名词
- 审计留痕:谁在何时用何规则审了什么内容,结果如何
- 验收标准(示例)
- 至少覆盖:基础质量 + 合规/政敏 + 专有名词 三类;规则可配置并即时生效
4.7.2 音乐生成
- 功能说明:输入灵感或歌词生成整首人声音乐/纯音乐;可选曲风/情绪;支持中英文;用于广播、视频等
- 输入:灵感/歌词、曲风、情绪、语言、时长(待定)
- 输出:音频文件 + 使用授权信息(必须)
- 验收标准(示例)
- 可生成并下载;可入库媒资并带“版权/授权”元数据
4.7.3 录音文件识别(ASR)
- 功能说明:音频转文字;支持多编码格式、多场景、不同长短语音;用于质检/会议总结/内容分析等
- 输入:音频文件、语言、说话人分离(可选)
- 输出:文本 + 时间轴(可选)+ 关键词摘要(可选)
- 验收标准(示例)
- 支持至少 3 种常见音频格式;输出文本可复制/下载/入库
4.8 智能媒资(媒体资产管理)
- 目标:将非结构化媒资转为可复用、可挖掘价值的数字资产;覆盖采集、编目、审核、存储、检索、分发、二次创作全流程
- 范围(V1 建议拆解)
- 入库:上传/导入(来自生成式工具、剪辑导出、第三方系统拉取)
- 编目:元数据(标题、标签、栏目、版权、来源、时间、作者、敏感级别等)
- 审核:合规/版权/政敏;审核流(待明确)
- 存储:对象存储/本地存储策略(待明确)
- 检索:关键词 + 标签 + 结构化字段 +(可选)语义检索
- 分发:导出/下发到指定路径或外部系统(与剪辑模块打通)
- 二次创作:从媒资一键进入文稿/配音/数字人/生成式/剪辑
- 知识库融合
- 融合知识库、语料库、图片库,打通内部数据,形成统一应用知识库(需定义数据源、同步频率、权限继承)
- 验收标准(示例)
- 资产可入库、可编目、可检索、可导出;全流程操作留痕
5. SaaS 多租户与计费(需求)
5.1 多租户隔离
- 数据隔离:租户间数据不可见;数据库/存储层隔离策略待定(逻辑隔离/物理隔离)
- 配置隔离:模型配置、审校规则、专有名词、素材库、配额等均为租户级
- 权限控制:租户管理员可配置租户内 RBAC
5.2 套餐与计费(与“后期盈利模式”对齐)
- 套餐分层:基础版/专业版/企业版(需明确每档功能开关、配额、并发、存储、调用次数)
- 订阅周期:月/季/年
- 增值服务
- 私有化部署:一次性买断 + 年度维保
- 定制化开发:按需求定制模块/流程
6. 安全、合规与审计(非功能)
6.1 安全控制(来自方案 + 补充)
- 传输/存储加密:HTTPS/TLS;存储端加密(KMS 可选)
- 身份绑定:账号绑定外部系统(如剪映)需可控、可撤销
- 数据留痕:关键操作(生成、导出、审校、发布、删除、权限变更)全量审计日志
- 权限最小化:默认最小权限;敏感资产需要额外授权
6.2 合规要求(必须落地为流程)
- 声音复刻、数字人、生成内容需具备 授权/免责声明/水印或标识策略(细则待定)
- 版权素材使用需记录授权来源与使用范围(企业商用素材模块)
7. 外部依赖与集成清单(来自方案)
- 剪映企业版:视频创作与协同
- 火山引擎:按使用量计费的 AI 能力(具体 API/模块待定)
- 阿里云百炼:按使用量计费的 AI 能力(具体 API/模块待定)
- 数字人服务:按使用量计费(供应商/能力边界待定)
- 即梦AI:文生图/视频/音乐音效等(具体接入方式待定)
8. 资源投入与实施计划(原文摘录用于项目管理)
8.1 用量估算(原文)
- 年度生成图片 5 万张;生成视频 1 万个;每日拍摄素材 300G
8.2 费用估算(原文,按年)
- 剪映企业版:10 账号,首年 16 万,次年 10 万
- 火山引擎:约 20 万
- 阿里云百炼:约 20 万
- 数字人:约 10 万
合计约 66 万(以实际使用量为准)
8.3 周期规划(原文)
- 需求分析:2025.11.26 - 2025.12.31
- 开发:2026.01.01 - 2026.04.30
- 测试:2026.05.01 - 2026.05.31
- 上线:2026.06.01 - 2026.06.07
- 迭代:2026.07.01 - 持续
9. 验收清单(V1 建议)
- 智能策划:四类视角 + 策划提案生成可用;输出结构满足字段要求
- 智能文稿:写作/标题/润色/改写可用;审校联动可用
- 智能创作:文生图/文生视频/图生视频可用;结果可入库媒资
- 智能配音/数字人:可从文稿/脚本一键生成配音/数字人视频;资产入库
- 剪辑协同:与剪映企业版完成基础互通(项目/资产/审阅至少一项闭环)
- 智能媒资:入库-编目-检索-导出闭环;二次创作入口可用
- 多租户:租户隔离、租户管理员、权限模型、审计日志可用
- 安全合规:传输存储加密、关键操作留痕、授权流程(声音复刻等)落地
10. 待澄清问题(建议下一轮评审补齐)
- “策→采→编→发”中 采集/编审/发布 的具体业务流程与渠道清单是什么?
- 智能策划所需的 新闻库、评论/网友观点、热度数据 具体来源与合规边界?
- “新颖视角”判定规则:对比范围(内部/全网)、时间窗口、相似度算法口径?
- 知识库/语料库/图片库的数据源、同步机制、更新频率、权限继承策略?
- SaaS 套餐的功能开关与配额:存储、并发、调用次数、生成额度、账号数等如何分层?
- 与剪映企业版的集成深度:仅资产互通,还是包含项目协作/评论/审阅/发布回流?
- “小兴e”智体的具体产品形态与使用场景,是否纳入 V1?