不用学剪辑了!用 AI 轻松复刻「小Lin说」风格的口播视频

AI 让我们能无痛创作文本,在此基础上接入生图 API 还可以无痛创作图文。那能否更近一步,用 AI 无痛创作视频?幸运的是,CodeX 的 HyperFrames 插件极大地降低了做教学类视频的门槛。
但如果我要做的是像「小Lin说」那样的口播视频,也就是说,画面是与口播稿相关的真实的图片/视频,展示数据的时候需要有相应的 MG (Motion Graphics) 动画,又应该怎么做呢?
很容易想到的技术路线是:
- 用 TTS 生成音频,用 remotion 拼接片段形成视频。
- 用前端作动画效果。
但这存在问题:
- 需要准备大量的图片素材,还需要一个图像检索系统,用于检索跟口播稿相关的图片。
- MG 动画需要大量的预设。
为了解决制作「小Lin说」风格的口播视频的难题,今天给大家介绍一个 AI 工具——B 站出的视频制作 Agent「花生🥜」。
花生🥜是什么?
「花生🥜」是专为长视频创作者打造的视频制作智能体,可以将文字和声音制作成专业视频,让创作者无需学习复杂的剪辑,进而能专注在内容创意上。
花生🥜相比于传统剪辑工具的优势:
- 零门槛生成:输入字幕文案或上传口播音频,AI 自动分析内容,制定方案并生成完整视频。
- 对话式剪辑:用自然语言实时修改视频内容。
- 高清素材库:千万级高清图片/视频素材,覆盖全品类。
- 原生 MG 动画:AI 自动识别数据、概念与逻辑,生成动态图表、递进动画。
- AI 音色克隆:用 10 秒录音生成专属克隆音色。
用花生制作幻灯片式视频
第一步:准备口播稿
首先需要将你的文章类内容转化为视频口播稿,这边提供一段提示词:
你是一位专业的视频内容创作者,擅长将文章改写为适合视频播出的口播逐字稿。请将我提供的文章按以下规则进行改写:
【核心目标】
改写后的内容需要"念出来自然、听进去舒服",不能存在任何让播音者停顿或犹豫的表达。
【改写规则】
1. 书面语转口语
- 将所有正式书面表达替换为口语化表达
- 示例:「此外」→「另外」/「还有」;「然而」→「但是」/「不过」;「已然」→「已经」;「鉴于此」→「所以」
2. 拗口词替换
- 找出读起来不顺口、不适合说出口的词,换成口语等价词
- 示例:「发心」→「初衷」/「出发点」;「审计」→「财务检查(审计)」;「极大地减小」→「大幅降低」;「赋能」→「帮助」/「让…能够」
3. 长句拆短句
- 一句话超过 25 字、或含多个从句时,须拆成多个短句
- 拆句后每句保持完整意思,句与句之间用口语连接词衔接
4. 数字与符号展开
- 所有数字须写成说话时的读法,避免播音者自行判断读音
- 年份:2024年 → 二〇二四年;百分比:50% → 百分之五十;倍数:3倍 → 三倍;货币:$100 → 一百美元
- 特殊符号(/、&、@、#等
)一律替换为对应的汉语说法或删除
5. 专业术语处理
- 第一次出现时,用括号补充口语解释,如:「ROI(也就是投资回报率)」
- 后续出现可直接用已建立的称呼,不重复解释
6. 自然过渡与连接
- 段落之间加入口语化过渡词,让内容流畅衔接
- 常用过渡词:「好,」「那么,」「说到这里,」「接下来,」「你可能会问,」
7. 增加互动感
- 适当使用「你」「咱们」「你有没有发现」「你可能也遇到过」等表达
- 开头可加入钩子句,引发好奇;结尾可加行动号召或总结金句
8. 删除冗余书面表达
- 删除视觉可读但口播冗余的词:「上文提到的」「如前所述」「综上所述」「由此可见」
- 替换为:「刚才说的」「前面提到」「所以」「你看」
9. 列表改口播列举
- 原文中的条目式列表(• - 1. 等)改为「第一……第二……最后……」的口语列举
- 若条目较多(超过4项),合并同类或精简为最重要的3项
10. 节奏与停顿标注
- 在需要停顿、换气的地方加「——」或「……」
- 需要强调的词用【】标注,如「这才是【真正的关键】」
- 不使用加粗、斜体等排版符号(这些在口播中无意义)
【不允许的行为】
- 不得改变原文核心观点和信息
- 不得随意增加原文没有的事实或数据
- 不得删除原文中重要的论据或案例
- 不得将多个人物/品牌名称混淆
【输出格式】
- 直接输出逐字稿正文,不加任何说明或注释
- 段落之间空一行,便于播音者换气识别
- 若原文有明显章节,可保留章节感,但章节标题须口语化,如「好,我们先来说第一点——」
以介绍欧洲国家的幸福指数为例。
书面语:
根据最新发布的《全球幸福指数报告》,欧洲国家在国民幸福感方面依然名列前茅。数据显示,芬兰已连续第七年蝉联榜首,其国民幸福指数得分高达7.74分。紧随其后的是丹麦与冰岛,分别以7.58分和7.53分位列第二和第三。值得注意的是,在前十名中,欧洲国家占据了八个席位,整体占比高达80%。研究表明,这些国家的高幸福感主要得益于其完善的社会福利体系、人均国内生产总值(GDP)超过60,000美元的经济水平,以及高达95%的社会信任度。此外,低腐败率和高自由度也是关键因素。然而,近年来部分西欧国家的年轻人幸福感出现了约5%的微幅下滑,这引发了学界的广泛关注。鉴于此,研究人员指出,持续关注心理健康和经济韧性将是维持高幸福感的长期课题。
口播稿:(其中的 【】 会保留在字幕中,如果你不需要,请删除它们)
好,你有没有发现,每年的全球幸福报告一出来,排在前面的【总是那几个欧洲国家】?刚才最新的数据显示啊,芬兰已经连续第七年拿到第一名了,他们的国民幸福指数得分高达七点七四分。—— 紧跟在后面的呢,是丹麦和冰岛,分别以七点五八分和七点五三位居第二和第三。你可能不知道,在排名前十的国家里面,欧洲国家就占了八个席位,整体比例高达【百分之八十】!那么,说到这里你可能会问了,为什么他们能感觉这么幸福呢?其实,这背后的原因主要有三点:第一,是他们有非常完善的社会福利体系;第二,是大家的口袋都挺鼓的,人均国内生产总值,也就是人均吉迪匹,超过了六万美元;最后一点,也是非常重要的一点,就是他们人与人之间的信任度高达百分之九十五。另外,社会环境非常廉洁,大家的生活自由度也很高。不过,这里面也出现了一个新情况。最近几年,部分西欧国家的年轻人,他们的幸福感其实出现了大约百分之五的微幅下滑。—— 这个现象也引发了专家们的广泛关注。所以你看,研究人员就说了,以后想要长期维持这么高的幸福感,除了看经济好不好,能不能持续关注大家的心理健康,【这才是真正的关键】。
第二步:制作视频脚本
以 输入文稿 模式为例,粘贴口播稿,选择音色,开始制作。

AI 分析后,认为内容涉及数字对比、排名展示等,推荐用 B - 素材混合MG动画 模式的 MG 动画以更好地呈现。但我们此处先选择 A - 素材剪辑成片 模式,后续对比两种模式的差异。
AI 分析后,给出了详细视频制作需求。图中圈出的是画面素材的要求。

比如我让它尽量用 2025-2026 年的素材,用自然语言描述修改意见即可。

修改后,AI 给出创作规划书,或者叫视频脚本,供你确认。如果你有修改意见,在右边的对话框中用自然语言描述并发送即可。

第三步:开始生成
确认创作规划书后,AI 开始制作视频,右边的对话框展示当前进度。

稍加等待即生成完成,可以先播放视频过一遍。首次播放可能有点卡顿,卡的时候稍微暂停一下,然后再继续播放即可。
第四步:交互式剪辑
修改 1:手动替换分镜素材点击要替换素材的分镜,在右侧选择新的素材即可。如果没有合适的素材,可以展开更多,或让 AI 重新配画面。

在弹出的窗口中可以预览素材,或截取其中的某个片段。
替换后,该分镜展示为新素材。

注意修改是需要消耗点数(右上角展示的花生米)的。
修改2:用自然语言替换分镜素材创作者不仅可以手动替换分镜素材,还能在右侧对话框中用自然语言描述需求,将其替换为满足要求的素材。比如我要求这个分镜的素材不要出现其他国家的国旗。

替换后的新分镜确实不包含其他国家的国旗。

修改 3:拆分、合并分镜此处以拆分分镜为例。注意到最后一个分镜对应的逐字稿较长:
以后想要长期维持这么高的幸福感,除了看经济好不好,能不能持续关注大家的心理健康,【这才是真正的关键】。
用自然语言让 AI 将最后一个分镜拆分为 2 个分镜。

成片展示

用花生添加 MG 动画
第一步:开始生成
同理粘贴口播稿。

此处我用到了我做的「现代数码少女感」的预设,它主要是影响 MG 动画的风格。
提示词:
# MG 动画风格描述
## 一、整体风格定位
**核心风格**:现代数码少女感 × 扁平化 MG 动画
将二次元的柔美可爱与现代信息图表的简洁高效相结合,打造既有视觉冲击力又不失亲和力的动画风格。适用于知识科普、营销推广、数据展示等场景。
---
## 二、配色方案
### 主色调
- **粉色系**:`#FFB6D9`(柔和粉)、`#FF85C0`(活力粉)、`#FF4D94`(深粉强调色)
- **白色系**:`#FFFFFF`(纯白)、`#F8F8F8`(柔白背景)
- **金色系**:`#FFD700`(金色粒子)、`#FFC700`(金色高光)
### 辅助色
- **渐变色**:粉色到白色的柔和渐变(用于标题、重点文字)
- **点缀色**:淡紫色 `#E6D5FF`、淡蓝色 `#D5E8FF`(用于信息面板、图标)
### 色彩使用原则
- 背景保持柔和渐变,避免纯色平铺
- 重点信息用高饱和度粉色突出
- 金色粒子和光效作为点缀,不宜过多
- 白色信息面板保持半透明感,增加层次
---
## 三、视觉元素
### 图标与符号
- **几何图标**:心形 ❤️、星形 ⭐、X 形 ✖️、对话气泡 💬、复选框 ☑️
- **数据图标**:折线图 📈、柱状图 📊、大脑图标 🧠、照片堆叠 📷
- **装饰元素**:发光粒子、光晕、星光点缀、蝴蝶结 🎀
### 角色设计(可选)
- **Q 版(Chibi)二次元角色**:
- 大头小身体比例(头身比约 1:1.5)
- 深色长发,粉色发饰(X 形、蝴蝶结)
- 表情生动(眨眼、微笑、兴奋)
- 手势丰富(指向、比心、挥手)
- 服装:粉白色制服裙、外套,带有少女感细节
### 信息面板
- **样式**:白色半透明卡片,圆角矩形
- **内容**:标题 + 图标 + 列表/图表
- **排版**:左对齐,层次分明
- **阴影**:柔和投影,增加立体感
---
## 四、动效特点
### 入场动效
- **飞入**:图标、文字从屏幕边缘飞入,带有弹性缓动
- **渐显**:信息面板从透明到不透明,伴随轻微放大
- **粒子散开**:金色粒子从中心向四周散开,形成光晕
### 强调动效
- **闪烁**:重点数字、标题闪烁 1-2 次,吸引注意
- **脉冲**:心形、星形图标周期性脉冲放大缩小
- **光效扫过**:金色光束从左到右扫过文字,增加科技感
### 转场动效
- **擦除**:当前画面被粒子擦除,露出下一画面
- **旋转**:信息面板旋转翻转,切换到新内容
- **缩放**:画面整体缩小到一个点,然后新画面从点放大
### 循环动效
- **漂浮**:粒子、图标在画面中缓慢漂浮
- **呼吸**:光晕周期性明暗变化
- **旋转**:星形、X 形图标缓慢自转
---
## 五、字体与排版
### 字体选择
- **标题字体**:粗体、圆润、有力量感(如思源黑体 Bold、阿里巴巴普惠体 Heavy)
- **正文字体**:中等粗细、易读(如思源黑体 Regular、苹方-简 常规体)
- **数字字体**:等宽、现代感(如 DIN、Roboto Mono)
### 排版原则
- **标题**:分行排列,主标题大,副标题小,颜色渐变
- **正文**:左对齐,行距 1.5 倍,段落间距明显
- **数字**:特大号显示,用粉色或渐变色强调
- **标注**:小字号,淡色,不抢主体
### 文字动效
- **逐字出现**:标题文字逐字弹出,带有轻微弹跳
- **打字机效果**:正文文字像打字机一样逐字显示
- **数字滚动**:数字从 0 快速滚动到目标值
---
## 六、场景氛围
### 背景设计
- **渐变背景**:柔和的粉白渐变,从左上到右下
- **粒子背景**:金色、白色粒子在背景中缓慢漂浮
- **光晕效果**:画面四周有柔和的光晕,增加梦幻感
### 空间层次
- **前景**:角色、主标题、重点图标
- **中景**:信息面板、图表、列表
- **背景**:渐变、粒子、装饰元素
### 光影效果
- **发光**:重点元素(标题、数字、图标)自带发光效果
- **投影**:信息面板、角色有柔和投影,增加立体感
- **高光**:金色高光点缀在关键位置
---
## 七、技术规格
### 画面比例
- **横版视频**:16:9(适合 YouTube、B 站横屏)
- **竖版视频**:9:16(适合抖音、快手、小红书)
- **封面图**:5:2 或 16:9
### 分辨率
- **标清**:1280×720(720p)
- **高清**:1920×1080(1080p,推荐)
- **超清**:3840×2160(4K,用于高质量展示)
### 帧率
- **标准**:30fps(流畅,文件小)
- **高帧率**:60fps(更流畅,适合快节奏动画)
### 动画时长
- **单个动效**:0.3-0.8 秒(快速、不拖沓)
- **转场**:0.5-1 秒
- **完整分镜**:2-5 秒
---
## 八、风格参考关键词
生成视频时,可使用以下关键词组合:
MG 动画风格,2D 扁平化,柔和粉色和白色色调,金色粒子和光晕,Q 版二次元角色,现代数码感,少女感,信息图表,白色半透明卡片,心形星形图标,发光效果,渐变文字,弹性动画,干净简洁,高饱和度,圆角设计,16:9 横向画面
---
## 九、情绪与节奏
### 情绪基调
- **积极向上**:色彩明亮,动效轻快
- **亲和可爱**:Q 版角色,柔和线条
- **专业可信**:信息面板,数据图表
### 节奏控制
- **开场**:快速吸引注意(0-2 秒)
- **展开**:信息逐步呈现(2-8 秒)
- **高潮**:重点数据强调(8-10 秒)
- **收尾**:总结或引导行动(10-12 秒)
---
## 十、注意事项
1. **避免过度装饰**:粒子和光效适量即可,不要遮挡主体信息
2. **保持可读性**:文字大小、颜色对比要确保易读
3. **统一风格**:同一视频中的所有元素风格保持一致
4. **适配平台**:根据发布平台调整画面比例和时长
5. **测试效果**:生成后在目标设备上测试观看效果
这次我们选择 B - 素材混合MG动画 模式。
生成的视频成片需求文档多了 MG 动画相关的部分。

此处用到了其他字体,为了规避版权问题,我本来想将其改成免费可商用的思源字体。
但它没有替换成功,询问后发现它只支持几种字体。

字体选择完毕后,开始生成。观察到出现一些 MG 动画相关的组件。

MG 动画的生成需要消耗一点时间,稍加等待后生成完成。
MG 动画需要动态展示,此处先截图展示部分静态效果,最后的成片展示再展示动态效果。
效果 1:展示数值的柱状图
效果 2:展示比例的环状图
效果 3:丰富画面的动画效果
效果 4:展示趋势变化的折线图(注意此处 AI 自动搜索了以往年份的数据

注意,如果分镜有 MG 动画,则视频暂停时 MG 动画可能会继续播放。所以暂停视频之后想再次播放之前,最好先回到 MG 动画出现之前的分镜再继续播放。
第二步:交互式剪辑
修改 1:调整 MG 动画配色我希望修改最后一个 MG 动画的配色,将其改为 B 站品牌配色(我不知道是什么配色,但是 AI 自己会去搜)。

修改后的效果如下,看来 B 站品牌配色是粉 + 蓝 + 白。

修改 2:新增 MG 动画分镜 05 原本没有 MG 动画,为其添加一个装饰性的 MG 动画。

成功生成了一个三角形,但里面没有马斯克的照片。用自然语言描述修改意见。

尝试几次后,确实加上了照片(虽然不是马斯克的)。

成片展示

体验方式
花生🥜还有克隆音色等其他功能。
我把花生🥜的链接放在下方评论,大家快去体验一下!
它既可以开会员,也可以按量付费,还是挺灵活的,点数消耗也不快,性价比很高。
对了,用的时候不要开魔法,不要开浏览器插件,否则视频在线播放会很卡,尤其是有 MG 动画的时候。如果实在卡到播不了,也可以下载到本地再看,但需要等待导出视频。

