
先说几个数字
2026 年 3 月 18 日,LibTV 正式上线。上线首日,超过 10 万用户涌入。
上线首月内,单产品单日收入突破 100 万美金。
截至目前,超过 300 家来自短剧、快消、教育、文化传媒领域的企业客户,正在基于 LibTV 进行内容生产与商业化创作。
两个月内,LibTV 迭代了超过 36 个新功能。
这些数字背后藏着一个信号:AI 视频行业的需求,远比供给来得猛。 而最先跑出来的产品,不是 Sora,不是 Runway,是一个中国团队做的、很多人还没听说过的平台。
LibTV 是什么?
LibTV 是 LiblibAI(哩布哩布 AI)推出的专业级一站式 AI 视频创作平台。
LiblibAI 成立于 2023 年底,目前已成为中国最大的多模态模型与创作社区,平台整合了图像、视频、3D、LoRA 训练等多模态能力,孵化了超过 2000 万 AI 创作者。LibTV 是它在视频赛道的旗舰产品。
一句话定义:在无限画布上完成剧本、分镜、生图、生视频、剪辑成片的全流程,同时面向人类创作者和 AI Agent 开放创作能力。
注意最后半句——"同时面向人类创作者和 AI Agent"。这是 LibTV 和其他所有 AI 视频工具最根本的区别。
三个让 LibTV 跑出来的核心能力
一、无限画布 + 节点工作流:从灵感碎片到结构化成片
传统视频制作是线性的:写剧本、画分镜、拍素材、剪片子,每一步都是独立环节,工具之间割裂,文件传来传去,版本越改越乱。
LibTV 的做法完全不同:把整个创作过程铺在一张无限画布上,每个环节是一个可拖拽、可连线、可复制的节点。
脚本节点:输入剧本内容,通过角色自动生成分镜脚本
图片节点:文生图、图生图,支持焦点编辑提取产品元素
视频节点:图生视频、文生视频,支持镜头控制
分镜组节点:一键生成 9/25 宫格分镜,打组管理不乱
剧情推演:AI 根据前文自动推演后续情节
所有节点可以自由拖拽、连线、复制。修改某一个节点的参数不会影响其他节点的结果。你可以同时在画布上展开多个分支——同一段剧情的不同版本、不同风格的尝试、不同镜头的组合——然后选择最好的那条。
视频创作从一段段线性操作,变成可以反复修改、复用和编织的结构化流程。
二、顶级模型聚合:不是自己造引擎,是把最好的引擎都装上
LibTV 的底层视频模型不是自己训练的,而是接入了当前最强的几款模型:
HappyHorse 1.0:阿里巴巴 ATH 事业群开发,以 Elo 1333 登顶 Artificial Analysis 文本转视频排行榜全球第一,支持音视频联合生成——输入文本,同步输出带音效的完整视频片段,15 秒多镜头叙事、1080P 超分输出
Seedance 2.0:字节跳动旗下视频模型,画面稳定、可控性强
可灵 3.0(Kling 3.0):快手旗下视频模型,国内第一梯队的生成质量
这意味着什么?你不需要在千问 App 里用 HappyHorse、在可灵官网用可灵、在 Seedance 平台用 Seedance——LibTV 把它们都接进来了,在同一个工作流里随意切换。
生成某个镜头用 HappyHorse(自带音效),下一个镜头换可灵(人物一致性更稳),再下一个用 Seedance(运动流畅度更好)——这种跨模型混合创作,只有在 LibTV 的节点工作流里才能实现。
三、AI Agent 双入口:人和"数字员工"用同一套创作工具
这是 LibTV 最独特的设计,也是 36 氪、OSCHINA 等媒体反复报道的核心亮点:
LibTV 不只是给人用的工具,也是给 AI Agent 用的工具。
LibTV 开放了标准化的 Skill 接口,AI Agent(比如 OpenClaw)可以通过 Skill 包直接调用 LibTV 的创作能力——理解任务、调用模型、自动编排工作流,从剧本到成片全自动生成,无需人工干预。
两种创作模式:
人机协同:你在画布上规划分镜、调整画面,AI 帮你生成和优化具体素材。你负责决策,AI 负责执行。
Agent 全自动:描述你想要什么视频,AI Agent 从剧本、分镜、生图、生视频到剪辑成片一条龙完成。你只需要验收。
这两个模式是平滑切换的——你可以让 Agent 先全自动出一版,然后在节点工作流里逐帧精修;也可以自己先搭好框架,让 Agent 填充具体画面。
LibTV = 人类创作者的专业工作台 + AI Agent 的标准化能力接口。
竞品对比:LibTV 的位置到底在哪?
| 维度 | LibTV | Sora | Runway Gen-3 | 可灵 | 剪映/CapCut |
|---|---|---|---|---|---|
| 定位 | 全链路视频创作平台 | 视频生成模型 | 视频生成工具 | 视频生成工具 | 视频剪辑工具 |
| 覆盖环节 | 剧本-分镜-生图-生视频-剪辑-成片 | 仅视频生成 | 仅视频生成 | 仅视频生成 | 剪辑-成片 |
| 模型来源 | 多模型聚合(HappyHorse/Seedance/可灵等) | 自有模型 | 自有模型 | 自有模型 | 无生成模型 |
| 工作流 | 无限画布+节点式,可复用 | 无 | 无 | 无 | 线性时间线 |
| 可控性 | 节点级控制,逐镜头打磨 | 提示词驱动,不可逐帧编辑 | 有限控制 | 有限控制 | 手动剪辑,高可控 |
| AI Agent | 双入口,支持 Agent 全自动生成 | 不支持 | 不支持 | 不支持 | 部分AI辅助 |
| 团队协作 | 画布实时协同,多人在同一空间操作 | 不支持 | 不支持 | 不支持 | 基础协作 |
| 工业化量产 | 工作流复用+批量任务+团队协作 | 不支持 | 不支持 | 不支持 | 手动操作 |
vs Sora:生成能力只是拼图的一块
Sora 的画面质量确实惊艳,这一点没有争议。但 Sora 是一个视频生成模型,不是一个视频创作平台。
你用 Sora 生成一段 10 秒的视频片段,然后呢?把它下载到本地,打开 Premiere 做剪辑,再找工具加字幕,再找平台做配音——一圈折腾下来,你花了生成时间的十倍在"后处理"上。
Sora 解决的是"能不能生成一段好看的视频片段",LibTV 解决的是"能不能做出一条能交付的视频成品"。
打个比方:Sora 是摄影棚里最好的摄像机,LibTV 是从摄影棚到后期机房到出片的一整条产线。
vs Runway:生成器不是创作平台
Runway 是 AI 视频领域的先行者,Gen-3 的生成质量不错,Motion Brush 等控制功能也有一定精细度。
但 Runway 的交互逻辑是"输入-输出"的单次循环。生成一段视频,下载,换提示词,再生成,再下载。想做一条完整的视频?你得自己把下载的片段拿到别的软件里拼接剪辑。
Runway 还有一个问题:它只用自己的模型。你在 Runway 上只能用 Runway 的生成能力,不能切换到 HappyHorse 体验音视频联合生成,不能用可灵获得更好的角色一致性。
Runway 帮你造素材,LibTV 帮你造成品。而且 LibTV 用的素材引擎比 Runway 多好几个。
vs 可灵:底层模型和上层平台不在同一维度
可灵是快手做的视频生成模型,生成质量在国内属于第一梯队。
但可灵是一个生成工具,不是一个创作平台。你在可灵上生成视频素材,分镜怎么规划?剧本怎么写?多段素材怎么拼接?角色一致性怎么保证?这些可灵都不管。
有意思的是,LibTV 的底层接入了可灵——你在 LibTV 的工作流里可以调用可灵的生成能力。可灵是 LibTV 工作流里的一个节点,而 LibTV 是包含可灵在内的完整创作系统。
它们不是竞争关系,是上下游关系。
vs 剪映/CapCut:AI 原生 vs AI 后补
剪映在视频剪辑领域的地位毋庸置疑——操作简单、模板丰富、国民级工具。
但剪映的核心逻辑是传统剪辑:手动导入素材、手动拖时间线、手动加转场。AI 功能是后补的——AI 字幕、AI 配音、AI 滤镜——这些是锦上添花,不是底层架构。
LibTV 是 AI 原生的:节点工作流、无限画布、Agent 全自动生成,每一个环节都是围绕"人机协同创作"设计的。更关键的是,LibTV 包含了从剧本到成片的完整链路,而剪映只覆盖剪辑到成片这一段。
剪映是"拿到素材之后怎么办",LibTV 是"从想法到素材到成品"——起点不一样,终点也不一样。

团队版:短剧工作室的量产利器
2026 年 5 月,LibTV 团队版正式上线,直接瞄准短剧工作室的量产需求:
画布实时协同:团队成员在同一画布内同步操作,谁在线、改了什么、进度到哪一步,实时可见
分工协作:伙伴 A 负责剧本和脚本视图,伙伴 B 负责分镜调整和 AI 生成分镜视频,各司其职
分镜组管理:一键生成分镜并打组,画布再大也不乱
字幕擦除:AI 自动识别并擦除视频中的字幕,方便二次创作
画布整理:一键整理杂乱的节点布局
根据实测反馈,团队版的协作体验接近 Figma 在设计领域的实时协作——不需要文件传来传去,不需要手动刷新,不需要对版本,所有编辑内容即时同步。
以前做 AI 短剧是个人手艺活,现在终于有了团队量产的基础设施。
谁该用 LibTV?
短剧工作室
日更、周更、量产——你需要的不只是生成能力,而是从剧本到成片的全流程工业化生产线。LibTV 的节点工作流+团队协作+多模型聚合,直接把产能拉满。
广告制作
TVC、产品宣传片、社媒创意视频——甲方要精确到帧的控制,又要求高效交付。LibTV 的人机协同模式,让精度和效率兼得。而且 HappyHorse 的音视频联合生成能力,对广告场景简直是量身定做。
内容创作者
想快速把想法变成视频成品,又不想在五个工具之间来回切换。LibTV 一个平台走完整个流程,从第一个镜头到最后一条字幕。
AI Agent 开发者
LibTV 提供了标准化的 Skill 接口——你的 Agent 可以直接调用剧本生成、分镜设计、图片生成、视频生成等能力,实现从一句话到成片的全自动生成。
一个正在发生的转变
AI 视频行业正在经历一个关键转折:从"谁能生成最好的视频片段"到"谁能提供最完整的视频创作工作流"。
2024 年,行业在争论谁的生成质量更高。2026 年,问题变了——单段视频的生成质量已经不是瓶颈,HappyHorse、可灵、Seedance 都能出不错的画面。真正的瓶颈在生成之后:怎么规划分镜?怎么保证角色一致性?怎么拼接多段素材?怎么在团队里协作?怎么批量生产?
这些问题的答案不在生成模型里,而在创作平台里。
LibTV 不是在和 Sora 比谁的画面更惊艳,也不是在和可灵比谁的模型更稳。它是在做一件更基础的事:给 AI 视频创作搭一套完整的基础设施。
上线两个月,10 万+用户、单日百万美金收入、300+企业客户——这些数字说明一件事:需求已经成熟了,只是之前没有合适的供给。
