AI 智能提取视频硬字幕工具 v2.3.0

把视频里烧死的硬字幕
变成可编辑的文本

提取硬字幕、解码原盘图形字幕、双引擎 AI 识别。全程只需点几个按钮,彻底告别繁琐的手工打轴。

立即下载 (Win) 了解工作流

极简工作流程一览

1
加载视频
2
框选扫描区
3
提取图片
4
AI提纯
5
批量OCR
6
手动校对
7
导出字幕

① 硬字幕提取 & ④ AI 提纯去重

  • 智能提取:打开视频用鼠标框选字幕区域,点击「提取图片」,软件自动逐帧扫描,精准识别每一条字幕的起止时间。
  • 三种精度:提供智能跳帧(极速)、每秒12次(平衡)、逐帧扫描(无遗漏),满足不同需求。支持「时段扫描」跳过片头片尾。
  • 图像提纯:识别前可运行「AI 提纯」,通过图像哈希指纹比对,自动合并停留的重复帧、剔除无文字的空白帧,将大模型任务量降到最低。
VIDEO_FRAME.mp4
电影画面区域
框 选 字 幕 区 域

② 图形字幕解码 & ③ 双引擎 OCR

  • 全格式支持:直接加载 PGS 蓝光 (.sup) 或 DVD VobSub (.idx+.sub),软件内置 Java 与 Python 解码引擎,自动提取每一帧图像。
  • 双引擎识别:内置阿里千问视觉大模型(提供推荐/最强/专精三档)与百度云 OCR。支持在设置中心一键切换。
  • 高并发与繁简死锁:5线程并发海量字幕秒级处理。系统强制保持图片原文的繁简状态,绝不悄悄将繁体转成简体。
图形字幕已解析 / 5线程 OCR 并发中...
00:12:01,500
[图像切片.png]
已完成
00:12:04,200
[图像切片.png]
识别中...
00:12:08,000
[图像切片.png]
排队中

⑤⑥⑦⑨ 播放器对轴与字幕精细编辑

除了提取图片,软件更是强大的字幕编辑器。支持直接加载已有 SRT/ASS 纯文本字幕。右侧内嵌基于 VLC 的播放器:双击左侧表格,视频自动跳转至该行字幕时间中心点;播放时当前行高亮跟播,底部展示电影级提词器。

查找替换字号 ±
#23 | 01:23:45风雨欲来
#24 | 01:23:48大战一触即发
➕ 插入新字幕行
🎯 OCR 重新识别
🔗 批量合并多行
♪ 批量添加音符
开始 -0.1s 结束 +0.1s
大战一触即发

⑧ 多格式导出 & ⑩ 全局拖拽支持

  • 全局拖放:支持直拖 .mp4 .mkv .sup .idx .srt 等十余种格式。拖入已有工作区时自动弹窗警告,防止误覆盖。
  • 多格式导出:一键导出 SRT、ASS、TXT 格式。路径默认与源视频同目录、同文件名。
  • 沉浸式图文包:勾选附带图文包,将额外生成包含所有截图、XML 以及 HTML 网页的文件夹。双击网页即可离线体验极速“左图右文”核对。
本地离线阅读 - 图文校对.html
时间轴原截图识别文本
01:23:45
01:23:48
风雨欲来
01:23:48
01:23:51
大战一触即发 (核对处)

进化史:更新日志

每一次迭代,都是为了极致的提取体验

v2.3.0 终极版

✨ 化繁为简:底层引擎重构 删除了 2.2.0 版本中复杂的“延迟”与“容错”手动调参按钮。实装“黄金大一统物理引擎”(纯净边缘哈希 + skip_ms/2 数学期望补偿),纯物理手段实现零漏字、零重叠,大道至简!
💿 重磅:原盘图形字幕极速解析 全面支持蓝光 .sup 与 DVD .idx/.sub 格式!引入多核并发涡轮。独家支持“便携式 Java (JRE)”环境劫持机制,实现原盘解析真正的双击即用。
🚀 交互美学与体验全方位升舱 新增丝滑物理拖拽雷达(异类完美共存,同类覆盖预警);右键菜单新增智能音符(♪)开关(自带状态机防手抖);双击表格时间轴实现视频狙击级空降定格。

v2.2.0 大版本更新

🌟 重磅:沉浸式图文校对系统 导出新增“附带图文包”功能!自动生成专属离线 HTML 网页,体验“左图右文”的极速可视化校对。
🛡️ AI 幻觉终结与底层引擎进化 引入“动态呼吸时间轴”,智能延长字幕结束时间;增加“降维合并算法”,彻底无视大模型乱加标点带来的合并歧义;套上“繁简死锁”枷锁,杜绝 AI 自作聪明的繁简转换。
📐 界面全面重构 界面控制台重构为更加紧凑高级的“双排分区”布局,左侧数据管理,右侧视频对轴,视野更清晰。

进阶操作与避坑答疑

快速解决您在使用过程中可能遇到的疑惑

图片上的文字太小看不清怎么办?

在左侧的字幕表格中,提取出来的截图并非静态死板的缩略图。您只需在图片上按住鼠标左键并拖拽,即可自由移动和放大图片局部,方便您轻松看清各种极限微小的死字幕!

如何整体偏移字幕的时间轴?

极其简单!在左侧表格中点击任意一行,按下键盘的 Ctrl + A(全选所有字幕),然后找到界面中间偏下方的“开始”或“结束”时间微调按钮(如:+0.1秒、-1秒)。点击它们,即可实现上千条字幕的全局时间轴同步平移!

AI 识别出来的错别字较多怎么办?

这是当前 AI 视觉大模型不可避免的“幻觉”现象导致的。目前最有效的解决办法是:点击右上角【⚙️ 设置】,在 API 设置里更换一个更聪明、算力更强的模型(例如切换到 qwen-vl-max 旗舰版),或者尝试切换为“百度云 OCR”引擎重新进行识别。

加载视频后右侧黑屏,点击也没反应?

这是新手最容易踩的坑!绝对不要把 `.exe` 启动程序单独拖到桌面上运行! 软件必须和压缩包里配套的 _internal 文件夹以及 vlc 文件夹待在同一个目录下,播放器引擎才能被正确唤醒。

加载蓝光 .sup 字幕时提示“缺少 Java 运行环境”?

解析结构复杂的蓝光原盘 SUP 格式,必须依赖底层的 Java (JRE) 环境。为了保持软件纯净绿化,我们支持“便携版劫持”:您只需前往官网下载免安装版的 Java 8 (JRE) 压缩包(约40MB),解压后重命名为 java,直接扔进本软件的根目录下(与 .exe 同级)。软件会自动静默调用,彻底免除配置系统环境变量的烦恼!