强大的音视频处理工具:FFmpeg4 6. 字幕处理 1.6 1. 背景知识 1.6.1 1. 字幕分类 1.6.1.1 2. 字幕格式 1.6.1.2 2. 编辑字幕 1.6.2 1. Aegisub 1.6.2.1 3. 提取字幕 1.6.3 4. 转换字幕 1.6.4 5. 嵌入字幕 1.6.5 1. 指定字幕位置 1.6 6.5.1 2. 指定字幕文字属性 1.6.5.2 7. ffmpeg使用心得 1.7 8. 用到ffmpeg的 1.8 1. Python 1.8.1 9. 附录 1.9 1. help语法 1.9.1 2. 文档 1.9.2 3. 参考资料 1.9.3 强大的音视频处理工具:FFmpeg 最新版本: v1 动图转视频;以及水印处理,包括去除视频水印;从视频中提取完整音频和音频片 段;字幕相关处理,包括字幕的背景知识,包括软字幕和硬字幕、常见字幕格式ass和 srt;以及如何用Aegisub编辑字幕;从视频中提取字幕、从srt转换出ass字幕;嵌入字 幕,包括用流拷贝模式嵌入软字幕、用vf模式烧录嵌入硬字幕、且可以指定字幕位 置、指定字幕文字属性等;整理ffmpeg使用的心得和常见问题;以及其他有哪些工具 软0 码力 | 139 页 | 2.60 MB | 1 年前3
强大的音视频处理工具: FFmpeg提取⾳频⽚段 视频处理 视频属性 获取 调整 尺⼨调整 动图gif 视频转动图 动图转视频 ⽔印 去除⽔印 提取⾳频 字幕处理 背景知识 字幕分类 字幕格式 编辑字幕 Aegisub 提取字幕 转换字幕 嵌⼊字幕 指定字幕位置 指定字幕⽂字属性 ffmpeg使⽤⼼得 ⽤到ffmpeg的 Python 附录 获取 2 1.9.1 1.9.2 1.9.3 及⽔印 处理,包括去除视频⽔印;从视频中提取完整⾳频和⾳频⽚段;字幕相关 处理,包括字幕的背景知识,包括软字幕和硬字幕、常⻅字幕格式ass和 srt;以及如何⽤Aegisub编辑字幕;从视频中提取字幕、从srt转换出ass 字幕;嵌⼊字幕,包括⽤流拷⻉模式嵌⼊软字幕、⽤vf模式烧录嵌⼊硬字 幕、且可以指定字幕位置、指定字幕⽂字属性等;整理ffmpeg使⽤的⼼得 和常⻅问题;以及其他有哪 关的库 ffmpeg能⽤来⼲什么? 可以⽤ ffmpeg 做很多和⾳视频相关的处理。 绝⼤多数和⾳频视频字幕等相关的操作,ffmpeg都⽀持。 列举我之前遇到过的⼀些,供参考: 解析出视频的信息 举例 查看字幕属性信息 ffmpeg -i xxx.mp4 输出字幕信息: Stream #0:2(zho): Subtitle: mov_text (tx3g / 0x67337874)0 码力 | 73 页 | 11.57 MB | 1 年前3
强大的音视频处理工具:FFmpeg水印 去除水印 提取音频 字幕处理 背景知识 字幕分类 字幕格式 1.6.2 1.6.2.1 1.6.3 1.6.4 1.6.5 1.6.5.1 1.6.5.2 1.7 1.8 1.8.1 1.9 1.9.1 1.9.2 1.9.3 编辑字幕 Aegisub 提取字幕 转换字幕 嵌入字幕 指定字幕位置 指定字幕文字属性 ffmpeg使用心得 图、动图转视频;以及水印处理,包括去除视频水印;从视频中提取 完整音频和音频片段;字幕相关处理,包括字幕的背景知识,包括软 字幕和硬字幕、常见字幕格式ass和srt;以及如何用Aegisub编辑字 幕;从视频中提取字幕、从srt转换出ass字幕;嵌入字幕,包括用流拷 贝模式嵌入软字幕、用vf模式烧录嵌入硬字幕、且可以指定字幕位 置、指定字幕文字属性等;整理ffmpeg使用的心得和常见问题;以及 其他有哪 关的库 ffmpeg能用来干什么? 可以用 ffmpeg 做很多和音视频相关的处理。 绝大多数和音频视频字幕等相关的操作,ffmpeg都支持。 列举我之前遇到过的一些,供参考: 解析出视频的信息 举例 查看字幕属性信息 ffmpeg -i xxx.mp4 输出字幕信息: Stream #0:2(zho): Subtitle: mov_text (tx3g / 0x67337874)0 码力 | 139 页 | 9.35 MB | 1 年前3
ffmpeg翻译文档5 选项 6 例子 7 语法 8 表达式计算/求值 9 OpenCL选项 10 编码选项 11 解码器 12 视频解码 13 音频解码 14 字幕解码 15 编码 16 音频编码器 17 视频编码器 18 字幕编码器 19 比特流滤镜(过滤器) 20 格式选项 21 分离器(解复用) 22 混合器 23 元数据 24 协议 25 设备选项 26 输入设备 技巧/提示(原版已废弃) 6 例子 7 语法 8 表达式计算/求值 9 OpenCL选项 10 编码选项 11 解码器 12 视频解码 13 音频解码 14 字幕解码 15 编码 16 音频编码器 17 视频编码器 18 字幕编码器 19 比特流滤镜(过滤器) 20 格式选项 21 分离器(解复用) 22 混合器 23 元数据 24 协议 25 设备选项 26 输入设备 进行标记,并写入到任意数量/形式的输出 文件中,任何在命令行中不能被解释为选项的字符串信息(当然也不是被 -i 指定为输入文件的信 息)都被作为一个输出文件。 原则上每个输入或输出文件都可包含数量不同的数据流(视频/音频/字幕/附件/数据….),具体文件 中包含的数量和/或数据类型是文件的容器格式限定的,具体选择那些流从输入文件到输出文件则可能 是自动或者依据 -map 选项(在流的选择章中介绍)来指定。 为了明0 码力 | 502 页 | 3.06 MB | 1 年前3
ffmpeg基本杂谈_20171116
AVAudioResample AVFilter Protocol FFmpeg 转码流程 av_format_read ff_format_read 协议、⽂件格式 视频 ⾳频 字幕 附件 数据 其他 ⾳视频 编码 (主要 有2种模 式) ⾳视频 解码 (主要 有2种模 式) FFmpeg Demuxer FFmpeg Muxer Stream 概念 ff_format_write 协议、⽂件格式 【Protocol】 http File Pipe 【Format】 FLV MP4 TS RM AVI 视频 ⾳频 字幕 附件 数据 其他 FFmpeg SWS YUV RGB PAL 声道 采样 深度 转换 系统 AV Filter ⾃定义Filter/ Render 【Protocol】 ce、avfilter、avformat、 postproc、resample、scale; FFmpeg从功能划分:编解码、容器封装和解析、协议IO、⾳频重采样、 视频⾊彩空间转换、⾳视频字幕处理。 • Deep Step 1. FFmpeg是⽤C语⾔实现的⾯向对象的⾼效框架库,要先了解 FFmpeg KS(核⼼数据结构),将从流媒体数据流动⽅向,原始数据->帧->数据包- >流->容器->协议,逐步介绍。0 码力 | 55 页 | 20.91 MB | 1 年前3
.NET玩转音视频操作 FFmpeg示例3 gif表情包生成器 要点: • 视频解码 • 将每一帧转换为BGRA像素格式 • 使用Direct2D读取并绘制字幕 • 将每一帧输入视频过滤器,转换为PAL8格式 • 将PAL8编码像素格式的帧编码为gif • <源码和demo见下面链接> https://ffmpeg-sorry-demo.starworks0 码力 | 14 页 | 1.43 MB | 1 年前3
2022年美团技术年货 合辑,魏晓林(美团),刘偲(北京航空航天大学) 论文下载:PDF 论文简介:Panoptic Narrative Grounding (PNG) 是一项新兴任务,其目标是分割 由静止图像的密集叙述字幕描述的 things 和 stuff 类别的视觉对象。之前的两阶段方 法首先通过现有的全景分割模型提取分割候选区域,然后进行粗粒度的区域 - 短语匹 配以得到每个名词短语对应的分割结果。 然而0 码力 | 1356 页 | 45.90 MB | 1 年前3
Python 标准库参考指南 3.6.15 casefold=False, map01=None) 解码 Base32 编码过的bytes-like object 或 ASCII 字符串 s 并返回解码过的bytes。 可选的 casefold 是一个指定小写字幕是否可接受为输入的标志。为了安全考虑,默认值为 False。 RFC 3548 允许将字母 0(zero) 映射为字母 O(oh),并可以选择是否将字母 1(one) 映射为 I(eye) 或 L(el)。 casefold=False) 解码 Base16 编码过的bytes-like object 或 ASCII 字符串 s 并返回解码过的bytes。 可选的 casefold 是一个指定小写字幕是否可接受为输入的标志。为了安全考虑,默认值为 False。 如果 s 被错误地填写或输入中存在字母表之外的字符,将抛出binascii.Error。 base64.a85encode(b, *0 码力 | 1886 页 | 8.95 MB | 10 月前3
Python 标准库参考指南 3.6.15 casefold=False, map01=None) 解码 Base32 编码过的bytes-like object 或 ASCII 字符串 s 并返回解码过的bytes。 可选的 casefold 是一个指定小写字幕是否可接受为输入的标志。为了安全考虑,默认值为 False。 RFC 3548 允许将字母 0(zero) 映射为字母 O(oh),并可以选择是否将字母 1(one) 映射为 I(eye) 或 L(el)。 casefold=False) 解码 Base16 编码过的bytes-like object 或 ASCII 字符串 s 并返回解码过的bytes。 可选的 casefold 是一个指定小写字幕是否可接受为输入的标志。为了安全考虑,默认值为 False。 如果 s 被错误地填写或输入中存在字母表之外的字符,将抛出binascii.Error。 base64.a85encode(b, *0 码力 | 1886 页 | 8.95 MB | 10 月前3
Python 标准库参考指南 3.7.13 casefold=False, map01=None) 解码 Base32 编码过的bytes-like object 或 ASCII 字符串 s 并返回解码过的bytes。 可选的 casefold 是一个指定小写字幕是否可接受为输入的标志。为了安全考虑,默认值为 False。 RFC 3548 允许将字母 0(zero) 映射为字母 O(oh),并可以选择是否将字母 1(one) 映射为 I(eye) 或 L(el)。可选参数 casefold=False) 解码 Base16 编码过的bytes-like object 或 ASCII 字符串 s 并返回解码过的bytes。 可选的 casefold 是一个指定小写字幕是否可接受为输入的标志。为了安全考虑,默认值为 False。 如果 s 被错误地填写或输入中存在字母表之外的字符,将抛出binascii.Error。 base64.a85encode(b, *0 码力 | 1846 页 | 9.09 MB | 10 月前3
共 24 条
- 1
- 2
- 3













