微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

youtube VTT 字幕中的空行

如何解决youtube VTT 字幕中的空行

我正在解析来自 youtube 的示例 VTT 字幕文件并找到这种格式:

WEBVTT
Kind: captions
Language: es

00:00:00.000 --> 00:00:01.910 align:start position:0%
 
tenemos<00:00:00.480><c> una</c><00:00:00.719><c> oportunidad</c><00:00:01.260><c> de</c><00:00:01.410><c> oro</c><00:00:01.560><c> para</c><00:00:01.890><c> que</c>

00:00:01.910 --> 00:00:01.920 align:start position:0%
tenemos una oportunidad de oro para que
 

00:00:01.920 --> 00:00:04.130 align:start position:0%
tenemos una oportunidad de oro para que
la<00:00:02.250><c> salud</c><00:00:02.580><c> mental</c><00:00:02.760><c> deje</c><00:00:03.720><c> de</c><00:00:03.840><c> ser</c><00:00:04.020><c> la</c>

00:00:04.130 --> 00:00:04.140 align:start position:0%
la salud mental deje de ser la
 

00:00:04.140 --> 00:00:06.619 align:start position:0%
la salud mental deje de ser la
cenicienta<00:00:04.319><c> de</c><00:00:05.009><c> la</c><00:00:05.130><c> salud</c><00:00:05.430><c> pública</c><00:00:05.879><c> escuchen</c>

  1. 根据 WebVTT api 2 换行符制作一个“空行”,标志着提示的结束。我看到了 2 个换行符/1 个换行符/2 个换行符 1 个换行符的模式……但它们似乎都是完全形成的提示提示间的额外换行符有何意义?

  2. 从示例中可以明显看出,提示之间存在大量文本内容重叠。有没有办法根据重叠来识别线索之间的关系?例如。 Cue 1 第 2 行包含在 Cue 2 第 1 行等中。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。