微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何使用python3转换srt中的pocketsphinx响应数据

如何解决如何使用python3转换srt中的pocketsphinx响应数据

我需要从音频文件提取语音。使用pocketsphinx,我能够在音频中获取单词列表及其开始帧和结束帧。

现在我想将从口袋狮身人面像收到的响应转换为“SRT”文件格式。

我试图通过在开始帧和结束帧的基础上计算秒数来实现这一点。但是计算没有给出正确的响应。

以下是我正在处理的示例代码:-

from pocketsphinx.pocketsphinx import *
    config = Decoder.default_config()
    config.set_string('-hmm',MODELDIR + "/cmusphinx-en-us-8khz-5.2")
    config.set_string('-lm',MODELDIR + "/en-70k-0.2-pruned.lm")
    config.set_string('-dict',path.join(MODELDIR,'cmudict-en-us.dict'))
    decoder = Decoder(config)
    #
    stream = open('Welcome.wav','rb')
    decoder.start_utt()
    while True:
        buf = stream.read(1024)
        if buf:
            decoder.process_raw(buf,False,False)
        else:
            break
    decoder.end_utt()
    text = ""
    for seg in decoder.seg():
        print(seg)
        text = text + '\n' + seg.word + " " + str(seg.start_frame) + " " + str(seg.end_frame) + " " + str(seg.prob)

回复:-

    <s> 3699 3702 -27
    thank 3703 3731 -697
    you 3732 3748 -37
    for(2) 3749 3758 -21404
    choosing 3759 3810 -11526
    be 3811 3826 -38920
    an(2) 3827 3839 -54884

上面我得到了单词,开始帧,结束帧,概率。 现在我需要从上面的响应中生成“SRT”文件格式。 请为此提供任何解决方案。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?