微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

为什么在分析声学参数如强度、RMS 幅度、基频等时,单声道比立体声更受欢迎

如何解决为什么在分析声学参数如强度、RMS 幅度、基频等时,单声道比立体声更受欢迎

在语音分析中,在使用 Praat 等软件时,我看到人们喜欢单声道而不是立体声。即使录音是使用立体声麦克风完成的,音频文件也经常被转换为立体声。除了节省大量内存之外还有其他原因吗?谢谢。

解决方法

我收集了大量关于是使用单声道还是立体声音频的评论来源。共识似乎是单声道音频节省空间,就像你说的。但是,一些消息来源指出您有时会想要使用立体声音频。

  1. 您想同时记录电声门数据。将音频和电声门数据作为“立体声”音频保存在一个文件中,可以让您的数据保持整洁。

  2. 您想录制一次音频,但也想在录制完成后选择更好的一半音频。

另外,请注意,人类语言几乎是作为单声道信号产生的。我不知道有任何人类语言依赖立体声音频来传达有意义的信息。 This link 提到一些涉及紧急通信的职业利用每只耳朵中的不同音频同时获取更多信息,但这是我所能找到的关于语言立体声使用的最接近的资源。

当多个文件不是全单声道或全立体声时,Praat 似乎也无法处理多个文件,因此这也可能是使用单声道音频的原因。将单声道音频复制到双耳与将立体声音频减少为单声道音频并不完全相同。

以下是我发现的最有用的来源:

来自https://colangpraat.wordpress.com/part-3-how-to-record-using-praat/

在 Objects 窗口的菜单栏中,单击 NEW 和 RECORD MONO SOUND。 PRAAT 还具有立体声录音功能,但在收集语言数据时,首选单声道文件。

来自https://web.stanford.edu/dept/linguistics/corpora/material/PRAAT_workshop_manual_v421.pdf

在大多数情况下,您将录制单个语音或语音样本,为此 您可以选择“录制单声道声音...”。如果你想做立体声 录音,您显然必须使用“录制立体声声音”。后一种选择, 例如,可用于数字化 EG-2 PC 的立体声输出信号 Glottal Enterprises 的电声门图仪 (http://www.glottal.com/electroglottograph.html),从而使您可以访问 同时记录语音和EGG信号。

来自https://www.fon.hum.uva.nl/praat/manual/ExperimentMFC_2_2__The_stimuli.html

您也可以使用 AIFF 文件,在这种情况下,stimulusFileNameTail 可能是“.aiff”,或 Praat 支持的任何其他类型的声音文件。但所有声音文件必须具有相同数量的声道(即全部为单声道或全部为立体声)和相同的采样频率。

来自https://www.fon.hum.uva.nl/david/LOT/sspbook.pdf

在我们继续之前,我们重复一遍,声音在 Praat 中表示为矩阵,这意味着 声音存储为数字行。单声道声音是只有一行和许多的矩阵 列。立体声是具有两个声道的声音,每个声道在一行中表示 的矩阵。因此立体声是一个有两行的矩阵,两行有相同的 列数。每个矩阵单元格包含一个样本值。每当我们想要使用 我们可以将声音视为矩阵。

来自https://person2.sol.lu.se/SidneyWood/praate/monstee.html

但请确保您能从将通道合并为一个单声道信号中获益。在 Praat 中使用立体声录音机并选择最佳频道更简单。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。