为什么在分析声学参数如强度、RMS 幅度、基频等时，单声道比立体声更受欢迎

如何解决为什么在分析声学参数如强度、RMS 幅度、基频等时，单声道比立体声更受欢迎

在语音分析中，在使用 Praat 等软件时，我看到人们喜欢单声道而不是立体声。即使录音是使用立体声麦克风完成的，音频文件也经常被转换为立体声。除了节省大量内存之外还有其他原因吗？谢谢。

解决方法

我收集了大量关于是使用单声道还是立体声音频的评论来源。共识似乎是单声道音频节省空间，就像你说的。但是，一些消息来源指出您有时会想要使用立体声音频。

您想同时记录电声门数据。将音频和电声门数据作为“立体声”音频保存在一个文件中，可以让您的数据保持整洁。
您想录制一次音频，但也想在录制完成后选择更好的一半音频。

另外，请注意，人类语言几乎是作为单声道信号产生的。我不知道有任何人类语言依赖立体声音频来传达有意义的信息。 This link 提到一些涉及紧急通信的职业利用每只耳朵中的不同音频同时获取更多信息，但这是我所能找到的关于语言立体声使用的最接近的资源。

当多个文件不是全单声道或全立体声时，Praat 似乎也无法处理多个文件，因此这也可能是使用单声道音频的原因。将单声道音频复制到双耳与将立体声音频减少为单声道音频并不完全相同。

以下是我发现的最有用的来源：

来自https://colangpraat.wordpress.com/part-3-how-to-record-using-praat/

在 Objects 窗口的菜单栏中，单击 NEW 和 RECORD MONO SOUND。 PRAAT 还具有立体声录音功能，但在收集语言数据时，首选单声道文件。

来自https://web.stanford.edu/dept/linguistics/corpora/material/PRAAT_workshop_manual_v421.pdf

在大多数情况下，您将录制单个语音或语音样本，为此您可以选择“录制单声道声音...”。如果你想做立体声录音，您显然必须使用“录制立体声声音”。后一种选择，例如，可用于数字化 EG-2 PC 的立体声输出信号 Glottal Enterprises 的电声门图仪 (http://www.glottal.com/electroglottograph.html)，从而使您可以访问同时记录语音和EGG信号。

来自https://www.fon.hum.uva.nl/praat/manual/ExperimentMFC_2_2__The_stimuli.html

您也可以使用 AIFF 文件，在这种情况下，stimulusFileNameTail 可能是“.aiff”，或 Praat 支持的任何其他类型的声音文件。但所有声音文件必须具有相同数量的声道（即全部为单声道或全部为立体声）和相同的采样频率。

来自https://www.fon.hum.uva.nl/david/LOT/sspbook.pdf

在我们继续之前，我们重复一遍，声音在 Praat 中表示为矩阵，这意味着声音存储为数字行。单声道声音是只有一行和许多的矩阵列。立体声是具有两个声道的声音，每个声道在一行中表示的矩阵。因此立体声是一个有两行的矩阵，两行有相同的列数。每个矩阵单元格包含一个样本值。每当我们想要使用我们可以将声音视为矩阵。

来自https://person2.sol.lu.se/SidneyWood/praate/monstee.html

但请确保您能从将通道合并为一个单声道信号中获益。在 Praat 中使用立体声录音机并选择最佳频道更简单。