如何解决CNN 输出的非常高的分类阈值以获得良好的性能正常吗?
我正在尝试在足球比赛音频上训练 CNN 以预测精彩片段。数据由持续时间 t=1s 和速率 10Hz 的 MFCC 频谱图 (https://librosa.org/doc/main/generated/librosa.feature.mfcc.html) 组成。这些 MFCC 频谱图(每场比赛约 3000 个,标记镜头的 t=300 秒)都被标记:1 如果对应于高光情况,0 如果对应于低光。它们都是 32x40 矩阵:40 高的 MFC 系数(参见 librosa 文档)和 32 宽的每秒 32 个样本。
我正在用这些数据训练 CNN。这是它的架构: CNN architecture
我有一个来自 PSGvMU 游戏的平衡集,由 50% 高光/50% 低光 MFCC 光谱图组成。该集合分为 80% 平衡的训练数据集和 20% 平衡的验证数据集。
我正在用 10 个时期、32 个批次大小、lr=0.001 的 adam 优化器训练我的模型。以下是训练时期: Training epochs accuracies and validation accuracies
每次我在新的 MFCC 频谱图上测试我的模型时,预测值(0 到 1 之间)的均值非常高(~0.99+)并且最佳分类阈值(通过执行 argmax(accuracy | threshold) 计算)通常是也非常高,通常在 0.99-0.999 左右。
Accuracy as function of classification threshold graph
问题是我需要知道真正的标签才能获得好的分类阈值,从而获得好的结果。
你觉得我的方法怎么样?我的模型有问题吗?还是我只是缺乏数据/过度拟合?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。