如何解决如何解决托管 QnA Maker/Azure 认知搜索服务在一段时间无负载后的高延迟问题
如何防止 Azure 认知搜索服务在空载一段时间后变冷?
我在聊天机器人中使用 QnaMaker(托管 QnA Maker 服务版本)。
QnaMaker 似乎在一段时间未使用后处于空闲状态。第一个查询需要 7 秒才能完成。第一个查询之后的每个查询都在一秒钟内完成。
聊天机器人本身(使用 Microsoft Bot Framework V4 nodejs 开发)没有延迟。即使一段时间没有使用(感谢机器人应用服务中的“始终开启”功能)
我使用 QnaMaker 的稳定 GA 版本和托管版本(预览版)。在第一个版本中,QnaMaker 的应用服务启用了“始终开启”功能。对于预览版,我没有可以检查的应用服务。
Chatbotcode 初始化 QnaMaker
const { QnAMaker } = require('botbuilder-ai');
const endpoint_fr = {
knowledgeBaseId: process.env.QnAKbId_fr,endpointKey: process.env.QnaEndpointKey_fr,host: process.env.QnaHostName_fr
};
try {
this.qnaMaker_fr = new QnAMaker(endpoint_fr,{});
} catch (err) {
console.warn(`QnAMaker Exception: ${err} Check your QnAMaker configuration in .env`);
}
实际调用 QnAMaker 服务
qnaResults = await this.qnaMaker_fr.getAnswers(stepContext.context);
QnAMaker 堆栈链接到 Azure 搜索资源。我正在使用的定价层为 Basic(1 个副本、分区和搜索单元) 正在使用 10 个索引(允许 15 个)来存储 7 个知识库。位置是西欧。
如何防止 Azure 认知搜索服务在空载一段时间后变冷?
[更新] 进一步挖掘并得出结论,这种冷启动仅发生在(预览)托管服务中的知识库中。我决定将所有 KB 移动到稳定版本,冷启动问题就停止了。这也可能与我在西欧并且托管版本仅在北欧可用的事实有关
解决方法
很高兴您使用了“始终开启”。 QnA Maker 团队有时建议使用 Azure 应用洞察监视器添加快速可用性/网络测试(请参阅https://docs.microsoft.com/azure/azure-monitor/app/monitor-web-app-availability)。这本质上是一个可以解决冷启动问题的每隔几秒的探测服务。
,我不确定 App Insights,但我确实有一个针对 QnA Maker 服务运行的定期测试,主要是为了监控正常运行时间,但它可以使服务保持“温暖”。我设置了一个 Azure 函数(链接到与 QnA Maker 应用服务相同的应用服务计划),并让它在定义的时间间隔内进行标准的 REST 查询(我使用 15 分钟,你可以使用任何东西,特别是如果你正在使用标准服务层,查询次数没有限制或额外费用)。您只需要从资源中获取适当的密钥即可发出请求并将其存储在您的配置或 Key Vault 中,我假设您已经从机器人本身中熟悉了这些。不应为您增加任何成本。
如果可以通过 ping 保持服务温暖,Jennifer 的建议可能会奏效,但我可以告诉您,我通过 Azure Functions 运行的自动化测试出现了 0 个问题。
,我将所有 QNA 知识库移回了稳定版本。托管版本似乎导致了冷启动。不知道为什么,但我的机器人又开始表演了。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。