如何解决Drool-Spark性能问题
我正在使用Spark流处理多个CSV文件。文件验证经常由于下游系统而改变。为此,我们决定探索Apache Drools。在使用Drools之前,大文件正在几秒钟内得到处理。在Drool中添加少量规则后,性能已大大降低。对于5MB的文件系统,需要3-4分钟来处理。我是Spark和Drools的新手,想了解如何在Java中一起使用它们。我遇到了多个答案,但不明白如何使用它。
下面是代码:
> Add-WindowsCapability -Online -Name OpenSSH.Client~~~~0.0.1.0
Add-WindowsCapability : Add-WindowsCapability Failed. Error code = 0x80240439
At line:1 char:1
+ Add-WindowsCapability -Online -Name OpenSSH.Client~~~~0.0.1.0
+ ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+ CategoryInfo : NotSpecified: (:) [Add-WindowsCapability],COMException
+ FullyQualifiedErrorId : Microsoft.dism.Commands.AddWindowsCapabilityCommand
验证文件:
@Configuration
@Slf4j
public class DroolConfig {
private KieServices kieServices = KieServices.Factory.get();
private KieFileSystem getKieFileSystem() throws IOException {
KieFileSystem kieFileSystem = kieServices.newKieFileSystem();
kieFileSystem.write(ResourceFactory.newClassPathResource("drlrules/rules.drl"));
return kieFileSystem;
}
@Bean
public KieContainer getKieContainer() throws IOException {
log.info("Container created...");
getKieRepository();
KieBuilder kb = kieServices.newKieBuilder(getKieFileSystem());
kb.buildAll();
KieModule kieModule = kb.getKieModule();
KieContainer kContainer = kieServices.newKieContainer(kieModule.getReleaseId());
return kContainer;
}
private void getKieRepository() {
final KieRepository kieRepository = kieServices.getRepository();
kieRepository.addKieModule(new KieModule() {
public ReleaseId getReleaseId() {
return kieRepository.getDefaultReleaseId();
}
});
}
@Bean
public KieSession getKieSession() throws IOException {
log.info("session created...");
return getKieContainer().newKieSession();
}
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。