微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Lambda 上的 Apache Tika

如何解决Lambda 上的 Apache Tika

我已经能够在 AWS ECS 上将 Tika 服务器的 Docker 预构建映像作为 Fargate 任务运行。我现在想让 Tika 服务器(或等效功能)在 AWS Lambda 上运行。在请求到达 Lambda 之前,请求最初会通过 AWS API Gateway(HTTP 代理集成)。我绝对理解 Lambda 在大负载(即超过 6 MB)和时间限制(最多 15 分钟)方面存在问题,但我们计划使用 specifying the URL functionality 并且我们相信 Tika 不应该需要 15 分钟或更长时间提取一个文件。在 Lambda 上运行 Tika 可以实现更好、更轻松的可扩展性以及一些安全改进。

这种方法的难点在于 AWS Lambda 运行时让所有请求都通过一个 Lambda 处理函数。因此,不能只使用 Lambda 容器镜像,而是使用预先构建的 Lambda Docker 镜像。

我可以在 Lambda 处理函数中编写一堆代码来解析进入 Lambda 的请求,然后调用相应的 Apache Tika API 作为库。但是,我相信这需要大量代码

一个选项可能是编写 Lambda 处理程序函数以使用 Lambada framework。然而,这个框架处于测试阶段,似乎是一个死项目(最后一次提交是在三年前进行的)。此外,我不确定如何将 Lambada 与 Tika 一起使用。

如果我想让 Tika 在 Lambda 上工作,可用的最干净和最简单的选项是什么?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。