我阅读了一些文章,指出服务器模式下的tika可提高性能。有人可以解释吗?我们可以在Java应用程序中实现类似的功能以获得更好的性能吗?

Running tika in server mode

最佳答案

在您提供的示例中,当使用jar将tika作为独立应用程序执行时,在实际处理pdf文件之前需要执行其他步骤。您可以将其大致分为3个:


JVM已实例化
蒂卡类的加载和配置(例如:解析器等)
(只有这样)tika会执行内容处理


在服务器模式下,在服务器启动时执行前两个步骤,并准备在接收文件时处理文件。

如果应用程序执行输入数据的某些处理,并且处理时间明显少于实例化和配置应用程序,则可以在应用程序中执行相同的操作。

至于实现,您可以看一下tika source code

关于java - 蒂卡在服务器模式下的性能,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/22318469/

10-09 04:08