我阅读了一些文章,指出服务器模式下的tika可提高性能。有人可以解释吗?我们可以在Java应用程序中实现类似的功能以获得更好的性能吗?
Running tika in server mode
最佳答案
在您提供的示例中,当使用jar将tika作为独立应用程序执行时,在实际处理pdf文件之前需要执行其他步骤。您可以将其大致分为3个:
JVM已实例化
蒂卡类的加载和配置(例如:解析器等)
(只有这样)tika会执行内容处理
在服务器模式下,在服务器启动时执行前两个步骤,并准备在接收文件时处理文件。
如果应用程序执行输入数据的某些处理,并且处理时间明显少于实例化和配置应用程序,则可以在应用程序中执行相同的操作。
至于实现,您可以看一下tika source code
关于java - 蒂卡在服务器模式下的性能,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/22318469/