承接国内外服务器租用托管、定制开发、网站代运营、网站seo优化托管接单、网站代更新,新老站点皆可!!咨询QQ:3787320601

apache tika检测文件会不会破坏的方法

管理员 2023-06-27 08:38:53 软件开发 15 ℃ 0 评论 2951字 收藏

apache tika检测文件会不会破坏的方法

Apache Tika用于文件类型检测和从各种格式的文件内容提取的库。

将上传文件至服务器,进行解析文件时,常常需要判断文件会不会破坏。我们可使用tika来检测文件会不会破坏

maven引入以下:

<dependency>
<groupId>org.apache.tika</groupId>
<artifactId>tika-app</artifactId>
<version>1.18</version>
</dependency>
<dependency>
<groupId>xerces</groupId>
<artifactId>xercesImpl</artifactId>
<version>2.11.0</version>
</dependency>

  如果jar包冲突时可以引入以下:

<dependency>
<groupId>org.apache.tika</groupId>
<artifactId>tika-core</artifactId>
<version>1.18</version>
</dependency>
<dependency>
<groupId>org.apache.tika</groupId>
<artifactId>tika-parsers</artifactId>
<version>1.18</version>
</dependency>
<dependency>
<groupId>xerces</groupId>
<artifactId>xercesImpl</artifactId>
<version>2.11.0</version>
</dependency>

使用tika检测文件会不会破坏: 

  如果从输入流读取失败,则parse方法抛出IOException异常,从流中获得的文档不能被解析抛TikaException异常,处理器不能处理事件则抛SAXException异常

  当文档不能被解析时,说明文档破坏

履行进程:

public static void main(String[] args) {
try {
//Assume sample.txt is in your current directory
File file = new File(“D:\\测试.txt”);
boolean result = isParseFile(file);
} catch (Exception e) {
e.printStackTrace();
}
}

/**
* 验证文件会不会破坏
*
* @param file 文件
* @return true/false
* @throws Exception
*/
private static boolean isParseFile(File file) throws Exception {
try {
Tika tika = new Tika();
String filecontent = tika.parseToString(file);
System.out.println(filecontent);
return true;
} catch (TikaException e) {
return false;
}
}

  输出结果:

测试数据—读取文本内容

总结

以上所述是小编给大家介绍的apache tika检测文件会不会破坏的方法,大家如有疑问可以留言,或联系站长。感谢亲们支持!!!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

文章来源:丸子建站

文章标题:apache tika检测文件会不会破坏的方法

https://www.wanzijz.com/view/59595.html

X

截屏,微信识别二维码

微信号:weimawl

(点击微信号复制,添加好友)

打开微信