Tika 是一个开源的 Java 库,用于从各种文件格式中提取内容,如 PDF、Word、Excel、PowerPoint 等。它能够解析文件并提取文本、元数据和其他有用信息。
Tika 主要有以下几种类型:
假设你已经使用 Tika 提取了内容,并将其存储在服务器上。以下是一个简单的示例,展示如何在前端显示这些内容。
import org.apache.tika.Tika;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
public class TikaExample {
public static String extractContent(String filePath) throws IOException {
Tika tika = new Tika();
try (FileInputStream inputStream = new FileInputStream(new File(filePath))) {
return tika.parseToString(inputStream);
}
}
public static void main(String[] args) {
try {
String content = extractContent("path/to/your/document.pdf");
// 将内容存储到数据库或通过 API 返回给前端
} catch (IOException e) {
e.printStackTrace();
}
}
}
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Tika Extracted Content</title>
</head>
<body>
<div id="content"></div>
<script>
async function fetchContent() {
try {
const response = await fetch('/api/getContent');
const content = await response.text();
document.getElementById('content').innerText = content;
} catch (error) {
console.error('Error fetching content:', error);
}
}
fetchContent();
</script>
</body>
</html>
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RestController;
@RestController
public class ContentController {
@GetMapping("/api/getContent")
public String getContent() {
try {
return TikaExample.extractContent("path/to/your/document.pdf");
} catch (IOException e) {
e.printStackTrace();
return "Error extracting content";
}
}
}
通过以上步骤,你可以从前端显示从 Tika 提取的内容。希望这些信息对你有所帮助!
领取专属 10元无门槛券
手把手带您无忧上云