要使用Java从文本文件中删除重复的单词,你可以按照以下步骤进行:
HashSet
)来去除重复的单词,因为集合不允许重复元素。下面是一个简单的Java程序示例,演示了如何实现上述步骤:
import java.io.*;
import java.util.*;
public class RemoveDuplicateWords {
public static void main(String[] args) {
String inputFilePath = "input.txt"; // 输入文件路径
String outputFilePath = "output.txt"; // 输出文件路径
try {
// 读取文件内容
List<String> lines = Files.readAllLines(Paths.get(inputFilePath));
StringBuilder sb = new StringBuilder();
for (String line : lines) {
sb.append(line).append(" ");
}
String content = sb.toString();
// 分割单词并去重
Set<String> uniqueWords = new HashSet<>(Arrays.asList(content.split("\\s+")));
// 将去重后的单词写回文件
List<String> uniqueWordList = new ArrayList<>(uniqueWords);
Files.write(Paths.get(outputFilePath), uniqueWordList, StandardCharsets.UTF_8);
System.out.println("重复单词已删除,结果已保存到 " + outputFilePath);
} catch (IOException e) {
e.printStackTrace();
}
}
}
HashSet
,用于存储不重复的元素。\\s+
用于匹配一个或多个空白字符。通过上述方法,你可以有效地从文本文件中删除重复的单词。希望这个示例对你有所帮助!
领取专属 10元无门槛券
手把手带您无忧上云