使用Python 3.6.4提取不同行的Word文本并输出到两个文本文件中,可以使用Python的python-docx
库来实现。下面是完善且全面的答案:
下面是使用Python 3.6.4提取不同行的Word文本并输出到两个文本文件中的示例代码:
from docx import Document
def extract_lines(input_file, output_file1, output_file2):
doc = Document(input_file)
lines1 = []
lines2 = []
for paragraph in doc.paragraphs:
text = paragraph.text.strip()
if text.startswith('A'):
lines1.append(text)
elif text.startswith('B'):
lines2.append(text)
with open(output_file1, 'w') as file1:
file1.write('\n'.join(lines1))
with open(output_file2, 'w') as file2:
file2.write('\n'.join(lines2))
# 使用示例
input_file = 'input.docx'
output_file1 = 'output1.txt'
output_file2 = 'output2.txt'
extract_lines(input_file, output_file1, output_file2)
以上代码中,input_file
是输入的Word文档文件名,output_file1
和output_file2
分别是输出到的两个文本文件名。代码会将以'A'开头的行提取到output_file1
中,以'B'开头的行提取到output_file2
中。
请注意,以上示例代码仅供参考,实际使用时需要根据具体需求进行适当修改和调整。
领取专属 10元无门槛券
手把手带您无忧上云