时间:2023-01-16 09:51:58来源:本站整理作者:点击:
读取存在的文件,要用到docx库中的Document
document = Document(file_path),file_path表示要打开的Word路径,没有参数表示新建文档。
代码:
from docx import Document
document = Document('test.docx')
docx打开文件
获取段落paragraph一个document文档包括一个或者多个段落,都在document的paragras属性中,document.paragraphs返回所有段落对象的列表。
例如paragrahps = document.paragraphs
paragraphs[0] --> 表示第1段对象
paragraphs[1] --> 表示第2段对象
……
len(pargraphs) --> 查看文档有多少个自然段
代码:
paragraphs = document.paragraphs # paragraphs表示得到的所有段落列表
type(paragraphs) # 返回列表
p1 = paragraphs[0] # p1表示第一段段落对象
len(paragraphs) # 检查文档一共有多少段
段落对象
获取段落paragraph文本内容.text用于获取文本内容,不仅可以获取段落对象的,还可以获取块对象的文本内容
代码:以p2第二段对象为例
p2.text
一个段落有多个文本块run对象组成,我们可以通过paragraph.runs获取所有块对象,然后通过.text获取其内容,这里以第4段为例p4 = paragraphs[3]
代码:
for run in p4.runs:
print(run.text)
代码:
for paragraph in document.paragraphs:
for run in paragraph.runs:
print(run.text)
和openpyxl 操作excel类似,table表格遍历采取三级循环样式
A:按照行遍历
for table in document.tables:
for row in table.rows:
for cell in row.cells:
print(cell.text)
B: 按照列遍历
for table in document.tables:
for column in table.columns:
for cell in column.cells:
print(cell.text)
概况一下:要获得文本,都可以使用.text,不管是段落paragraph,还是run,或者是table表格的cell单元格。
,“关公”陆树铭因病去世,网爆大衣哥亲往西安悼念,被赞有情有义“关公”陆树铭因病去世,网爆大衣哥亲往西安悼念,被赞有情有义
关注公益慈善可以在哪里查询全国慈善组织的公开信息 蚂蚁庄园1月12日答案《卿卿日常》24节气姑娘结局是什么_《卿卿日常》24节气姑娘离开老三了吗《卿卿日常》小说大结局是什么 尹峥和李薇最后在一起了吗《点燃我温暖你》高见鸿背叛李峋了吗 高见鸿结局是什么pc上的switch模拟器教程(推荐一款Switch电脑上的模拟器)
Copyright 2022-2026 feiyundao.com 〖妃孕岛〗 版权所有 备案号 :陕ICP备2022000637号-3
声明: 本站文章均来自互联网,不代表本站观点 如有异议 请与本站联系 本站为非赢利性网站 不接受任何赞助和广告