使用Python(3.9.12 64bit)读取转录文档的Word文件,目的是将这些信息输入到我无法编辑的预建Access数据库中。
我这样做基本上是为了帮一个朋友的忙,他支持一个团队转录记录以进入数据库。他们将Word文件转录到Excel中,然后将其导入Access。我提出创建一个程序来自动化Word到Excel的过程,使用
docx
和
openpyxl
功能。其中一个条目是一个多行文本字段,当导入Access时,该字段显示为连续字符串。
我了解到Access使用Line Return和Carriage Return的组合将新行放入一个字段中,所以在将其写入Excel之前,我会在每一个子行的末尾为其写入ASCII字符。
if writeFullText == '':
writeFullText = subline + chr(10) + chr(13)
else:
writeFullText = writeFullText + subline + chr(10) + chr(13)
。。。
writeSheet.cell(i+2,26,writeFullText)
当在Excel中查看输出时,这一切似乎都有效,但在导入Access时,问题仍然存在:Line Return、Carriage Return组合未被识别,并且仍然在数据库的相应字段中生成连续字符串。
有人建议如何使用Python创建一个Excel文件,该文件可以加载到Access中而不会出现此问题吗?
谢谢你的帮助。