1、openpyxl和xlwings区别
1)xlwings依赖于pywin32,而openpyxl不需要
2).xlsx
格式的Excel文件本质上是一个压缩文件,包含多个按照微软OOXML规范格式化的XML文件。根据这个规范,则可以创建一个程序,能够直接读写excel文件,就可以通过openpyxl使用Python代码直接读取/写入Excel文件。可以看出openpyxl
是只支持.xlsx
格式文件。但优点是可以不安装MS Excel软件。
3)Microsoft Excel应用程序可以通过Win32 COM API由外部程序启动和控制。pywin32包提供了Win32 COM和Python之间的接口。通过python脚本和正确的pywin32命令,可以完全控制Excel应用程序(打开Excel文件,从单元格查询数据,向单元格写入数据,保存Excel文件,等等)。xlwings
是pywin32的一个用户友好的包装器。它介绍了几个简洁但功能强大的方法。将excel单元格范围直接转换为numpy Array或 Pandas Dataframe。所以使用xlwings
是可以支持.xls
和.xlsx
,但电脑上必须安装MS Excel软件。
2、openpyxl使用示例代码
import datetime
from random import choice
from time import time
from openpyxl import load_workbook
from openpyxl.utils import get_column_letter
# 设置文件 mingc
fileName = "openpyxl.xlsx"
# 打开文件
wb = load_workbook(fileName)
# 创建一张新表
ws = wb.create_sheet()
# 第一行输入
ws.append(['TIME', 'TITLE', 'A-Z'])
# 输入内容(500行数据)
for i in range(500):
TIME = datetime.datetime.now().strftime("%H:%M:%S")
TITLE = str(time())
A_Z = get_column_letter(choice(range(1, 50)))
ws.append([TIME, TITLE, A_Z])
# 获取最大行
row_max = ws.max_row
# 获取最大列
con_max = ws.max_column
# 把上面写入内容打印在控制台
for j in ws.rows: # we.rows 获取每一行数据
for n in j:
print(n.value, end="\t") # n.value 获取单元格的值
print()
# 保存,save(必须要写文件名(绝对地址)默认 py 同级目录下,只支持 xlsx 格式)
wb.save(fileName)
3、xlwings使用示例代码
#coding=utf-8
import xlwings as xw
import pandas as pd
import time
start_row = 2 # 处理Excel文件开始行
end_row = 10002 # 处理Excel结束行
#记录打开表单开始时间
start_open_time = time.time()
#指定不显示地打开Excel,读取Excel文件
app = xw.App(visible=False, add_book=False)
wb = app.books.open('D://demo.xlsx') # 打开Excel文件
sheet = wb.sheets[0] # 选择第0个表单
#记录打开Excel表单结束时间
end_open_time = time.time()
#记录开始循环计算时间
start_run = time.time()
row_content = []
#读取Excel表单前10000行的数据,Python的in range是左闭右开的,到10002结束,但区间只包含2到10001这一万条
for row in range(start_row, end_row):
row_str = str(row)
#循环中引用Excel的sheet和range的对象,读取B列和C列的每一行的值,对比计算
start_value = sheet.range('B' + row_str).value
end_value = sheet.range('C' + row_str).value
if start_value <= end_value:
values = end_value - start_value
#同时测试List数组添加记录
row_content.append(values)
#计算和
total_values = sum(row_content)
#记录结束循环计算时间
end_run = time.time()
sheet.range('E2').value = str(total_values)
sheet.range('E3').value = '使用Sheet计算时间(秒):' + str(end_run - start_run)
#保存并关闭Excel文件
wb.save()
wb.close()
print ('结果总和:', total_values)
print ('打开并读取Excel表单时间(秒):', end_open_time - start_open_time)
print ('计算时间(秒):', end_run - start_run)
print ('处理数据条数:' , len(row_content))