victory的博客

长安一片月,万户捣衣声

0%

openpyxl | 快速提取一串字符中的中文

快速提取一串字符中的中文

以下代码实现了快速提取(正则表达式)一串字符串中的中文。

import re
from openpyxl import load_workbook

data = []
wb = load_workbook('data/data.xlsx')
ws = wb.active
for row in range(2, ws.max_row + 1):  # 从第二行开始遍历excel文件所有行
    info = ws['A' + str(row)].value
    data.append(info)

chinese_list = []
for i in data:
    chinese = re.findall('[\u4e00-\u9fa5]', i)
    chinese_list.append(''.join(chinese))

for row in range(2, ws.max_row + 1):
    ws['B' + str(row)].value = chinese_list[row - 2]
wb.save("./data/data_chinese.xlsx")

下载data.xlsx