1.收藏!自动Python内置的化源轻量级数据库竟如此好用!全网最实用sqlite3实战项目!码办
2.AI办公自动化:用kimi批量把word转换成txt文本
3.AI办公自动化:kimi批量搜索提取PDF文档中特定文本内容
4.Python 办公自动化之 PDF 最强操作手册
收藏!Python内置的动化轻量级数据库竟如此好用!全网最实用sqlite3实战项目!源码传奇 搭建源码
今天我们将深入探讨 Python 内置的自动轻量级数据库 sqlite3 的使用方法与实战操作。对于那些希望避免复杂数据库安装过程的化源用户,sqlite3 无疑是码办一个理想的选择。它无需独立的公自服务器进程,且数据库文件为 .db 后缀,动化支持跨平台直接访问,源码便捷高效。自动 让我们一起通过实际案例来掌握 sqlite3 的化源常用操作,以便在日常项目开发中灵活运用。码办主要内容
1. 读取数据并插入数据库
我们将以 TXT 文件为例,进行示范操作。TXT 文件为单列数据,精灵起源源码以换行符分割,文件数量超过 个,数据总量达到 5 万以上。1.1 源代码
1.2 运行效果
1.3 重点代码解释
自动获取所有 TXT 文件名称和路径:为了方便使用,我们编写代码自动查找所有文件名称和路径,无需手动指定。 数据库创建与连接:利用 sqlite3.connect() 创建数据库,如果数据库文件不存在则自动创建。 创建表:执行 SQL 语句创建表 numbers,包含两个字段:id 和 number。 插入数据:优化文件打开方式,使用 with 语句提高效率,同时使用占位符功能自动插入数据。2. 数据库操作
2.1 连接数据库
通过指定数据库文件路径连接数据库,简化数据库管理。2.2 查询数据库中有哪些表
使用 SQL 查询语句查看数据库中所有表的名称。2.3 删除数据库中的ai制作网站源码某个表
执行 drop table 语句删除指定表。2.4 查询表结构
2.5 查询表中前 条记录
2.6 查询表中所有记录
2.7 查询表中不重复记录
2.8 将老表中的不重复记录插入新表
2.9 将特定结果写入文本文件(单列)
2. 将特定结果写入文本文件(多列)
2. 将特定结果写入 CSV 文件(多列)
2. 办公自动化案例
利用 sqlite3 进行数据导出,实现批量生成 TXT 文件,显著提高办公效率。 为了帮助您快速上手,所有源代码已发布至公众号智能演示,只需回复 "sqlite3" 即可获取下载链接。 期待您的实践与探索,享受 Python 数据库操作带来的便利!AI办公自动化:用kimi批量把word转换成txt文本
在Kimichat中输入提示词:
你是一个Python编程专家,要完成一个Python脚本编写的任务,具体步骤如下:
打开文件夹:F:\aword
读取里面docx格式的word文档,提取word文档中的第一行文字作为txt文本文档的标题名,将word文档转换为txt文档;重命名txt文档;注意:每一步相关信息都要输出到屏幕;在 Windows 系统中,默认的文件编码是 GBK,它不支持某些特殊的 Unicode 字符,为了解决这个问题,可以在打开文件进行写入操作时,书籍售卖网页源码指定使用 utf-8 编码。
kimichat生成Python源代码:
python
import os
from docx import Document
# 定义文件夹路径
folder_path = 'F:\\aword'
# 确保文件夹存在
if not os.path.exists(folder_path):
print(f"文件夹 { folder_path} 不存在。")
else:
# 列出文件夹中所有的docx文件
docx_files = [f for f in os.listdir(folder_path) if f.endswith('.docx')]
# 检查是否有docx文件
if not docx_files:
print("没有找到docx格式的Word文档。")
else:
for docx_file in docx_files:
# 构建完整的文件路径
docx_file_path = os.path.join(folder_path, docx_file)
# 读取Word文档
doc = Document(docx_file_path)
try:
# 提取第一行文字作为标题
title = doc.paragraphs[0].text.strip()
print(f"提取的标题为: { title}")
# 构建txt文件的完整路径
txt_file_path = os.path.join(folder_path, f"{ title}.txt")
# 将Word文档转换为txt
with open(txt_file_path, 'w', encoding='utf-8') as txt_file:
for para in doc.paragraphs:
txt_file.write(para.text + ' ')
print(f"文档 { docx_file} 已转换为txt格式。")
except IndexError:
print(f"文档 { docx_file} 中没有文本。")
except Exception as e:
print(f"处理文档 { docx_file} 时发生错误: { e}")
在vscode中运行源代码,成功。
AI办公自动化:kimi批量搜索提取PDF文档中特定文本内容
要实现AI办公自动化,通过Python脚本批量搜索并提取PDF文档中的特定文本内容,如“资料来源”、“数据来源”和“来源”等,Kimi提供了一个解决方案。以下是一个步骤清晰的实现过程:
在Python编程环境下,你面临一个任务,目标是从数百个PDF文档中提取特定的文本信息。首先,使用pdfplumber库打开位于F:\研报下载\AIGC研报文件夹中的dubbo服务启动源码所有PDF文件。然后,通过遍历每个文件,逐行查找以“资料来源:”、“数据来源:”和“来源:”开头的文本,这些可能是你需要的内容来源。
脚本开始于导入必要的库,如os、re和pdfplumber,定义关键词列表和文件路径。对于每个PDF文件,代码首先检查文件类型,如果是PDF,它会尝试打开并提取文本。使用正则表达式搜索关键词,匹配到的文本会被保存到一个Excel文件中,文件名是'AI_Industry_Analysis.xlsx',保存在F:\AI自媒体内容\AI行业数据分析文件夹。
在处理过程中,脚本会监控可能出现的异常,如文件损坏或权限问题,并在遇到时提供错误信息。一旦所有文件处理完毕,脚本会输出一个总结,确认数据已保存到指定的Excel文件中。
下面是Kimi生成的简化版源代码片段:
...
import os
import re
import pdfplumber
...
# 遍历源文件夹中的PDF文件
for filename in os.listdir(source_folder):
if filename.endswith('.pdf'):
file_path = os.path.join(source_folder, filename)
try:
with pdfplumber.open(file_path) as pdf:
for page in pdf.pages:
text = page.extract_text()
for keyword in keywords:
pattern = re.compile(keyword + ".*")
matches = pattern.findall(text)
for match in matches:
sheet.append([match])
except Exception as e:
print(f"处理文件{ filename}时发生错误:{ e}")
...
通过这段代码,你可以有效地自动化提取PDF文档中的特定文本信息。
Python 办公自动化之 PDF 最强操作手册
PyMuPDF简介
PyMuPDF是MuPDF的Python接口,MuPDF是一个轻量级的PDF、XPS和电子书查看器,支持多种文档格式,包括PDF、XPS、CBZ、EPUB和FictionBook 2。它包括渲染器、命令行工具和查看器,旨在提供高质量的抗锯齿图形呈现。PyMuPDF支持扩展名为".pdf"、".xps"、".oxps"、".cbz"、".fb2"或".epub"的文件,同时能够处理大约种流行的图像格式。
功能
PyMuPDF提供了多种功能,包括文本提取、PDF操作、页面处理等。通过使用PyMuPDF,用户可以访问MuPDF支持的文档类型,获取元数据,获取目标大纲,管理页面,以及执行其他高级操作,如搜索文本,提取图像和文本,修改、创建、重新排列和删除页面,连接和拆分PDF文档,以及保存文档。
安装
PyMuPDF可以通过源码或wheels安装,对于Windows、Linux和Mac OSX平台,wheels在PyPI的下载部分可用。除了标准库,它没有强制性的外部依赖项,但根据安装时的包,可能存在一些额外的方法。通过pip安装命令,用户可以轻松安装PyMuPDF。
使用方法
使用PyMuPDF的步骤包括导入库,查看版本,打开文档,操作页面,获取元数据等。示例代码展示了如何获取文档元数据、获取目标大纲、页面处理、页面链接、页面呈现、页面图像保存、文本和图像提取、文本搜索、PDF操作等。
在学习Python时,可以加入交流学习社区以获取学习资源、开发工具、教程和实践案例。此外,学习Python技术点、必备开发工具、精品学习书籍、观看零基础学习视频、实战案例、Python练习题和面试资料,能够帮助提高技能,准备面试。