Python自动化办公篇 - 89 - 文件自动化管理 - 文件查找与基于文件内容查找文件

发布时间:2022-06-08 发布网站:脚本宝典
脚本宝典收集整理的这篇文章主要介绍了Python自动化办公篇 - 89 - 文件自动化管理 - 文件查找与基于文件内容查找文件脚本宝典觉得挺不错的,现在分享给大家,也给大家做个参考。
万叶集
🎉 隐约雷鸣,阴霾天空。 🎉
🎉 但盼风雨来,能留你在此。 🎉

前言F1a; ✌ 作者简介:渴望力量的哈士奇 ✌,大家可以叫我 🐶哈士奇🐶 ,致力于用大白话讲解知识的博主 ✌ 🏆 CSDN博客专家认证、新星计划第三季全栈赛道 top_1 、华为享专家、阿里云专家博主 🏆 📫 如果文章知识点有错误的地方,请指正!和大家一起学习,一起进步👀 💬 人生格言:优于别人,并不高贵,真正的高贵应该是优于过去的自己。💬 🔥 如果感觉博主的文章还不错的话,还请👍关注、点赞、收藏三连支持👍一下博主哦


📕 系列专栏:                🇨🇳 Python全栈系列 - [更新中]     【 本文在该系列】                        🍎 Python零基础入门篇                        🍎 Python语法进阶篇                        🍎 Python自动化办公篇                👋 网安之路系列 ​                       🍋 网安之路踩坑篇 ​                       🍋 网安知识扫盲篇 ​                       🍋 Vulhub 漏洞复现篇 ​                       🍋 Shell脚本编程篇 ​                       🍋 Web攻篇   2021年9月3日停止更新,转战先知等安全社区 ​                       🍋 渗透工具使用集锦  2021年9月3日停止更新,转战先知等安全社区 ​                ⭐️ 点点点工程师系列 ​                       🍹 测试神器 - Charles 篇 ​                       🍹 测试神器 - Fiddler 篇 ​                       🍹 测试神器 - Jmeter 篇 ​                       🍹 自动化 - RobotFrameWork 系列 ​                       🍹 自动化 - 基于 JAVA 实现的WEB端UI自动化                        🍹 自动化 - 基于 MonkeyRunner 实现的APP端UI自动化

Python自动化办公篇 - 89 - 文件自动化管理 - 文件查找与基于文件内容查找文件

Python自动化办公篇 - 89 - 文件自动化管理 - 文件查找与基于文件内容查找文件

文章目录

    • 🐳 文件查找操作
      • 🐬 glob 的介绍
      • 🐬 glob 的基本使用
    • 🐳 查找指定的文件
    • 🐳 基于文件内容查找文件

该章节将学习关于文件查找的操作,大家都知道,无论是 Linux 系统还是 Windows 系统都有基于文件名实现过滤、查找的功能。但是如果想要查找一些关于某些文件指定内容的文件,好像无论是 Linux 还是 Windows 明面上没有这样的功能了。这个时候就可以通过 Python 来实现这样的功能,通过该章节的学习,就可以学习到该功能的如何利用 Python 实现这样的操作。

🐳 文件查找操作

🐬 glob 的介绍

glob 包是一个快速查找文件夹中内容的包,可以通过模糊查找的形式找到我们想要的内容。

🐬 glob 的基本使用

导入包与模块 From glob import glob


使用方法 glob(任意目录)


返回内容:

指定路径下的内容列表,不存在的路径返回空列表

代码示例如下:

# coding:utf-8@H_530_126@


import os

from glob import glob

target = os.getcwd()

result = glob(target)
PRint(result)                   # 打印输出当前路径的文件夹

result = glob(target + '/*')
print(result)                   # 打印输出当前路径的文件夹下的所有文件

result = glob(target + '/*.py')
print(result)                   # 打印输出当前路径的文件夹下的所有以 "py" 结尾的文件

result = glob(target + '/*.zip')
print(result)                   # 打印输出当前路径的文件夹下的所有以 "zip" 结尾的文件

result = glob(target + '/filetest*')
print(result)                   # # 打印输出当前路径的文件夹下的所有以 "filetest" 开头的文件

运行结果如下:


Python自动化办公篇 - 89 - 文件自动化管理 - 文件查找与基于文件内容查找文件


🐳 查找指定的文件

已知条件: 想查找的文件名已经知道,但是目录在哪里并不知道。


实现方法: 利用 "glob" 从最上级目录开始查找,利用递归模式,不断的查找,直到找到为止。

代码示例如下:

# coding:utf-8


import glob


"""
获取当前路径下所有内容
判断每个内容的类型(文件夹还是文件)
若是文件夹则继续递归查找
"""

path = glob.os.path.join(glob.os.getcwd(), '*')     # 获取当前文件夹下的所有内容
                                                    # glob 模块其实已经包含了 "os" 模块
final_result = []       # 定义一个空列表,用以存储 seArch() 函数查到的内容

def search(path, target):       # 定义 search() 函数,传入 "path" 文件路径, "target" 要查找的目标文件
    result = glob.glob(path)

    for data in result:         # for 循环判断递归查到的内容是文件夹还是文件
        if glob.os.path.isdir(data):    # 若是文件夹,继续将该文件夹的路径传给 search() 函数继续递归查找
            _path = glob.os.path.join(data, '*')
            search(_path, target)
        else:                           # 若是文件,则将该查询到的文件所在路径插入 final_result 空列表
            if target in data:
                final_result.apPEnd(data)
    return final_result


if __name__ == '__main__':
    result = search(path, target='filetest.py')
    print(result)

运行结果如下:


Python自动化办公篇 - 89 - 文件自动化管理 - 文件查找与基于文件内容查找文件


🐳 基于文件内容查找文件

接下来我们看一下查找指定内容的文件:

已知条件:

文件中包含有某些关键字,但是不知道文件名和文件所在路径


实现方法:

利用 "glob" 从最上级目录开始查找,利用递归模式,不断的查找。如果是文件夹则进入继续查找,是文件则读取,判断是否包含该内容,返回该内容的文件名以及所在路径。

其实,基于文件内容查找文件实现的方式大体与上文的查找指定文件大体相似,只不过加入了读取文件的判断罢了。

代码示例如下:

# coding:utf-8


import glob


"""
获取当前路径下所有内容
判断每个内容的类型(文件夹还是文件)
若是文件夹则继续递归查找
"""

path = glob.os.path.join(glob.os.getcwd(), '*test04')     # 因为下文捕获不可读文件格式太多,所以这里直接指定了 "test04" 路径
final_result = []       # 定义一个空列表,用以存储 search() 函数查到的内容



def search(path, target):       # 定义 search() 函数,传入 "path" 文件路径, "target" 要查找的目标文件
    result = glob.glob(path)

    for data in result:         # for 循环判断递归查到的内容是文件夹还是文件
        if glob.os.path.isdir(data):    # 若是文件夹,继续将该文件夹的路径传给 search() 函数继续递归查找
            _path = glob.os.path.join(data, '*')
            search(_path, target)
        else:                           # 若是文件,则将该查询到的文件所在路径插入 final_result 空列表
            f = open(data, 'r')         # 利用 open() 函数读取文件,并通过 try...except... 捕获不可读的文件格式(.zip 格式)
            try:
                content = f.read()
                if target in content:
                    final_result.append(data)
            except:
                print('这是不可读文件格式的文件的所在路径:{} '.format(data))
                continue
            finally:
                f.close()
    return final_result


if __name__ == '__main__':
    result = search(path, target='测试文件')
    print(result)

运行结果如下:


Python自动化办公篇 - 89 - 文件自动化管理 - 文件查找与基于文件内容查找文件


脚本宝典总结

以上是脚本宝典为你收集整理的Python自动化办公篇 - 89 - 文件自动化管理 - 文件查找与基于文件内容查找文件全部内容,希望文章能够帮你解决Python自动化办公篇 - 89 - 文件自动化管理 - 文件查找与基于文件内容查找文件所遇到的问题。

如果觉得脚本宝典网站内容还不错,欢迎将脚本宝典推荐好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。