Python 如何查找特定類型文件
寫在之前
今天的文章是介紹如何用 Python 去定位特定類型的文件,會(huì)講到用字符串匹配文件名定位特定文件以及順帶介紹一下遍歷目錄樹(shù)的函數(shù),通過(guò)今天的這一部分以及之前文章講到的文件獲取屬性的操作,可以做很多有意思的事情。
定位特定文件
定位特定的文件,可以使用 fnmatch 以及 glob 這兩個(gè)標(biāo)準(zhǔn)庫(kù),我們下面來(lái)分別看一下。
1. 使用 fnmatch 標(biāo)準(zhǔn)庫(kù)
一般的話我們想要查找特定類型的文件,可以通過(guò)字符串的前綴匹配和后綴匹配來(lái)查找,具體實(shí)例如下所示:
>>> import os>>> [txt for txt in os.listdir(’.’) if txt.endswith(’.txt’)][’b.txt’, ’a.txt’]
其實(shí)大部分的情況下這種用字符串匹配的方法來(lái)查找文件就足夠可以滿足需要,如果有些情況下需要更加靈活一點(diǎn)的字符串匹配,就可以使用 fnmatch 庫(kù),這是一個(gè)專門用來(lái)進(jìn)行文件名匹配的庫(kù),支持使用通配符來(lái)進(jìn)行文字匹配(比如’*’,’?’等)。
fnmatch 這個(gè)庫(kù)很簡(jiǎn)單,只有 4 個(gè)函數(shù):fnmatch,fnmatchcase,filter,translate:
fnmatch:判斷文件名是否符合特定的模式; fnmatchcase:判斷文件名是否符合特定的模式(不區(qū)分大小寫); filter:返回輸入列表中,符合特定模式的文件名列表; translate:將通配符模式轉(zhuǎn)換成正則表達(dá)式。上面 4 個(gè)最常用是它的同名函數(shù) fnmatch ,我的當(dāng)前目錄下有 4 個(gè)文件,分別是:a.txt,b.txt,c.py,test.py,下面我就用 fnmatch 函數(shù)來(lái)對(duì)當(dāng)前目錄下的這 4 個(gè)文件進(jìn)行匹配性測(cè)試,具體請(qǐng)看下面代碼:
>>> import os>>> import fnmatch>>> os.listdir(’.’)[’test.py’, ’c.py’, ’b.txt’, ’a.txt’]>>> [txt for txt in os.listdir(’.’) if fnmatch.fnmatch(txt, ’*.txt’)][’b.txt’, ’a.txt’]>>> [file for file in os.listdir(’.’) if fnmatch.fnmatch(file, ’[a-c]*’)][’c.py’, ’b.txt’, ’a.txt’]>>> [file for file in os.listdir(’.’) if fnmatch.fnmatch(file, ’[!a-c]*’)][’test.py’]
fnmatchcase 函數(shù)與 fnmatch 函數(shù)幾乎一樣,只是在匹配的時(shí)候會(huì)忽略大小寫字母;filter 函數(shù)與 fnmatch 比較類似,區(qū)別在于fnmatch 一次只對(duì)一個(gè)文件名匹配,而 filter 一次可以對(duì)多個(gè)文件名進(jìn)行匹配判斷,下面我們就再來(lái)看一下 filter 的用法:
>>> import os>>> import fnmatch>>> file = os.listdir(’.’)>>> file[’test.py’, ’c.py’, ’b.txt’, ’a.txt’]>>> fnmatch.filter(file, ’[a-c]*’)[’c.py’, ’b.txt’, ’a.txt’]>>> fnmatch.filter(file, ’[!a-c]*’)[’test.py’]
2.使用 glob 定位
我們?cè)谏厦娼榻B的獲取特定類型的文件列表,首先是通過(guò) os.listdir 獲取全部的文件列表,然后通過(guò)字符串匹配或者使用 fnmatch 進(jìn)行文件名模式匹配來(lái)定位,習(xí)慣了 Python 的簡(jiǎn)潔優(yōu)雅,這多出來(lái)的一步總覺(jué)得哪里怪怪的,好在我現(xiàn)在知道了 glob。
glob 的作用相當(dāng)于 os.listdir + fnmatch 的組合,使用 glob 以后,就不需要用 os.listdir 獲取文件列表,直接通過(guò)模式匹配就可以解決了,具體操作如下所示:
>>> import glob>>> glob.glob(’*.txt’)[’b.txt’, ’a.txt’]>>> glob.glob(’[a-c]*’)[’c.py’, ’b.txt’, ’a.txt’]>>> glob.glob(’[!a-c]*’)[’test.py’]
可以看到,Python 真的非常的靈活,光是定位目錄下特定的文件類型我就已經(jīng)介紹了 3 種方式,一般情況下就用字符串匹配就可以解決,如果需要更加靈活一點(diǎn)的的,可以使用 fnmatch 和 glob。
遍歷目錄樹(shù)
再上一節(jié)中我們都是查找某個(gè)目錄下的文件然后通過(guò)匹配去定位自己需要的文件類型。但是在實(shí)際的應(yīng)用過(guò)程中我們更可能遇到的是某個(gè)目錄及其子目錄下的所有文件。比如查找某個(gè)目錄及其子目錄下所有的 txt 文件等等,對(duì)于這類的需求,我們可以使用 os 模塊下的「walk」函數(shù)。walk 函數(shù)遍歷某個(gè)目錄及其子目錄,對(duì)于每一個(gè)目錄,walk 返回一個(gè)三元組,依次是「當(dāng)前目錄」,「當(dāng)前目錄下的子目錄」,「當(dāng)前目錄下的文件列表」。
下面我們來(lái)演示一下 os.walk 函數(shù)的用法,做一個(gè)小的練習(xí),來(lái)遍歷一下 /root/rocky0429 目錄及其子目錄下的所有 txt 和 圖片文件:
import osimport fnmatchsearch = [’*.txt’, ’*.jpg’, ’*.jpeg’]res = []for root, dirnames, filenames in os.walk(os.path.expanduser(’~/rocky0429’)): for extension in search: for filename in fnmatch.filter(filenames, extension): res.append(os.path.join(root,filename)) print(res)
以上就是Python 如何查找特定類型文件的詳細(xì)內(nèi)容,更多關(guān)于python 查找文件的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
相關(guān)文章:
1. idea打開(kāi)多個(gè)窗口的操作方法2. 詳解idea中web.xml默認(rèn)版本問(wèn)題解決3. idea修改背景顏色樣式的方法4. IntelliJ IDEA 2020最新激活碼(親測(cè)有效,可激活至 2089 年)5. IntelliJ IDEA 統(tǒng)一設(shè)置編碼為utf-8編碼的實(shí)現(xiàn)6. asp知識(shí)整理筆記4(問(wèn)答模式)7. idea開(kāi)啟代碼提示功能的方法步驟8. jsp EL表達(dá)式詳解9. 解決ajax的delete、put方法接收不到參數(shù)的問(wèn)題方法10. 使用Python爬取Json數(shù)據(jù)的示例代碼
