無需壓縮軟件,用python幫你操作壓縮包
寫在之前
壓縮包是互聯(lián)網(wǎng)上軟件發(fā)布的標(biāo)準(zhǔn)格式,同時對于系統(tǒng)管理很有用處。當(dāng)我們需要將多份文件發(fā)送給別人的時候,最好通過壓縮包的形式發(fā)送,還有在備份某些文件的時候,為了減少磁盤空間的占用,也需要對備份的數(shù)據(jù)進(jìn)行壓縮。
Python 中有一系列對壓縮包進(jìn)行處理的工具,包括創(chuàng)建壓縮包,解壓壓縮包以及獲取壓縮包中的文件列表等,今天的文章,我們就來學(xué)習(xí)一下與壓縮包相關(guān)的 Python 標(biāo)準(zhǔn)庫。
管理 zip 壓縮包
在大多數(shù)情況下,我們在 Windows 下使用 zip 進(jìn)行壓縮,在 Linux 下使用 gzip 或者 bzip2 進(jìn)行壓縮。這一部分,我們來看一下如何管理 zip 格式的壓縮包。
1.讀取 zip
Python 管理 zip 主要使用 zipfile 模塊,這個模塊里有一個名為 ZipFile 的對象,我們通過將 zip 壓縮包的名稱傳遞給這個對象的函數(shù),這樣就打開了一個 zip 壓縮包并獲得一個 ZipFile 的對象,然后使用這個對象的方法去讀取 zip 壓縮包里的內(nèi)容。具體如下所示:
>>> import zipfile>>> first_zip = zipfile.ZipFile(’test.zip’)>>> first_zip.namelist()
namelist() 是 ZipFile 中的常用方法,初次以外還比較常用的方法有 extract,extractall:
namelist:返回一個列表,列表中是 zip 中包含的所有文件和文件夾; extract:從 zip 中提取單個文件 extarctall:從 zip 文件中提取所有文件2.創(chuàng)建 zip
與文件的方式類似,如果想要創(chuàng)建一個 zip 格式的壓縮文件,必須要以「寫」的模式打開 zip 文件,需要說一點的是,ZipFile 的對象是通過 write 方法來添加文件的。具體如下所示:
>>> import zipfile>>> my_zip = zipfile.ZipFile(’test.zip’, ’w’)>>> my_zip.write(’test.py’)>>> my_zip.close()
上面的代碼是創(chuàng)建了一個名為 test.zip 的新 zip 文件,它包含 test.py 壓縮后的內(nèi)容。
管理 tar 包
tar 命令一般是在 Linux 系統(tǒng)中創(chuàng)建壓縮包,并且可以指定壓縮包的壓縮算法。此外 tar 命令也可以創(chuàng)建一個不壓縮的 tar 包,僅僅是為了能把多個文件進(jìn)行打包便于傳輸。這也就是說,我們在使用 tar 命令的時候,既可以創(chuàng)建普通的 tar 包,也可以創(chuàng)建使用壓縮算法壓縮過的壓縮包。
Python 中使用 tarfile 標(biāo)準(zhǔn)庫提供了 tar 命令提供的功能,我們也可以使用它創(chuàng)建一個壓縮或者一個非壓縮的 tar 包。我之前很多次說過 Python 的簡潔優(yōu)雅體現(xiàn)在方方面面,在這里體現(xiàn)在 tarfile 模塊比 Linux 下的 tar 命令用起來更加舒服。
1.讀取 tar 包
同樣讀取 tar 包和 Python 的文件管理操作類似,讀寫一個壓縮包,需要執(zhí)行打開操作,同時指定打開模式,并且在操作完成以后關(guān)閉文件,當(dāng)然在這里我們可以使用上下文管理器來保證文件的關(guān)閉邏輯。具體如下所示:
>>> import tarfile>>> with tarfile.open(’etc.tar’) as t:... for member in t.getmembers():... print(member.name)
上面的代碼中,導(dǎo)入 tarfile 庫,使用默認(rèn)的讀模式打開 tar 包,tarfile.open() 函數(shù)返回一個 TarFile 對象,這個對象表示當(dāng)前打開的 tar 包,我們可以通過這個對象的方法操作和讀取 tar 包中的內(nèi)容。
tarfile 中有不少函數(shù),其中最常用的有 getnames,extract,extractall 函數(shù):
getnames:獲取 tar 包中的文件列表; extract:提取單個文件; extractall:提取所有文件。2.創(chuàng)建 tar 包
從上面的例子中可以看到,讀一個 tar 包與讀一個文件類似,都是以「讀」的方式打開文件并得到一個對象,然后通過這個對象的方法去操作文件。同樣創(chuàng)建一個 tar 包和寫一個文件也比較類似。具體如下所示:
>>> import tarfile>>> with tarfile.open(’etc.tar’, mode=’w’) as f:... f.add(’test.py’)
上面的代碼中,由于我們是創(chuàng)建一個 tar 包,所以以「寫」模式打開 tar 包并得到一個 TarFile 對象,然后使用 TarFile 對象的 add 方法將 test.py 文件添加到 tar 包中。
3.tarfile 讀取和創(chuàng)建壓縮包
上面我們用 targfile 創(chuàng)建和讀取未壓縮的 tar 包,但是一般情況下,我們創(chuàng)建 tar 包的時候都會使用壓縮算法進(jìn)行壓縮,以加快傳輸速度和減少占用的磁盤空間。
使用 tarfile 創(chuàng)建和讀取壓縮包非常簡單,只要在打開文件時指定壓縮算法即可。對于 tarfile 的 open 函數(shù),以「打開模式:壓縮算法」的形式打開即可。具體如下所示:
a. 讀取一個用 gzip 算法壓縮的 tar 包:
>>> import tarfile>>> with tarfile.open(’etc.tar’, mode=’r:gz’) as f:
b. 創(chuàng)建一個用 bzip2 算法壓縮的 tar 包:
>>> import tarfile>>> with tarfile.open(’etc.tar’, mode=’w:bz2’) as f:
以上就是無需壓縮軟件,用python幫你操作壓縮包的詳細(xì)內(nèi)容,更多關(guān)于python 壓縮包的資料請關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
