文章詳情頁

python實現將兩個文件夾合并至另一個文件夾(制作數據集)

瀏覽：5日期：2022-07-31 09:08:17

此操作目的是為了制作自己的數據集，深度學習框架進行數據準備，此操作步驟包括對文件夾進行操作，將兩個文件夾合并至另一個文件夾

該實例為一個煤礦工人臉識別的案例;首先原始數據集（簡化版的數據集旨在說明數據準備過程）如下圖所示：

該數據集只有三個人的數據，A01代表工人甲的煤礦下的照片，B01代表工人甲下礦前的照片，同理A02、B02代表工人乙的礦下、礦上的照片數據。。。

如下圖所示

python實現將兩個文件夾合并至另一個文件夾(制作數據集)

礦下

python實現將兩個文件夾合并至另一個文件夾(制作數據集)

礦上

python實現將兩個文件夾合并至另一個文件夾(制作數據集)

開始制作數據集：

首先建立訓練集（0.7）和測試集（0.3），即建立一個空白文件夾

python實現將兩個文件夾合并至另一個文件夾(制作數據集)

將該文件夾分為四個小文件夾（空），train代表訓練集，val代表測試集，valb代表礦井下的測試集，vall代表礦井上的測試集，注：后邊兩個測試集可有可無

最終制作的數據集如下所示：

python實現將兩個文件夾合并至另一個文件夾(制作數據集)

下面為所有的程序詳解

#導入一些進行該操作需要的庫import numpy as npimport osimport randomimport shutilpath=r’C:UsersAdministrator.SKY-20180518VHYDesktoprxore’#原始數據集的路徑data=os.listdir(path)#listdir該操作（[添加鏈接描述](https://www.jb51.net/article/184106.htm)）在我的上篇文章中有所介紹，此操作能讀取的內容為A01、A02、A03、B01、B02、B03這些文件夾#print(data)root=path#復制原始數據路徑path

讀取文件夾 A01、A02、A03、存入c列表中B01、B02、B03，將其存入d列表中

c=[]d=[]#創建兩個空列表for i in range(len(data)): a=data[i][0] if (a==’A’): c.append(data[i]) else: d.append(data[i])#print(d)

python實現將兩個文件夾合并至另一個文件夾(制作數據集)

導入路徑四個空文件夾的路徑

train_root=’C:UsersAdministrator.SKY-20180518VHYDesktopmyselftrain’val_root=’C:UsersAdministrator.SKY-20180518VHYDesktopmyselfval’vall_root=’C:UsersAdministrator.SKY-20180518VHYDesktopmyselfvalb’valb_root=’C:UsersAdministrator.SKY-20180518VHYDesktopmyselfvall’for i in range(len(c)): qqq=os.path.exists(train_root+’/’+c[i][1:]) if (not qqq): os.mkdir(train_root+’/’+c[i][1:]) qq=os.path.exists(val_root+’/’+c[i][1:]) if (not qq): os.mkdir(val_root+’/’+c[i][1:]) qq=os.path.exists(vall_root+’/’+c[i][1:]) if (not qq): os.mkdir(vall_root+’/’+c[i][1:]) qq=os.path.exists(valb_root+’/’+c[i][1:]) if (not qq): os.mkdir(valb_root+’/’+c[i][1:])#f=[]#g=[]aq=’C:UsersAdministrator.SKY-20180518VHYDesktoprxore’train_root1=’C:UsersAdministrator.SKY-20180518VHYDesktopmyselftrain’val_root1=’C:UsersAdministrator.SKY-20180518VHYDesktopmyselfval’vall_root1=’C:UsersAdministrator.SKY-20180518VHYDesktopmyselfvalb’valb_root1=’C:UsersAdministrator.SKY-20180518VHYDesktopmyselfvall’for i in range(len(c)): a=c[i] data_0=os.listdir(aq+a)# f.append(data_0)# g.append(aq+a)#print(f)#print(g) random.shuffle(data_0)#打亂A中數據 for j in range(len(d)): b=d[j] if(a[1:]==b[1:]): data_1=os.listdir(aq+b) #print(aq+b); random.shuffle(data_1) #print(data_1) #print(data_0,data_1) for z in range(len(data_0)): #print(z) pic_path=aq+a+’/’+data_0[z]if z<int(len(data_0)*0.7): obj_path=train_root1+a[1:]+’/’+data_0[z] else: obj_path=val_root1+a[1:]+’/’+data_0[z] obl_path=vall_root1+a[1:]+’/’+data_0[z] shutil.copyfile(pic_path,obl_path) #print(len(data_0),len(data_0)*0.7) #if (os.path.exists(pic_path)): shutil.copyfile(pic_path,obj_path) for z in range(len(data_1)): pic_path=aq+b+’/’+data_1[z] if z<int(len(data_1)*0.7): obj_path=train_root1+b[1:]+’/’+data_1[z] else: obj_path=val_root1+b[1:]+’/’+data_1[z] obl_path=valb_root1+a[1:]+’/’+data_1[z] shutil.copyfile(pic_path,obl_path) #if (os.path.exists(pic_path)): shutil.copyfile(pic_path,obj_path)#shutil.copyfile( src, dst)

從源src復制到dst中去。當然前提是目標地址是具備可寫權限。拋出的異常信息為IOException. 如果當前的dst已存在的話就會被覆蓋掉

將數據送入pytorch中，對數據進行迭代

from __future__ import print_function, divisionimport torchimport torch.nn as nnimport torch.optim as optimfrom torch.optim import lr_schedulerimport numpy as npimport torchvisionfrom torchvision import datasets, models, transformsimport matplotlib.pyplot as pltimport timeimport osimport copyimport mathimport torch.nn.functional as FD=299data_transforms = { ’train’: transforms.Compose([# transforms.RandomResizedCrop(D), transforms.Resize(D), transforms.RandomCrop(D), transforms.RandomHorizontalFlip(), transforms.ToTensor(), transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]) ]), ’val’: transforms.Compose([ transforms.Resize(D), transforms.CenterCrop(D), transforms.ToTensor(), transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]) ]),}data_dir = r’C:UsersAdministrator.SKY-20180518VHYDesktopmyself’image_datasets = {x: datasets.ImageFolder(os.path.join(data_dir, x), data_transforms[x]) for x in [’train’, ’val’]}dataloaders = {x: torch.utils.data.DataLoader(image_datasets[x], batch_size=200, shuffle=True, num_workers=4) for x in [’train’, ’val’]}dataset_sizes = {x: len(image_datasets[x]) for x in [’train’, ’val’]}class_names = image_datasets[’train’].classesdevice = torch.device('cuda:0' if torch.cuda.is_available() else 'cpu')#print(image_datasets[’train’][0])img, label = image_datasets[’val’][11] print(label)#輸出為2即第三類

以上這篇python實現將兩個文件夾合并至另一個文件夾(制作數據集)就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支持好吧啦網。

Python 編程

上一條：Python實現多線程下載腳本的示例代碼下一條：Python利用PyPDF2庫獲取PDF文件總頁碼實例

相關文章：

1. 在JSP中使用formatNumber控制要顯示的小數位數方法2. 將properties文件的配置設置為整個Web應用的全局變量實現方法3. JavaScrip簡單數據類型隱式轉換的實現4. PHP設計模式中工廠模式深入詳解5. ASP常用日期格式化函數 FormatDate()6. 利用CSS3新特性創建透明邊框三角7. jsp實現textarea中的文字保存換行空格存到數據庫的方法8. 如何在jsp界面中插入圖片9. XML入門的常見問題(二)10. ASP.NET Core實現中間件的幾種方式

排行榜

					
					教你如何寫出可維護的JS代碼
IDEA 通過docker插件發布springboot項目的詳細教程
IntelliJ IDEA創建web項目的方法
IntelliJ Idea2017如何修改緩存文件的路徑
Docker 容器健康檢查機制
PHP與已存在的Java應用程序集成
用PEAR來寫你的PHP程序
利用CSS3新特性創建透明邊框三角
在JSP中使用formatNumber控制要顯示的小數位數方法
如何在jsp界面中插入圖片
詳談ajax返回數據成功 卻進入error的方法