文章詳情頁

python 讀取以空格分開的文件操作

瀏覽：46日期：2022-06-22 10:58:36

在查找數據集的時候發現，并不是所有的數據集都是以csv的格式存儲，也就是每一列特征數據的分割并不是都以逗號分割，有的數據格式是以空格為分割

例如.data格式，

接下來就實現對.data格式數據的讀取：

(數據來源于Boston房價預測數據集，文件名稱為“housing.data”)

import pandas as pddata = pd.read_csv(’./housing.data’, delim_whiteshape=True)

以上代碼就是實現了對空格的分割，但是不知道針對也是以一列存儲，并且數據分割也是空格的csv文件此方法還行得通不。

另外pd.read_csv()中的參數sep和delimiter表示的意義一樣，具體如何使用不清楚，目前用到不多。

遇到讀取文件不知如何操作的，最后要訪問下官方文檔或者google查詢。

pd.read_csv官方文檔

另外，可以直接在原數據集文件加后綴名.csv即可轉換成csv文件，但前提是data中的數據已經以，分割好了。

pd.read_csv()中讀取文件時，默認第一行作為列名，但有時候第一行也是我們需要的數據，這時需制定參數header=None，或者給每列提前設置好名字，names=[‘column0’,‘column1’,…]

補充：python 實現以空格分隔的文件讀寫及二維數組按列折半查找

最近文件讀寫的工作比較多，每一次讀文件都會寫單獨的函數來適應文件格式，所以寫了一個類對文件進行操作。

（用pandas.read_csv讀取文件更好用）

import osclass DealData: # 數據加載函數 def load(self, filename):data = []file = open(filename, ’r’)for line in file.readlines(): line = line.strip(’n’) # 除去換行 line = line.split(’ ’) # 文件以“ ”分隔 if '' in line: # 解決每行結尾有空格的問題line.remove('') data.append(line)file.close()return data # 折半查找 # array是一個二維數組，函數實現的功能是按照array的第lie列折半查找 def search(self, array, lie, target):low = 0high = len(array) - 1while array[low][lie] <= array[high][lie]: mid = int((low + high) / 2) midval = array[mid][lie] if midval < target:low = mid + 1 elif midval > target:high = mid - 1 if high < 0 or low >= len(array):breakreturn high # 將數據保存到文件 def save(self, data, filename):file = open(filename, ’w’)for i in range(0, len(data), 1): for k in range(0, len(data[i]), 1):file.write(str(data[i][k]))file.write(' ') file.write('n')file.close()

可以將Dealdata類單獨創建一個python文件，命名為Dealdata，調用方法如下：

from DealData import DealData deal = DealData()totaldata = deal.load('E:low_data.txt')

之前先引用類：from Dealdata import Dealdata，其中第一個Dealdata為被調用的python文件名，第二個Dealdata為被調用的類名。

以上為個人經驗，希望能給大家一個參考，也希望大家多多支持好吧啦網。如有錯誤或未考慮完全的地方，望不吝賜教。

Python 編程

上一條：Python 通過分隔符分割文件后按特定次序重新組合的操作下一條：Python 如何將字符串每兩個用空格隔開

相關文章：

1. CSS3實例分享之多重背景的實現(Multiple backgrounds)2. 將properties文件的配置設置為整個Web應用的全局變量實現方法3. 在JSP中使用formatNumber控制要顯示的小數位數方法4. 得到XML文檔大小的方法5. ASP.NET Core實現中間件的幾種方式6. 如何在jsp界面中插入圖片7. jsp實現textarea中的文字保存換行空格存到數據庫的方法8. 利用CSS3新特性創建透明邊框三角9. XML入門的常見問題(二)10. ASP常用日期格式化函數 FormatDate()

排行榜

					
					教你如何寫出可維護的JS代碼
IntelliJ Idea2017如何修改緩存文件的路徑
PHP與已存在的Java應用程序集成
IntelliJ IDEA創建web項目的方法
Docker 容器健康檢查機制
IDEA 通過docker插件發布springboot項目的詳細教程
利用CSS3新特性創建透明邊框三角
Dockerfile 中 VOLUME 與 docker -v 的區別說明
在JSP中使用formatNumber控制要顯示的小數位數方法
如何在jsp界面中插入圖片
得到XML文檔大小的方法