文章詳情頁
python該種情形下應該使用pickle還是csv
瀏覽:112日期:2022-07-01 10:52:25
問題描述
我手頭有許多個上百M的csv存儲一些數據,需要經常使用pandas和matplotlib對這些數據讀取并進行繪圖。在繪圖之前,通常要進行預處理,切片等等清洗操作,因為要經常對figure進行交互操作和作報告,所以我在jupyter notebook中使用%matplotlib notebook進行操作和交互,我是將這些由原始數據產生的中間數據由csv保存,以便下次展示時直接讀取csv獲得中間數據,還是使用pickle保存,后續使用時讀取pickle更快?
問題解答
回答1:肯定是csv安全啊,pickle似乎換一個python版本都可能導致讀取失敗的,這個不是通用格式。幾百兆的話,csv其實讀取速度不慢。更何況還有hdf5,這些才是正經的數據交換格式。
回答2:csv夠用了,如果你覺得還不夠快可以試試hdf5文件
相關文章:
1. java - CompletableFuture allof 超時處理2. angular.js - angularjs的自定義過濾器如何給文字加顏色?3. 如何分別在Windows下用Winform項模板+C#,在MacOSX下用Cocos Application項目模板+Objective-C實現一個制作游戲的空的黑窗口?4. python - TypeError: tryMsgcode() takes exactly 2 arguments (0 given)5. javascript - 關于json中獲取多個key-value對中多層嵌套key的name6. android clickablespan獲取選中內容7. 關于docker下的nginx壓力測試8. android - 啟動模擬器的,報“Could not automatically detect an ADB binary……”,要怎么解決?9. javascript - 最終生成的jsBundle文件壓縮問題10. docker安裝后出現Cannot connect to the Docker daemon.
排行榜
