文章詳情頁

解決python存數據庫速度太慢的問題

瀏覽：3日期：2022-06-23 10:40:39

問題

在項目中遇到一個問題，需要從文本中讀取三萬條數據寫入mysql數據庫，文件中為用@分割的sql語句，但是在讀取的過程中發現速度過慢，三萬八千條數據需要220秒，問題代碼片段如下：

def read_to_mysql(filecata, targetDir): ’’’ 用來寫入數據庫，寫入后會剪貼掉文件 filecata 為保存有文件地址的list，已去掉尾部的空格 :param filecata: 文件目錄 :param targetDir: 要復制的目標目錄 :return: ’’’ root_dir = os.path.abspath(os.path.join(os.getcwd(), './')) config = configparser.ConfigParser() config.read(root_dir + '/config.ini') __host = config.get('DatabaseOfWRT', 'host') __database_name = config.get('DatabaseOfWRT', 'database') __user_name = config.get('DatabaseOfWRT', 'username') __user_passwaord = config.get('DatabaseOfWRT', 'password') __charset = config.get('DatabaseOfWRT', 'charset') conn = pymysql.connect( host=__host, user=__user_name, password=__user_passwaord, database=__database_name, charset=__charset ) cursor = conn.cursor() with open(filecata, 'r', encoding=’utf-8’) as f: data = f.read() # 讀取文件 data_list = data.split(’@’) del data_list[-1] starttime = int(time.time()) for data_str in data_list: data_str = str(data_str) sql = data_str + ’;’ cursor.execute(sql) conn.commit() print(flag) copy_del_file(filecata, targetDir) # 用來剪切的函數，此處不影響，因而省略 cursor.close() conn.close()解決方案

經測試發現，影響速度的主要原因是commit(),因為沒過幾秒提交一次即可，但是因為提交的字符長度有限制，所以要設置一個合理的時間讀取，代碼修改如下：

def read_to_mysql(filecata, targetDir): ’’’ 用來寫入數據庫，寫入后會剪貼掉文件 filecata 為保存有文件地址的list，已去掉尾部的空格 :param filecata: :param targetDir: 要復制的目標目錄 :return: ’’’ root_dir = os.path.abspath(os.path.join(os.getcwd(), './')) config = configparser.ConfigParser() config.read(root_dir + '/config.ini') __host = config.get('DatabaseOfWRT', 'host') __database_name = config.get('DatabaseOfWRT', 'database') __user_name = config.get('DatabaseOfWRT', 'username') __user_passwaord = config.get('DatabaseOfWRT', 'password') __charset = config.get('DatabaseOfWRT', 'charset') conn = pymysql.connect( host=__host, user=__user_name, password=__user_passwaord, database=__database_name, charset=__charset ) cursor = conn.cursor() with open(filecata, 'r', encoding=’utf-8’) as f: data = f.read() # 讀取文件 data_list = data.split(’@’) del data_list[-1] starttime = int(time.time()) for data_str in data_list: endtime = int(time.time()) data_str = str(data_str) sql = data_str + ’;’ cursor.execute(sql) if endtime - starttime ==10: # 每過十秒提交一次 starttime = int(time.time()) conn.commit() conn.commit() copy_del_file(filecata, targetDir) cursor.close() conn.close() return flag

此時寫入三萬八千條數據需要9秒

補充：python 連數據庫cursur.fetchall ()速度慢的解決方案

解決游標遍歷慢的方法：

一行一行去遍歷，而不是一下全部讀取出來

將cursur.fetchall()更改為for i in cursur:

補充：python 讀取文件時速度的問題

'''舉例讀取文件'''# 第一種方式with open(’test.txt’, ’r’, encoding=’utf-8’) as f: info = f.readlines() for line in info: pass# 第二種方式with open(’test.txt’, ’r’, encoding=’utf-8’) as f: for line in f: pass

對于以上兩種方式讀取文件，各自有各自的用途，當用兩種方式都可以時，第二種方式的效率是第一種的幾個量級， readlines()將文件內容讀取到內存的list中，操作雖然方便，但是消耗內存，運行效率慢。

原生的f是將文件內容讀到生成器中，當需要操作時，從生成器中循環出來，速度很快，操作大文件時建議用第二種方式！

以上為個人經驗，希望能給大家一個參考，也希望大家多多支持好吧啦網。如有錯誤或未考慮完全的地方，望不吝賜教。

Python 編程

上一條：python實現高效的遺傳算法下一條：python pyecharts庫的用法大全

相關文章：

1. CSS Hack大全-教你如何區分出IE6-IE10、FireFox、Chrome、Opera2. ASP.NET Core實現中間件的幾種方式3. React優雅的封裝SvgIcon組件示例4. PHP字符串前后字符或空格刪除方法介紹5. ASP腳本組件實現服務器重啟6. 如何在jsp界面中插入圖片7. jsp+servlet實現猜數字游戲8. ASP基礎知識Command對象講解9. ASP動態網頁制作技術經驗分享10. jsp+mysql實現網頁的分頁查詢

排行榜

					
					JavaScript與JQuery框架基礎入門教程
VMware如何進入BIOS方法
Ajax引擎 ajax請求步驟詳細代碼
Java如何在臨界區中避免競態條件
javascript寫的Hashtable類
Android如何優雅的處理重復點擊
IntelliJ IDEA創建web項目的方法
idea設置提示不區分大小寫的方法
IDEA導出jar打包成exe應用程序的小結
IDEA下lombok安裝及找不到get,set的問題的解決方法
使用UML編寫Java應用程序 (1)