python如何讀取.mtx文件
mtx文件是按照稀疏矩陣格式存儲的矩陣數(shù)據(jù),可以按照以下步驟讀取:
1、安裝scanpy包pip install scanpy2、文件讀取
import scanpy as sc adata = sc.read(filename)data = adata.X
第一行read之后返回的是annData,第二行通過.X操作得到的是矩陣數(shù)據(jù)
3、轉(zhuǎn)換為稠密矩陣data = data.todense()
直接得到的矩陣是稀疏形式的,通過todense函數(shù)可轉(zhuǎn)換為稠密矩陣
補(bǔ)充:python讀取各種文件方式
Json:use_time=[]with open(address,’r’) as f: #ubuntu mobile = json.load(f) calls = mobile['transactions'][0]['calls']for call in calls: use_time.append(str(call[’use_time’]))Excel:
rawdata1=open_workbook(address)rawdata=rawdata1.sheet_by_index(0)for i in range(1,rawdata.nrows): if rawdata.cell(i,date_index).value=='': #跳過空行continue else:if ctype==3: #若為3,則用datetime模塊處理日期 date1=rawdata.cell(i,date_index).value date2 = xldate_as_tuple(date1,0) date3=datetime(*date2) if '.' in str(rawdata.cell(i,phone_index).value):phone1=str(rawdata.cell(i,phone_index).value)[:-2] else:phone1=str(rawdata.cell(i,phone_index).value)寫EXCEL:
Excel_file = xlwt.Workbook() sheet = Excel_file.add_sheet(’sheet0’)header=[u’號碼’,’日期top1’,’日期top2’,’日期top3’]#寫入標(biāo)題行:for i in range(len(header)): sheet.write(0,i,header[i])#開始按行寫入數(shù)據(jù):for i in range(len(phonelist)): sheet.write(i+1,0,phonelist[i]) sheet.write(i+1,1,dic[str(phonelist[i])])#保存EXCEL:Excel_file.save('C:/Users/Desktop/100個(gè)文件輸出xls/'+str(fileName)+'.xls')CSV:
rawdata=pd.read_csv(address,skip_blank_lines=True) #參數(shù)為去除空行if ’start_time’ or ’begin_time’ in rawdata.columns: if ’start_time’ in rawdata.columns:start_time=rawdata[’start_time’] elif ’begin_time’ in rawdata.columns: start_time=rawdata[’begin_time’]txt:
rawdata=open(address,’r’)i=0a=[] #c存放第一行的列名for line in rawdata: if i==1: #默認(rèn)第二行開始存儲通話數(shù)據(jù)a=line.split(’,’) #逗號作為分隔符for j in range(len(a)): #查找指定列名所在的列下標(biāo) if ((’-’ in str(a[j]))or(’/’ in str(a[j]))): #判斷日期所在列數(shù)date_index=j #保存日期的列下標(biāo) elif str(a[j]).isdigit() and len(str(a[j]))>5: #默認(rèn)全為數(shù)字組成的字符串為電話號碼phone_index=j else:passbreak else:i+=1i=0for line in rawdata:#開始轉(zhuǎn)存數(shù)據(jù): if len(line)<10: #跳過空行continue data_line=line.split(’,’) #txt默認(rèn)以’,’分隔數(shù)據(jù) if i==0:pass #第一行為列名,跳過i+=1 else: #從第二行開始保存數(shù)據(jù)start_time.append(data_line[date_index])
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持好吧啦網(wǎng)。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章:
1. Python多線程操作之互斥鎖、遞歸鎖、信號量、事件實(shí)例詳解2. Python常用GUI框架原理解析匯總3. XML入門的常見問題(一)4. django 鏈接多個(gè)數(shù)據(jù)庫 并使用原生sql實(shí)現(xiàn)5. Jsp中request的3個(gè)基礎(chǔ)實(shí)踐6. idea給項(xiàng)目打war包的方法步驟7. idea修改背景顏色樣式的方法8. IntelliJ IDEA 統(tǒng)一設(shè)置編碼為utf-8編碼的實(shí)現(xiàn)9. Django程序的優(yōu)化技巧10. idea設(shè)置自動導(dǎo)入依賴的方法步驟
