Python 把兩層列表展開平鋪成一層(5種實(shí)現(xiàn)方式)
這幾天和同事在討論,如何用 Python 寫出優(yōu)雅的讓列表中的列表展開,變成扁平化的列表。
例如
# 期望輸入input = [[(’A’, 1), (’B’, 2)], [(’C’, 3), (’D’, 4)]] # 期望輸出output = [(’A’, 1), (’B’, 2), (’C’, 3), (’D’, 4)]map 函數(shù)合并
>>> new = []; map(new.extend, input); new[None, None][(’A’, 1), (’B’, 2), (’C’, 3), (’D’, 4)]
這個(gè)方法看上去還可以,但是有個(gè)致命的缺點(diǎn),就是map函數(shù)會(huì)返回值,并且這個(gè)返回值是沒有用的。另外還需要提前聲明一個(gè)變量,從代碼的簡潔性上,不夠簡潔優(yōu)雅。
sum 函數(shù)合并>>> sum(input, [])[(’A’, 1), (’B’, 2), (’C’, 3), (’D’, 4)]
這個(gè)看上去很簡潔,不過有類似字符串累加的性能陷阱。后面有性能對比。
reduce 函數(shù)>>> reduce(list.__add__, input)[(’A’, 1), (’B’, 2), (’C’, 3), (’D’, 4)]
做序列的累加操作。也是有累加的性能陷阱。
列表推導(dǎo)式>>> [item for sublist in input for item in sublist][(’A’, 1), (’B’, 2), (’C’, 3), (’D’, 4)]
列表推導(dǎo)式,看著有些長,而且還要for循環(huán)兩次,變成一行理解需要費(fèi)勁一些,沒有那么直觀。
itertools 類庫>>> list(itertools.chain(*input))[(’A’, 1), (’B’, 2), (’C’, 3), (’D’, 4)]
通過第三方類庫類實(shí)現(xiàn)的,相比其他的幾個(gè)實(shí)現(xiàn),看著還算比較優(yōu)雅。最后的性能發(fā)現(xiàn)居然還很高。
性能大對比python -mtimeit -s’l=[[1,2,3],[4,5,6], [7], [8,9]]*99’ ’reduce(list.__add__,l)’1000 loops, best of 3: 547 usec per looppython -mtimeit -s’l=[[1,2,3],[4,5,6], [7], [8,9]]*99’ ’sum(l, [])’1000 loops, best of 3: 509 usec per looppython -mtimeit -s’l=[[1,2,3],[4,5,6], [7], [8,9]]*99’ ’[item for sublist in l for item in sublist]’10000 loops, best of 3: 52.8 usec per looppython -mtimeit -s’l=[[1,2,3],[4,5,6], [7], [8,9]]*99; import itertools;’ ’list(itertools.chain(*l))’10000 loops, best of 3: 35.9 usec per looppython -mtimeit -s’l=[[1,2,3],[4,5,6], [7], [8,9]]*99’ ’new = []; map(new.extend, l); new’10000 loops, best of 3: 34.1 usec per loop
歡迎大家共同探討優(yōu)雅的的實(shí)現(xiàn)和性能的優(yōu)化。
補(bǔ)充:python 將(含嵌套的)dict平鋪展開
話不多說,直接上代碼:
def prefix_dict(di_, prefix_s=’’): ''' 把字典的每個(gè)key都帶上前綴prefix_s :param di_: :param prefix_s: :return: ''' return {prefix_s + k: v for k, v in di_.items()} def spear_dict(di_, con_s=’.’): ''' 展開dict(如果下層還是dict),需要遞歸,展開到下層的數(shù)據(jù)類型不是字典為止 可能實(shí)用的地方:將文檔類的數(shù)據(jù)格式化成更加關(guān)系化的樣子可能有用 :param di_: 輸入字典 :param con_s: 層級(jí)間的連接符號(hào) :return: 深度不大于1的字典,嵌套的其他數(shù)據(jù)類型照舊 ''' ret_di = {} for k, v in di_.items(): if type(v) is dict: v = spear_dict(v) # 這里或許有不寫到這一層的更好寫法 # for k_, v_ in v.items(): # ret_di.update({con_s.join([k, k_]): v_}) ret_di.update(prefix_dict(v, prefix_s=k + con_s)) else: ret_di.update({k: v}) return ret_di
>>> di_{’title’: ’新田商業(yè)街’, ’reliability’: 7, ’addressComponents’: {’streetNumber’: ’’, ’city’: ’深圳市’, ’street’: ’’, ’province’: ’廣東省’, ’district’: ’龍華區(qū)’}, ’location’: {’lng’: 114.09127044677734, ’lat’: 22.700519561767578}, ’adInfo’: {’adcode’: ’440309’}, ’level’: 11, ’more_deep’: {’loca’: {’lng’: 114.09127044677734, ’lat’: 22.700519561767578}}}>>> spear_dict(di_){’title’: ’新田商業(yè)街’, ’reliability’: 7, ’addressComponents.streetNumber’: ’’, ’addressComponents.city’: ’深圳市’, ’addressComponents.street’: ’’, ’addressComponents.province’: ’廣東省’, ’addressComponents.district’: ’龍華區(qū)’, ’location.lng’: 114.09127044677734, ’location.lat’: 22.700519561767578, ’adInfo.adcode’: ’440309’, ’level’: 11, ’more_deep.loca.lng’: 114.09127044677734, ’more_deep.loca.lat’: 22.700519561767578}spear_dict(di_, ’_’){’title’: ’新田商業(yè)街’, ’reliability’: 7, ’addressComponents_streetNumber’: ’’, ’addressComponents_city’: ’深圳市’, ’addressComponents_street’: ’’, ’addressComponents_province’: ’廣東省’, ’addressComponents_district’: ’龍華區(qū)’, ’location_lng’: 114.09127044677734, ’location_lat’: 22.700519561767578, ’adInfo_adcode’: ’440309’, ’level’: 11, ’more_deep_loca.lng’: 114.09127044677734, ’more_deep_loca.lat’: 22.700519561767578}
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持好吧啦網(wǎng)。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章:
1. 得到XML文檔大小的方法2. JSP+Servlet實(shí)現(xiàn)文件上傳到服務(wù)器功能3. XML入門的常見問題(二)4. 在JSP中使用formatNumber控制要顯示的小數(shù)位數(shù)方法5. 如何在jsp界面中插入圖片6. ASP常用日期格式化函數(shù) FormatDate()7. jsp實(shí)現(xiàn)textarea中的文字保存換行空格存到數(shù)據(jù)庫的方法8. chat.asp聊天程序的編寫方法9. CSS3實(shí)例分享之多重背景的實(shí)現(xiàn)(Multiple backgrounds)10. Jsp中request的3個(gè)基礎(chǔ)實(shí)踐
