Python之迭代器的幾個高級用法
首先是跳過開始部分,這個在我們讀取文本的時候最常用。在實際的應用當中,比如記錄的日志或者是代碼等等,一般來說頭部都會附上一段說明,或者用注釋標注或者是用特殊的符號標記。這些信息是給用到數(shù)據(jù)的程序員看的,當我們通過代碼獲取數(shù)據(jù)的時候,顯然是希望可以過濾掉這些信息的。
比如我們有一段數(shù)據(jù),它的開頭用#做了一些注釋:
#Thisisadataforstudent
#Rows100
xiaoming,17,99;
xiaoli,18,98;
...
常規(guī)操作當中,我們會創(chuàng)建一個打開文件的迭代器,我們通過遍歷這個迭代器去獲取文件當中的數(shù)據(jù):
withopen('xxxx.txt')asf:
forlineinf:
print(line)
如果只是用來輸出還好,如果我們需要加工文件當中的數(shù)據(jù),那么頭部的注釋信息就會干擾我們代碼的運行。我們當然可以手動加入一些判斷,但是這會比較麻煩,代碼也不夠美觀。針對這個問題,一個比較好的解決方案是dropwhile。
dropwhile是itemtools當中的一個函數(shù),它可以接收一個我們自定義的過濾函數(shù)和迭代器重新生成一個新的迭代器,這個新的迭代器當中會過濾掉之前迭代器頭部不符合我們要求的數(shù)據(jù):
在剛才的例子當中我們想要過濾掉頭部加了#注釋的部分,我們可以這么操作:
fromitertoolsimportdropwhile
withopen('xxxx.txt')asf:
forlineindropwhile(lambdaline:line.startswith('#'),f):
print(line)
這樣出來的結果就沒有頭部我們不需要的內容了。
當我們知道頭部不符合情況的數(shù)據(jù)的格式的時候,可以使用dropwhile來規(guī)定過濾的格式。如果我們知道需要過濾的條數(shù),則可以使用另外一個工具,叫做islice,它的本質是一個切片函數(shù),就像是Python當中數(shù)組的切片功能一樣,可以切出迭代器當中指定片段的數(shù)據(jù)。
舉個例子:
fromitertoolsimportdropwhile
withopen('xxxx.txt')asf:
forlineinislice(f,3,None):
print(line)
這樣我們就會從第三行開始獲取,之前的數(shù)據(jù)會被過濾掉。它其實就代表著數(shù)組當中[3:]的切片操作。
迭代排列組合我們都知道在C++當中有一個叫做next_permutation的函數(shù),可以傳入一個數(shù)組,返回下一個字典序的排列。在Python當中也有同樣的功能,但是是以迭代器的形式使用的。
舉個簡單的例子,比如我們有a,b,c三個元素,我們希望求出它的所有排列:
items=['a','b','c']
fromitertoolsimportpermutations
forpinpermutations(items):
print(p)
permutations還支持多傳一個參數(shù),比如上述的排列當中我們希望只保留前兩個元素,除了切片之外,我們只需要多傳一個參數(shù)就好了,likethis:
forpinpermutations(items,2):
print(p)
除了排列之外,itertools當中還支持組合,用法還是一樣,只是把函數(shù)名稱換成是combinations而已:
fromitertoolsimportcombindations
forcincombinations(items):
print(c)
在一般的組合當中,一個元素一旦被選中那么它接下來就會從候選集當中移除,再也不會被選中。如果我們希望獲得有放回的組合,我們可以再換一個函數(shù),這個函數(shù)名稱有點長,但是名字倒也直觀叫做combinations_with_replacement。但既然是有放回的抽樣,我們需要設定元素的數(shù)量,否則抽樣可以無限進行下去。
forcincombinations_with_replacement(items,3):
print(c)
迭代合并后的序列上一篇文章當中我們介紹了zip可以同時迭代多個迭代器,除此之外還有一種情況是我們需要把多個迭代器串起來迭代。比如系統(tǒng)的日志打在了多個文件當中,我們希望找出其中有error的日志來分析。這個時候,我們希望的不是同時讀取多個迭代器,而是希望能夠有辦法將多個迭代器的內容串聯(lián)起來。這個功能就是itertools當中的chain方法,它接受多個迭代器,當我們遍歷的時候,會自動將多個迭代器的內容串聯(lián)起來,我們可以無縫迭代。
舉個例子:
fromitertoolsimportchain
nums=[1,2,3]
chars=['a','b','c']
foriinchain(nums,chars):
print(i)
這樣我們會把nums和chars當中的內容一起輸出出來,就好像從頭到尾只執(zhí)行了一個迭代器一樣。
你可能會說我們不用chain也可以實現(xiàn)啊,我們可以這樣:
foriinnums+chars:
print(i)
的確,從結果上來看這樣也是行得通的。但是如果我們分析一下內部執(zhí)行的時候的中間變量,會發(fā)現(xiàn)當我們執(zhí)行nums+chars的時候,實際上是先創(chuàng)建了一個新的臨時list。然后在這個list當中存儲nums和chars的數(shù)據(jù),也就是說我們迭代的其實是這個新的list。這帶來的結果是我們額外開辟了一段內存,并且花費了一些時間。如果我們使用chain,它并不會有這樣的中間變量,完全是通過迭代器來執(zhí)行的迭代,非常節(jié)省內存,這也是chain的優(yōu)點。
歸并迭代的內容對于歸并操作我們應該都不陌生,在之前的歸并排序以及一些題解的文章當中我們見過很多次。同樣,我們在使用工具合并多個迭代器內容的時候,如果迭代器當中的內容有序,我們也可以對多個迭代器當中的元素進行歸并,而不再需要我們自己手動操作。
使用我們之前介紹的heapq的庫可以非常輕松地做到這一點,我們一起來看一個例子:
a=[1,3,5]
b=[2,4,6]
importheapq
forcinheapq.merge(a,b):
print(c)
執(zhí)行之后,我們會得到[1,2,3,4,5,6]的結果。也就是說通過heapq.merge操作,我們把多個有序的迭代器合并到了一起。當然我們也可以自己合并,但如果我們只是需要利用當中的數(shù)據(jù)的話,使用merge操作可以節(jié)省內存空間。
以上內容為大家介紹了Python之迭代器的幾個高級用法,希望對大家有所幫助,如果想要了解更多Python相關知識,請關注IT培訓機構:千鋒教育。

猜你喜歡LIKE
相關推薦HOT
更多>>
python中的filter函數(shù)功能是什么?
python中的filter函數(shù)功能是什么?在python中,面對眾多的數(shù)據(jù),我們要過濾篩選出我們需要的數(shù)據(jù)。python中的filter函數(shù)就是起到了過濾篩選的作...詳情>>
2023-11-10 20:37:27
pythontime模塊是什么
pythontime模塊是什么在python中使用時間,就免不了和time模塊打交道,另外兩個模塊這個暫時先不做介紹。做time模塊的使用上,我們可以用它來對...詳情>>
2023-11-10 15:53:16
python是什么編程語言
python是什么編程語言1、說明是一種面向對象、解釋型計算機程序設計語言,由GuidovanRossum于1989年底發(fā)明,第一個公開發(fā)行版發(fā)行于1991年。Pyt...詳情>>
2023-11-10 15:21:05
python異常處理的兩種技巧
python異常處理的兩種技巧1、傳遞異常有時我們會在捕捉到一個異常后重新引發(fā)它(傳遞異常),實現(xiàn)起來很簡單,使用不帶參數(shù)的raise語句即可。deff...詳情>>
2023-11-10 14:49:39熱門推薦
python中的filter函數(shù)功能是什么?
沸python delattr函數(shù)如何使用?
熱python中pdb模塊怎么用?
熱Python如何截圖保存?
新python?中缺少module怎么辦?
python strftime和strptime的不同分析
python time.strptime的格式化
python中@contextmanager是什么?
python對象的三要素是什么
pythonGIL在Python多線程的應用
python如何對多個CSV文件進行讀取
pythonif嵌套命令如何理解?
python對列表進行永久性或臨時排序的方法
python生成器調用方法引發(fā)異常
技術干貨







快速通道 更多>>
-
課程介紹
點擊獲取大綱 -
就業(yè)前景
查看就業(yè)薪資 -
學習費用
了解課程價格 -
優(yōu)惠活動
領取優(yōu)惠券 -
學習資源
領3000G教程 -
師資團隊
了解師資團隊 -
實戰(zhàn)項目
獲取項目源碼 -
開班地區(qū)
查看來校路線