python流式讀取大文件的兩種方法
python流式讀取大文件的兩種方法
1、使用read方法分塊讀取
使用更底層的file.read()方法,與直接循環(huán)迭代文件對象不同,每次調(diào)用file.read(chunk_size)會(huì)直接返回從當(dāng)前位置往后讀取chunk_size大小的文件內(nèi)容,不必等待任何換行符出現(xiàn)。
defcount_nine_v2(fname):
"""計(jì)算文件里包含多少個(gè)數(shù)字'9',每次讀取8kb
"""
count=0
block_size=1024*8
withopen(fname)asfp:
whileTrue:
chunk=fp.read(block_size)
#當(dāng)文件沒有更多內(nèi)容時(shí),read調(diào)用將會(huì)返回空字符串''
ifnotchunk:
break
count+=chunk.count('9')
returncount
2、利用生成器解耦代碼
可以定義一個(gè)新的chunked_file_reader生成器函數(shù),由它來負(fù)責(zé)所有與“數(shù)據(jù)生成”相關(guān)的邏輯。
count_nine_v3里面的主循環(huán)就只需要負(fù)責(zé)計(jì)數(shù)即可。
defchunked_file_reader(fp,block_size=1024*8):
"""生成器函數(shù):分塊讀取文件內(nèi)容
"""
whileTrue:
chunk=fp.read(block_size)
#當(dāng)文件沒有更多內(nèi)容時(shí),read調(diào)用將會(huì)返回空字符串''
ifnotchunk:
break
yieldchunk
defcount_nine_v3(fname):
count=0
withopen(fname)asfp:
forchunkinchunked_file_reader(fp):
count+=chunk.count('9')
returncount
使用iter(callable,sentinel)的方式調(diào)用它時(shí),會(huì)返回一個(gè)特殊的對象,迭代它將不斷產(chǎn)生可調(diào)用對象callable的調(diào)用結(jié)果,直到結(jié)果為setinel時(shí),迭代終止。
defchunked_file_reader(file,block_size=1024*8):
"""生成器函數(shù):分塊讀取文件內(nèi)容,使用iter函數(shù)
"""
#首先使用partial(fp.read,block_size)構(gòu)造一個(gè)新的無需參數(shù)的函數(shù)
#循環(huán)將不斷返回fp.read(block_size)調(diào)用結(jié)果,直到其為''時(shí)終止
forchunkiniter(partial(file.read,block_size),''):
yieldchunk
以上就是Python流式讀取大文件的兩種方法,更多Python學(xué)習(xí)教程請關(guān)注IT培訓(xùn)機(jī)構(gòu):千鋒教育。

猜你喜歡LIKE
相關(guān)推薦HOT
更多>>
python中的filter函數(shù)功能是什么?
python中的filter函數(shù)功能是什么?在python中,面對眾多的數(shù)據(jù),我們要過濾篩選出我們需要的數(shù)據(jù)。python中的filter函數(shù)就是起到了過濾篩選的作...詳情>>
2023-11-10 20:37:27
pythontime模塊是什么
pythontime模塊是什么在python中使用時(shí)間,就免不了和time模塊打交道,另外兩個(gè)模塊這個(gè)暫時(shí)先不做介紹。做time模塊的使用上,我們可以用它來對...詳情>>
2023-11-10 15:53:16
python是什么編程語言
python是什么編程語言1、說明是一種面向?qū)ο蟆⒔忉屝陀?jì)算機(jī)程序設(shè)計(jì)語言,由GuidovanRossum于1989年底發(fā)明,第一個(gè)公開發(fā)行版發(fā)行于1991年。Pyt...詳情>>
2023-11-10 15:21:05
python異常處理的兩種技巧
python異常處理的兩種技巧1、傳遞異常有時(shí)我們會(huì)在捕捉到一個(gè)異常后重新引發(fā)它(傳遞異常),實(shí)現(xiàn)起來很簡單,使用不帶參數(shù)的raise語句即可。deff...詳情>>
2023-11-10 14:49:39熱門推薦
python中的filter函數(shù)功能是什么?
沸python delattr函數(shù)如何使用?
熱python中pdb模塊怎么用?
熱Python如何截圖保存?
新python?中缺少module怎么辦?
python strftime和strptime的不同分析
python time.strptime的格式化
python中@contextmanager是什么?
python對象的三要素是什么
pythonGIL在Python多線程的應(yīng)用
python如何對多個(gè)CSV文件進(jìn)行讀取
pythonif嵌套命令如何理解?
python對列表進(jìn)行永久性或臨時(shí)排序的方法
python生成器調(diào)用方法引發(fā)異常
技術(shù)干貨







快速通道 更多>>
-
課程介紹
點(diǎn)擊獲取大綱 -
就業(yè)前景
查看就業(yè)薪資 -
學(xué)習(xí)費(fèi)用
了解課程價(jià)格 -
優(yōu)惠活動(dòng)
領(lǐng)取優(yōu)惠券 -
學(xué)習(xí)資源
領(lǐng)3000G教程 -
師資團(tuán)隊(duì)
了解師資團(tuán)隊(duì) -
實(shí)戰(zhàn)項(xiàng)目
獲取項(xiàng)目源碼 -
開班地區(qū)
查看來校路線