先來看看不帶緩存的I/O和標(biāo)準(zhǔn)(帶緩存的)I/O都有那些
不帶緩存的I/O: read,write,open......
標(biāo)準(zhǔn)(帶緩存的)I/O: fgets,fread,fwrite.....
這里使用兩個(gè)對(duì)應(yīng)的函數(shù)進(jìn)行比較:
ssize_t write(int filedes, const void *buff, size_t nbytes)
size_t fwrite(const void *ptr, size_t size, size_t nobj, FILE *fp)
上面的buff和ptr都是指應(yīng)用程序自己使用的buffer,實(shí)際上當(dāng)需要對(duì)文件進(jìn)行寫操作時(shí),都會(huì)先寫到內(nèi)核所設(shè)的緩沖存儲(chǔ)器。如果該緩存未滿,則并不將其排入輸出隊(duì)列,直到緩存寫滿或者內(nèi)核再次需要重新使用此緩存時(shí)才將其排入磁盤I/O輸入隊(duì)列,再進(jìn)行實(shí)際的I/O操作,也就是此時(shí)才把數(shù)據(jù)真正寫到磁盤,這種技術(shù)叫延遲寫。
如果我們直接用非緩存I/O對(duì)內(nèi)核的緩沖區(qū)進(jìn)行讀寫,會(huì)產(chǎn)生許多管理不善而造成的麻煩(如一次性寫入過多,或多次系統(tǒng)調(diào)用導(dǎo)致的效率低下)。
標(biāo)準(zhǔn)(帶緩存的)I/O為我們解決了這些問題,它處理很多細(xì)節(jié),如緩沖區(qū)分配,以優(yōu)化長(zhǎng)度執(zhí)行I/O等,更便于我們使用。
由于標(biāo)準(zhǔn)(帶緩存的)I/O在系統(tǒng)調(diào)用的上一層多加了一個(gè)緩沖區(qū),也因此引入了流的概念,在UNIX/Linux下表示為FILE*(并不限于UNIX/Linux,ANSI C都有FILE的概念),F(xiàn)ILE實(shí)際上包含了為管理流所需要的所有信息:實(shí)際I/O的文件描述符,指向流緩存的指針(標(biāo)準(zhǔn)I/O緩存,由malloc分配,又稱為用戶態(tài)進(jìn)程空間的緩存,區(qū)別于內(nèi)核所設(shè)的緩存),緩存長(zhǎng)度,當(dāng)前在緩存中的字節(jié)數(shù),出錯(cuò)標(biāo)志等。
因此可知,不帶緩存的I/O對(duì)文件描述符操作,帶緩存的標(biāo)準(zhǔn)I/O是針對(duì)流的。
標(biāo)準(zhǔn)I/O對(duì)每個(gè)I/O流自動(dòng)進(jìn)行緩存管理(標(biāo)準(zhǔn)I/O函數(shù)通常調(diào)用malloc來分配緩存)。它提供了三種類型的緩存:
1) 全緩存。當(dāng)填滿標(biāo)準(zhǔn)I/O緩存后才執(zhí)行I/O操作。磁盤上的文件通常是全緩存的。
2) 行緩存。當(dāng)輸入輸出遇到新行符或緩存滿時(shí),才由標(biāo)準(zhǔn)I/O庫執(zhí)行實(shí)際I/O操作。stdin、stdout通常是行緩存的。
3) 無緩存。相當(dāng)于read、write了。stderr通常是無緩存的,因?yàn)樗仨毐M快輸出。
一般而言,由系統(tǒng)選擇緩存的長(zhǎng)度,并自動(dòng)分配。標(biāo)準(zhǔn)I/O庫在關(guān)閉流的時(shí)候自動(dòng)釋放緩存。另外,也可以使用函數(shù)fflush()將流所有未寫的數(shù)據(jù)送入(刷新)到內(nèi)核(內(nèi)核緩沖區(qū)),fsync()將所有內(nèi)核緩沖區(qū)的數(shù)據(jù)寫到文件(磁盤)。
在標(biāo)準(zhǔn)I/O庫中也有引入緩存管理而帶來的缺點(diǎn)--效率問題。例如當(dāng)使用每次一行函數(shù)fgets和fputs時(shí),通常需要復(fù)制兩次數(shù)據(jù):一次是在內(nèi)核和標(biāo)準(zhǔn)I/O緩存之間(當(dāng)調(diào)用read和write時(shí)),第二次是在標(biāo)準(zhǔn)I/O緩存(通常系統(tǒng)分配和管理)和用戶程序中的行緩存(fgets的參數(shù)就需要一個(gè)用戶行緩存指針)之間。