文件描述符----文件表----v節(jié)點(diǎn)結(jié)構(gòu)三者的聯(lián)系
既然文件描述符標(biāo)識(shí)特定進(jìn)程正在訪問的文件,那進(jìn)程跟文件是怎么聯(lián)系起來的呢?
首先我們得知道每運(yùn)行一個(gè)進(jìn)程,shell就會(huì)默認(rèn)為其打開三個(gè)文件描述符(0,1,2),分別與標(biāo)準(zhǔn)輸入(stdin),標(biāo)準(zhǔn)輸出(stdout)和標(biāo)準(zhǔn)錯(cuò)誤(stderr)對(duì)應(yīng)。
接下來講下內(nèi)核所使用的三種數(shù)據(jù)結(jié)構(gòu),正是這三種數(shù)據(jù)結(jié)構(gòu)才使進(jìn)程最終跟文件聯(lián)系起來。建議邊看圖一邊看下面的文字描述
a. 每個(gè)進(jìn)程在進(jìn)程表中都有一個(gè)記錄項(xiàng),每個(gè)記錄項(xiàng)中有一張打開文件描述符表,可將其視為一個(gè)矢量,每個(gè)描述符占用一項(xiàng)。
與每個(gè)文件描述符相關(guān)聯(lián)的是:(a) 文件描述符。(b) 指向一個(gè)文件表項(xiàng)的指針
b. 內(nèi)核為所有打開文件維持一張文件表。每個(gè)文件表項(xiàng)包含:(a) 文件狀態(tài)標(biāo)志。(b) 當(dāng)前文件位移量。(c) 指向該文件v節(jié)點(diǎn)表項(xiàng)的指針。
c. 每個(gè)打開文件(或設(shè)備)都有一個(gè)v節(jié)點(diǎn)結(jié)構(gòu)。是文件的重要信息部分。
下圖表示以上三個(gè)數(shù)據(jù)結(jié)構(gòu)的關(guān)系:
fd1 = open(pathname, oflags);
fd2 = dup(fd1);
fd3 = open(pathname, oflags);

圖一
dup/dup2
相信大部分在Unix/Linux下編程的程序員手頭上都有《Unix環(huán)境高級(jí)編程》(APUE)這本超級(jí)經(jīng)典巨著。作者在該書中講解dup/dup2之前曾經(jīng)講過“文件共享”,這對(duì)理解dup/dup2還是很有幫助的。這里做簡單摘錄以備在后面的分析中使用:
Stevens said:
(1) 每個(gè)進(jìn)程在進(jìn)程表中都有一個(gè)記錄項(xiàng),每個(gè)記錄項(xiàng)中有一張打開文件描述符表,可將視為一個(gè)矢量,每個(gè)描述符占用一項(xiàng)。與每個(gè)文件描述符相關(guān)聯(lián)的是:
(a) 文件描述符標(biāo)志。
(b) 指向一個(gè)文件表項(xiàng)的指針。
(2) 內(nèi)核為所有打開文件維持一張文件表。每個(gè)文件表項(xiàng)包含:
(a) 文件狀態(tài)標(biāo)志(讀、寫、增寫、同步、非阻塞等)。
(b) 當(dāng)前文件位移量。
(c) 指向該文件v節(jié)點(diǎn)表項(xiàng)的指針。
圖示:
文件描述符表
------------
fd0 0 | p0 -------------> 文件表0 ---------> vnode0
------------
fd1 1 | p1 -------------> 文件表1 ---------> vnode1
------------
fd2 2 | p2
------------
fd3 3 | p3
------------
... ...
... ...
------------
一、單個(gè)進(jìn)程內(nèi)的dup和dup2
假設(shè)進(jìn)程A擁有一個(gè)已打開的文件描述符fd3,它的狀態(tài)如下:
進(jìn)程A的文件描述符表(before dup2)
------------
fd0 0 | p0
------------
fd1 1 | p1 -------------> 文件表1 ---------> vnode1
------------
fd2 2 | p2
------------
fd3 3 | p3 -------------> 文件表2 ---------> vnode2
------------
... ...
... ...
------------
經(jīng)下面調(diào)用:
n_fd = dup2(fd3, STDOUT_FILENO);后進(jìn)程狀態(tài)如下:
進(jìn)程A的文件描述符表(after dup2)
------------
fd0 0 | p0
------------
n_fd 1 | p1 ------------
------------ \
fd2 2 | p2 \
------------ _\|
fd3 3 | p3 -------------> 文件表2 ---------> vnode2
------------
... ...
... ...
------------
解釋如下:
n_fd = dup2(fd3, STDOUT_FILENO)表示n_fd與fd3共享一個(gè)文件表項(xiàng)(它們的文件表指針指向同一個(gè)文件表項(xiàng)),n_fd在文件描述符表中的位置為 STDOUT_FILENO的位置,而原先的STDOUT_FILENO所指向的文件表項(xiàng)被關(guān)閉,我覺得上圖應(yīng)該很清晰的反映出這點(diǎn)。按照上面的解釋我們 就可以解釋CU中提出的一些問題:
(1) "dup2的第一個(gè)參數(shù)是不是必須為已打開的合法filedes?" -- 答案:必須。
(2) "dup2的第二個(gè)參數(shù)可以是任意合法范圍的filedes值么?" -- 答案:可以,在Unix其取值區(qū)間為[0,255]。
另外感覺理解dup2的一個(gè)好方法就是把fd看成一個(gè)結(jié)構(gòu)體類型,就如上面圖形中畫的那樣,我們不妨把之定義為:
struct fd_t {
int index;
filelistitem *ptr;
};
然后dup2匹配index,修改ptr,完成dup2操作。
在學(xué)習(xí)dup2時(shí)總是碰到“重定向”一詞,上圖完成的就是一個(gè)“從標(biāo)準(zhǔn)輸出到文件的重定向”,經(jīng)過dup2后進(jìn)程A的任何目標(biāo)為STDOUT_FILENO的I/O操作如printf等,其數(shù)據(jù)都將流入fd3所對(duì)應(yīng)的文件中。下面是一個(gè)例子程序:
#define TESTSTR "Hello dup2\n"
int main() {
int fd3;
fd3 = open("testdup2.dat", 0666);
if (fd < 0) {
printf("open error\n");
exit(-1);
}
if (dup2(fd3, STDOUT_FILENO) < 0) {
printf("err in dup2\n");
}
printf(TESTSTR);
return 0;
}
其結(jié)果就是你在testdup2.dat中看到"Hello dup2"。
二、重定向后恢復(fù)
CU上有這樣一個(gè)帖子,就是如何在重定向后再恢復(fù)原來的狀態(tài)?首先大家都能想到要保存重定向前的文件描述符。那么如何來保存呢,象下面這樣行么?
int s_fd = STDOUT_FILENO;
int n_fd = dup2(fd3, STDOUT_FILENO);
還是這樣可以呢?
int s_fd = dup(STDOUT_FILENO);
int n_fd = dup2(fd3, STDOUT_FILENO);
這兩種方法的區(qū)別到底在哪呢?答案是第二種方案才是正確的,分析如下:按照第一種方法,我們僅僅在"表面上"保存了相當(dāng)于fd_t(按照我前面說的理解方 法)中的index,而在調(diào)用dup2之后,ptr所指向的文件表項(xiàng)由于計(jì)數(shù)值已為零而被關(guān)閉了,我們?nèi)绻僬{(diào)用dup2(s_fd, fd3)就會(huì)出錯(cuò)(出錯(cuò)原因上面有解釋)。而第二種方法我們首先做一下復(fù)制,復(fù)制后的狀態(tài)如下圖所示:
進(jìn)程A的文件描述符表(after dup)
------------
fd0 0 | p0
------------
fd1 1 | p1 -------------> 文件表1 ---------> vnode1
------------ /|
fd2 2 | p2 /
------------ /
fd3 3 | p3 -------------> 文件表2 ---------> vnode2
------------ /
s_fd 4 | p4 ------/
------------
... ...
... ...
------------
調(diào)用dup2后狀態(tài)為:
進(jìn)程A的文件描述符表(after dup2)
------------
fd0 0 | p0
------------
n_fd 1 | p1 ------------
------------ \
fd2 2 | p2 \
------------ _\|
fd3 3 | p3 -------------> 文件表2 ---------> vnode2
------------
s_fd 4 | p4 ------------->文件表1 ---------> vnode1
------------
... ...
... ...
------------
dup(fd)的語意是返回的新的文件描述符與fd共享一個(gè)文件表項(xiàng)。就如after dup圖中的s_fd和fd1共享文件表1一樣。
確定第二個(gè)方案后重定向后的恢復(fù)就很容易了,只需調(diào)用dup2(s_fd, n_fd);即可。下面是一個(gè)完整的例子程序:
#define TESTSTR "Hello dup2\n"
#define SIZEOFTESTSTR 11
int main() {
int fd3;
int s_fd;
int n_fd;
fd3 = open("testdup2.dat", 0666);
if (fd3 < 0) {
printf("open error\n");
exit(-1);
}
/* 復(fù)制標(biāo)準(zhǔn)輸出描述符 */
s_fd = dup(STDOUT_FILENO);
if (s_fd < 0) {
printf("err in dup\n");
}
/* 重定向標(biāo)準(zhǔn)輸出到文件 */
n_fd = dup2(fd3, STDOUT_FILENO);
if (n_fd < 0) {
printf("err in dup2\n");
}
write(STDOUT_FILENO, TESTSTR, SIZEOFTESTSTR); /* 寫入testdup2.dat中 */
/* 重定向恢復(fù)標(biāo)準(zhǔn)輸出 */
if (dup2(s_fd, n_fd) < 0) {
printf("err in dup2\n");
}
write(STDOUT_FILENO, TESTSTR, SIZEOFTESTSTR); /* 輸出到屏幕上 */
return 0;
}
注意這里我在輸出數(shù)據(jù)的時(shí)候我是用了不帶緩沖的write庫函數(shù),如果使用帶緩沖區(qū)的printf,則最終結(jié)果為屏幕上輸出兩行"Hello dup2",而文件testdup2.dat中為空,原因就是緩沖區(qū)作怪,由于最終的目標(biāo)是屏幕,所以程序最后將緩沖區(qū)的內(nèi)容都輸出到屏幕。
三、父子進(jìn)程間的dup/dup2
由fork調(diào)用得到的子進(jìn)程和父進(jìn)程的相同文件描述符共享同一文件表項(xiàng),如下圖所示:
父進(jìn)程A的文件描述符表
------------
fd0 0 | p0
------------
fd1 1 | p1 -------------> 文件表1 ---------> vnode1
------------ /|\
fd2 2 | p2 |
------------ |
|
子進(jìn)程B的文件描述符表 |
------------ |
fd0 0 | p0 |
------------ |
fd1 1 | p1 ---------------------|
------------
fd2 2 | p2
------------
所以恰當(dāng)?shù)睦胐up2和dup可以在父子進(jìn)程之間建立一條“溝通的橋梁”。這里不詳述。
四、小結(jié)
靈活的利用dup/dup2可以給你帶來很多強(qiáng)大的功能,花了一些時(shí)間總結(jié)出上面那么多,不知道自己理解的是否透徹,只能在以后的實(shí)踐中慢慢探索了。
轉(zhuǎn)載:
http://blog.21ic.com/user1/6406/archives/2011/81684.html