什么是Socket Socket接口是TCP/IP網(wǎng)絡的API,Socket接口定義了許多函數(shù)或例程,程序員可以用它們來開發(fā)TCP/IP網(wǎng)絡上的應用程序。要學Internet上的TCP/IP網(wǎng)絡編程,必須理解Socket接口。
Socket接口設計者最先是將接口放在Unix操作系統(tǒng)里面的。如果了解Unix系統(tǒng)的輸入和輸出的話,就很容易了解Socket了。網(wǎng)絡的
Socket數(shù)據(jù)傳輸是一種特殊的I/O,Socket也是一種文件描述符。Socket也具有一個類似于打開文件的函數(shù)調(diào)用Socket(),該函數(shù)返
回一個整型的Socket描述符,隨后的連接建立、數(shù)據(jù)傳輸?shù)炔僮鞫际峭ㄟ^該Socket實現(xiàn)的。常用的Socket類型有兩種:流式Socket
(SOCK_STREAM)和數(shù)據(jù)報式Socket(SOCK_DGRAM)。流式是一種面向連接的Socket,針對于面向連接的TCP服務應用;數(shù)據(jù)
報式Socket是一種無連接的Socket,對應于無連接的UDP服務應用。
Socket建立 為了建立Socket,程序可以調(diào)用Socket函數(shù),該函數(shù)返回一個類似于文件描述符的句柄。socket函數(shù)原型為: int socket(int domain, int type, int protocol);
domain指明所使用的協(xié)議族,通常為PF_INET,表示互聯(lián)網(wǎng)協(xié)議族(TCP/IP協(xié)議族);type參數(shù)指定socket的類型:
SOCK_STREAM
或SOCK_DGRAM,Socket接口還定義了原始Socket(SOCK_RAW),允許程序使用低層協(xié)議;protocol通常賦值"0"。
Socket()調(diào)用返回一個整型socket描述符,你可以在后面的調(diào)用使用它。 Socket描述符是一個指向內(nèi)部數(shù)據(jù)結構的指針,它指向描述符表入口。調(diào)用Socket函數(shù)時,socket執(zhí)行體將建立一個Socket,實際上"建立一個Socket"意味著為一個Socket數(shù)據(jù)結構分配存儲空間。Socket執(zhí)行體為你管理描述符表。 兩個網(wǎng)絡程序之間的一個網(wǎng)絡連接包括五種信息:通信協(xié)議、本地協(xié)議地址、本地主機端口、遠端主機地址和遠端協(xié)議端口。Socket數(shù)據(jù)結構中包含這五種信息。
Socket配置
通過socket調(diào)用返回一個socket描述符后,在使用socket進行網(wǎng)絡傳輸以前,必須配置該socket。面向連接的socket客戶端通過
調(diào)用Connect函數(shù)在socket數(shù)據(jù)結構中保存本地和遠端信息。無連接socket的客戶端和服務端以及面向連接socket的服務端通過調(diào)用
bind函數(shù)來配置本地信息。 Bind函數(shù)將socket與本機上的一個端口相關聯(lián),隨后你就可以在該端口監(jiān)聽服務請求。Bind函數(shù)原型為: int bind(int sockfd,struct sockaddr *my_addr, int addrlen); Sockfd是調(diào)用socket函數(shù)返回的socket描述符,my_addr是一個指向包含有本機IP地址及端口號等信息的sockaddr類型的指針;addrlen常被設置為sizeof(struct sockaddr)。 struct sockaddr結構類型是用來保存socket信息的: struct sockaddr { unsigned short sa_family; /* 地址族, AF_xxx */ char sa_data[14]; /* 14 字節(jié)的協(xié)議地址 */ }; sa_family一般為AF_INET,代表Internet(TCP/IP)地址族;sa_data則包含該socket的IP地址和端口號。 另外還有一種結構類型: struct sockaddr_in { short int sin_family; /* 地址族 */ unsigned short int sin_port; /* 端口號 */ struct in_addr sin_addr; /* IP地址 */ unsigned char sin_zero[8]; /* 填充0 以保持與struct sockaddr同樣大小 */ };
這個結構更方便使用。sin_zero用來將sockaddr_in結構填充到與struct
sockaddr同樣的長度,可以用bzero()或memset()函數(shù)將其置為零。指向sockaddr_in
的指針和指向sockaddr的指針可以相互轉換,這意味著如果一個函數(shù)所需參數(shù)類型是sockaddr時,你可以在函數(shù)調(diào)用的時候將一個指向
sockaddr_in的指針轉換為指向sockaddr的指針;或者相反。 使用bind函數(shù)時,可以用下面的賦值實現(xiàn)自動獲得本機IP地址和隨機獲取一個沒有被占用的端口號: my_addr.sin_port = 0; /* 系統(tǒng)隨機選擇一個未被使用的端口號 */ my_addr.sin_addr.s_addr = INADDR_ANY; /* 填入本機IP地址 */ 通過將my_addr.sin_port置為0,函數(shù)會自動為你選擇一個未占用的端口來使用。同樣,通過將my_addr.sin_addr.s_addr置為INADDR_ANY,系統(tǒng)會自動填入本機IP地址。 注意在使用bind函數(shù)是需要將sin_port和sin_addr轉換成為網(wǎng)絡字節(jié)優(yōu)先順序;而sin_addr則不需要轉換。 計算機數(shù)據(jù)存儲有兩種字節(jié)優(yōu)先順序:高位字節(jié)優(yōu)先和低位字節(jié)優(yōu)先。Internet上數(shù)據(jù)以高位字節(jié)優(yōu)先順序在網(wǎng)絡上傳輸,所以對于在內(nèi)部是以低位字節(jié)優(yōu)先方式存儲數(shù)據(jù)的機器,在Internet上傳輸數(shù)據(jù)時就需要進行轉換,否則就會出現(xiàn)數(shù)據(jù)不一致。 下面是幾個字節(jié)順序轉換函數(shù): ·htonl():把32位值從主機字節(jié)序轉換成網(wǎng)絡字節(jié)序 ·htons():把16位值從主機字節(jié)序轉換成網(wǎng)絡字節(jié)序 ·ntohl():把32位值從網(wǎng)絡字節(jié)序轉換成主機字節(jié)序 ·ntohs():把16位值從網(wǎng)絡字節(jié)序轉換成主機字節(jié)序 Bind()函數(shù)在成功被調(diào)用時返回0;出現(xiàn)錯誤時返回"-1"并將errno置為相應的錯誤號。需要注意的是,在調(diào)用bind函數(shù)時一般不要將端口號置為小于1024的值,因為1到1024是保留端口號,你可以選擇大于1024中的任何一個沒有被占用的端口號。
連接建立 面向連接的客戶程序使用Connect函數(shù)來配置socket并與遠端服務器建立一個TCP連接,其函數(shù)原型為: int connect(int sockfd, struct sockaddr *serv_addr,int addrlen); Sockfd
是socket函數(shù)返回的socket描述符;serv_addr是包含遠端主機IP地址和端口號的指針;addrlen是遠端地質結構的長度。
Connect函數(shù)在出現(xiàn)錯誤時返回-1,并且設置errno為相應的錯誤碼。進行客戶端程序設計無須調(diào)用bind(),因為這種情況下只需知道目的機器
的IP地址,而客戶通過哪個端口與服務器建立連接并不需要關心,socket執(zhí)行體為你的程序自動選擇一個未被占用的端口,并通知你的程序數(shù)據(jù)什么時候到
打斷口。 Connect函數(shù)啟動和遠端主機的直接連接。只有面向連接的客戶程序使用socket時才需要將此socket與遠端主機相連。無連接協(xié)議從不建立直接連接。面向連接的服務器也從不啟動一個連接,它只是被動的在協(xié)議端口監(jiān)聽客戶的請求。 Listen函數(shù)使socket處于被動的監(jiān)聽模式,并為該socket建立一個輸入數(shù)據(jù)隊列,將到達的服務請求保存在此隊列中,直到程序處理它們。 int listen(int sockfd, int backlog); Sockfd
是Socket系統(tǒng)調(diào)用返回的socket
描述符;backlog指定在請求隊列中允許的最大請求數(shù),進入的連接請求將在隊列中等待accept()它們(參考下文)。Backlog對隊列中等待
服務的請求的數(shù)目進行了限制,大多數(shù)系統(tǒng)缺省值為20。如果一個服務請求到來時,輸入隊列已滿,該socket將拒絕連接請求,客戶將收到一個出錯信息。
當出現(xiàn)錯誤時listen函數(shù)返回-1,并置相應的errno錯誤碼。 accept()函數(shù)讓服務器接收客戶的連接請求。在建立好輸入隊列后,服務器就調(diào)用accept函數(shù),然后睡眠并等待客戶的連接請求。 int accept(int sockfd, void *addr, int *addrlen);
sockfd是被監(jiān)聽的socket描述符,addr通常是一個指向sockaddr_in變量的指針,該變量用來存放提出連接請求服務的主機的信息
(某臺主機從某個端口發(fā)出該請求);addrten通常為一個指向值為sizeof(struct
sockaddr_in)的整型指針變量。出現(xiàn)錯誤時accept函數(shù)返回-1并置相應的errno值。 首先,當accept函數(shù)監(jiān)視的
socket收到連接請求時,socket執(zhí)行體將建立一個新的socket,執(zhí)行體將這個新socket和請求連接進程的地址聯(lián)系起來,收到服務請求的
初始socket仍可以繼續(xù)在以前的 socket上監(jiān)聽,同時可以在新的socket描述符上進行數(shù)據(jù)傳輸操作。
數(shù)據(jù)傳輸 Send()和recv()這兩個函數(shù)用于面向連接的socket上進行數(shù)據(jù)傳輸。 Send()函數(shù)原型為: int send(int sockfd, const void *msg, int len, int flags); Sockfd是你想用來傳輸數(shù)據(jù)的socket描述符;msg是一個指向要發(fā)送數(shù)據(jù)的指針;Len是以字節(jié)為單位的數(shù)據(jù)的長度;flags一般情況下置為0(關于該參數(shù)的用法可參照man手冊)。 Send()函數(shù)返回實際上發(fā)送出的字節(jié)數(shù),可能會少于你希望發(fā)送的數(shù)據(jù)。在程序中應該將send()的返回值與欲發(fā)送的字節(jié)數(shù)進行比較。當send()返回值與len不匹配時,應該對這種情況進行處理。 char *msg = "Hello!"; int len, bytes_sent; …… len = strlen(msg); bytes_sent = send(sockfd, msg,len,0); …… recv()函數(shù)原型為: int recv(int sockfd,void *buf,int len,unsigned int flags); Sockfd是接受數(shù)據(jù)的socket描述符;buf 是存放接收數(shù)據(jù)的緩沖區(qū);len是緩沖的長度。Flags也被置為0。Recv()返回實際上接收的字節(jié)數(shù),當出現(xiàn)錯誤時,返回-1并置相應的errno值。 Sendto()和recvfrom()用于在無連接的數(shù)據(jù)報socket方式下進行數(shù)據(jù)傳輸。由于本地socket并沒有與遠端機器建立連接,所以在發(fā)送數(shù)據(jù)時應指明目的地址。 sendto()函數(shù)原型為: int sendto(int sockfd, const void *msg,int len,unsigned int flags,const struct sockaddr *to, int tolen); 該函數(shù)比send()函數(shù)多了兩個參數(shù),to表示目地機的IP地址和端口號信息,而tolen常常被賦值為sizeof (struct sockaddr)。Sendto 函數(shù)也返回實際發(fā)送的數(shù)據(jù)字節(jié)長度或在出現(xiàn)發(fā)送錯誤時返回-1。 Recvfrom()函數(shù)原型為: int recvfrom(int sockfd,void *buf,int len,unsigned int flags,struct sockaddr *from,int *fromlen);
from是一個struct sockaddr類型的變量,該變量保存源機的IP地址及端口號。fromlen常置為sizeof (struct
sockaddr)。當recvfrom()返回時,fromlen包含實際存入from中的數(shù)據(jù)字節(jié)數(shù)。Recvfrom()函數(shù)返回接收到的字節(jié)數(shù)或
當出現(xiàn)錯誤時返回-1,并置相應的errno。 如果你對數(shù)據(jù)報socket調(diào)用了connect()函數(shù)時,你也可以利用send()和recv()進行數(shù)據(jù)傳輸,但該socket仍然是數(shù)據(jù)報socket,并且利用傳輸層的UDP服務。但在發(fā)送或接收數(shù)據(jù)報時,內(nèi)核會自動為之加上目地和源地址信息。
結束傳輸 當所有的數(shù)據(jù)操作結束以后,你可以調(diào)用close()函數(shù)來釋放該socket,從而停止在該socket上的任何數(shù)據(jù)操作: close(sockfd); 你也可以調(diào)用shutdown()函數(shù)來關閉該socket。該函數(shù)允許你只停止在某個方向上的數(shù)據(jù)傳輸,而一個方向上的數(shù)據(jù)傳輸繼續(xù)進行。如你可以關閉某socket的寫操作而允許繼續(xù)在該socket上接受數(shù)據(jù),直至讀入所有數(shù)據(jù)。 int shutdown(int sockfd,int how); Sockfd是需要關閉的socket的描述符。參數(shù) how允許為shutdown操作選擇以下幾種方式: ·0-------不允許繼續(xù)接收數(shù)據(jù) ·1-------不允許繼續(xù)發(fā)送數(shù)據(jù) ·2-------不允許繼續(xù)發(fā)送和接收數(shù)據(jù), ·均為允許則調(diào)用close () shutdown在操作成功時返回0,在出現(xiàn)錯誤時返回-1并置相應errno。
面向連接的Socket實例 代碼實例中的服務器通過socket連接向客戶端發(fā)送字符串"Hello, you are connected!"。只要在服務器上運行該服務器軟件,在客戶端運行客戶軟件,客戶端就會收到該字符串。 該服務器軟件代碼如下: #include <stdio.h> #include <stdlib.h> #include <errno.h> #include <string.h> #include <sys/types.h> #include <netinet/in.h> #include <sys/socket.h> #include <sys/wait.h> #define SERVPORT 3333 /*服務器監(jiān)聽端口號 */ #define BACKLOG 10 /* 最大同時連接請求數(shù) */ main() { int sockfd,client_fd; /*sock_fd:監(jiān)聽socket;client_fd:數(shù)據(jù)傳輸socket */ struct sockaddr_in my_addr; /* 本機地址信息 */ struct sockaddr_in remote_addr; /* 客戶端地址信息 */ if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1) { perror("socket創(chuàng)建出錯!"); exit(1); } my_addr.sin_family=AF_INET; my_addr.sin_port=htons(SERVPORT); my_addr.sin_addr.s_addr = INADDR_ANY; bzero(&(my_addr.sin_zero),8); if (bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr)) \ == -1) { perror("bind出錯!"); exit(1); } if (listen(sockfd, BACKLOG) == -1) { perror("listen出錯!"); exit(1); } while(1) { sin_size = sizeof(struct sockaddr_in); if ((client_fd = accept(sockfd, (struct sockaddr *)&remote_addr, \ &sin_size)) == -1) { perror("accept出錯"); continue; } printf("received a connection from %s\n", inet_ntoa(remote_addr.sin_addr)); if (!fork()) { /* 子進程代碼段 */ if (send(client_fd, "Hello, you are connected!\n", 26, 0) == -1) perror("send出錯!"); close(client_fd); exit(0); } close(client_fd); } } }
服務器的工作流程是這樣的:首先調(diào)用socket函數(shù)創(chuàng)建一個Socket,然后調(diào)用bind函數(shù)將其與本機地址以及一個本地端口號綁定,然后調(diào)用
listen在相應的socket上監(jiān)聽,當accpet接收到一個連接服務請求時,將生成一個新的socket。服務器顯示該客戶機的IP地址,并通過
新的socket向客戶端發(fā)送字符串"Hello,you are connected!"。最后關閉該socket。 代碼實例中的fork()函數(shù)生成一個子進程來處理數(shù)據(jù)傳輸部分,fork()語句對于子進程返回的值為0。所以包含fork函數(shù)的if語句是子進程代碼部分,它與if語句后面的父進程代碼部分是并發(fā)執(zhí)行的。
客戶端程序代碼如下: #include<stdio.h> #include <stdlib.h> #include <errno.h> #include <string.h> #include <netdb.h> #include <sys/types.h> #include <netinet/in.h> #include <sys/socket.h> #define SERVPORT 3333 #define MAXDATASIZE 100 /*每次最大數(shù)據(jù)傳輸量 */ main(int argc, char *argv[]){ int sockfd, recvbytes; char buf[MAXDATASIZE]; struct hostent *host; struct sockaddr_in serv_addr; if (argc < 2) { fprintf(stderr,"Please enter the server's hostname!\n"); exit(1); } if((host=gethostbyname(argv[1]))==NULL) { herror("gethostbyname出錯!"); exit(1); } if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1){ perror("socket創(chuàng)建出錯!"); exit(1); } serv_addr.sin_family=AF_INET; serv_addr.sin_port=htons(SERVPORT); serv_addr.sin_addr = *((struct in_addr *)host->h_addr); bzero(&(serv_addr.sin_zero),8); if (connect(sockfd, (struct sockaddr *)&serv_addr, \ sizeof(struct sockaddr)) == -1) { perror("connect出錯!"); exit(1); } if ((recvbytes=recv(sockfd, buf, MAXDATASIZE, 0)) ==-1) { perror("recv出錯!"); exit(1); } buf[recvbytes] = '\0'; printf("Received: %s",buf); close(sockfd); } 客戶端程序首先通過服務器域名獲得服務器的IP地址,然后創(chuàng)建一個socket,調(diào)用connect函數(shù)與服務器建立連接,連接成功之后接收從服務器發(fā)送過來的數(shù)據(jù),最后關閉socket。 函數(shù)gethostbyname()是完成域名轉換的。由于IP地址難以記憶和讀寫,所以為了方便,人們常常用域名來表示主機,這就需要進行域名和IP地址的轉換。函數(shù)原型為: struct hostent *gethostbyname(const char *name); 函數(shù)返回為hosten的結構類型,它的定義如下: struct hostent { char *h_name; /* 主機的官方域名 */ char **h_aliases; /* 一個以NULL結尾的主機別名數(shù)組 */ int h_addrtype; /* 返回的地址類型,在Internet環(huán)境下為AF-INET */ int h_length; /* 地址的字節(jié)長度 */ char **h_addr_list; /* 一個以0結尾的數(shù)組,包含該主機的所有地址*/ }; #define h_addr h_addr_list[0] /*在h-addr-list中的第一個地址*/ 當 gethostname()調(diào)用成功時,返回指向struct hosten的指針,當調(diào)用失敗時返回-1。當調(diào)用gethostbyname時,你不能使用perror()函數(shù)來輸出錯誤信息,而應該使用herror()函數(shù)來輸出。
無連接的客戶/服務器程序的在原理上和連接的客戶/服務器是一樣的,兩者的區(qū)別在于無連接的客戶/服務器中的客戶一般不需要建立連接,而且在發(fā)送接收數(shù)據(jù)時,需要指定遠端機的地址。
阻塞和非阻塞
阻塞函數(shù)在完成其指定的任務以前不允許程序調(diào)用另一個函數(shù)。例如,程序執(zhí)行一個讀數(shù)據(jù)的函數(shù)調(diào)用時,在此函數(shù)完成讀操作以前將不會執(zhí)行下一程序語句。當
服務器運行到accept語句時,而沒有客戶連接服務請求到來,服務器就會停止在accept語句上等待連接服務請求的到來。這種情況稱為阻塞
(blocking)。而非阻塞操作則可以立即完成。比如,如果你希望服務器僅僅注意檢查是否有客戶在等待連接,有就接受連接,否則就繼續(xù)做其他事情,則
可以通過將Socket設置為非阻塞方式來實現(xiàn)。非阻塞socket在沒有客戶在等待時就使accept調(diào)用立即返回。 #include <unistd.h> #include <fcntl.h> …… sockfd = socket(AF_INET,SOCK_STREAM,0); fcntl(sockfd,F_SETFL,O_NONBLOCK); ……
通過設置socket為非阻塞方式,可以實現(xiàn)"輪詢"若干Socket。當企圖從一個沒有數(shù)據(jù)等待處理的非阻塞Socket讀入數(shù)據(jù)時,函數(shù)將立即返
回,返回值為-1,并置errno值為EWOULDBLOCK。但是這種"輪詢"會使CPU處于忙等待方式,從而降低性能,浪費系統(tǒng)資源。而調(diào)用
select()會有效地解決這個問題,它允許你把進程本身掛起來,而同時使系統(tǒng)內(nèi)核監(jiān)聽所要求的一組文件描述符的任何活動,只要確認在任何被監(jiān)控的文件
描述符上出現(xiàn)活動,select()調(diào)用將返回指示該文件描述符已準備好的信息,從而實現(xiàn)了為進程選出隨機的變化,而不必由進程本身對輸入進行測試而浪費
CPU開銷。Select函數(shù)原型為: int select(int numfds,fd_set *readfds,fd_set *writefds, fd_set *exceptfds,struct timeval *timeout);
其中readfds、writefds、exceptfds分別是被select()監(jiān)視的讀、寫和異常處理的文件描述符集合。如果你希望確定是否可以
從標準輸入和某個socket描述符讀取數(shù)據(jù),你只需要將標準輸入的文件描述符0和相應的sockdtfd加入到readfds集合中;numfds的值
是需要檢查的號碼最高的文件描述符加1,這個例子中numfds的值應為sockfd+1;當select返回時,readfds將被修改,指示某個文件
描述符已經(jīng)準備被讀取,你可以通過FD_ISSSET()來測試。為了實現(xiàn)fd_set中對應的文件描述符的設置、復位和測試,它提供了一組宏: FD_ZERO(fd_set *set)----清除一個文件描述符集; FD_SET(int fd,fd_set *set)----將一個文件描述符加入文件描述符集中; FD_CLR(int fd,fd_set *set)----將一個文件描述符從文件描述符集中清除; FD_ISSET(int fd,fd_set *set)----試判斷是否文件描述符被置位。 Timeout參數(shù)是一個指向struct timeval類型的指針,它可以使select()在等待timeout長時間后沒有文件描述符準備好即返回。struct timeval數(shù)據(jù)結構為: struct timeval { int tv_sec; /* seconds */ int tv_usec; /* microseconds */ };
POP3客戶端實例 下面的代碼實例基于POP3的客戶協(xié)議,與郵件服務器連接并取回指定用戶帳號的郵件。與郵件服務器交互的命令存儲在字符串數(shù)組POPMessage中,程序通過一個do-while循環(huán)依次發(fā)送這些命令。 #include<stdio.h> #include <stdlib.h> #include <errno.h> #include <string.h> #include <netdb.h> #include <sys/types.h> #include <netinet/in.h> #include <sys/socket.h> #define POP3SERVPORT 110 #define MAXDATASIZE 4096
main(int argc, char *argv[]){ int sockfd; struct hostent *host; struct sockaddr_in serv_addr; char *POPMessage[]={ "USER userid\r\n", "PASS password\r\n", "STAT\r\n", "LIST\r\n", "RETR 1\r\n", "DELE 1\r\n", "QUIT\r\n", NULL }; int iLength; int iMsg=0; int iEnd=0; char buf[MAXDATASIZE];
if((host=gethostbyname("your.server"))==NULL) { perror("gethostbyname error"); exit(1); } if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1){ perror("socket error"); exit(1); } serv_addr.sin_family=AF_INET; serv_addr.sin_port=htons(POP3SERVPORT); serv_addr.sin_addr = *((struct in_addr *)host->h_addr); bzero(&(serv_addr.sin_zero),8); if (connect(sockfd, (struct sockaddr *)&serv_addr,sizeof(struct sockaddr))==-1){ perror("connect error"); exit(1); }
do { send(sockfd,POPMessage[iMsg],strlen(POPMessage[iMsg]),0); printf("have sent: %s",POPMessage[iMsg]);
iLength=recv(sockfd,buf+iEnd,sizeof(buf)-iEnd,0); iEnd+=iLength; buf[iEnd]='\0'; printf("received: %s,%d\n",buf,iMsg);
iMsg++; } while (POPMessage[iMsg]);
close(sockfd); }
|