Posted on 2010-05-24 14:25
S.l.e!ep.¢% 閱讀(3545)
評(píng)論(0) 編輯 收藏 引用 所屬分類:
CURL
curl的應(yīng)用方式,一是可以直接通過(guò)命令行工具,另一種是利用libcurl庫(kù)做上層的開發(fā)。本篇主要總結(jié)一下命令行工具的http相關(guān)的應(yīng)用,
尤其是http下載方面的;下一篇再講基于libcurl庫(kù)的開發(fā)。
?
??
???
???
curl的命令行工具功能非常強(qiáng)大,這些數(shù)據(jù)交互的功能基本上都是通過(guò)URL方式進(jìn)行的,我們先來(lái)看看curl對(duì)多個(gè)URL的靈活操作,這些規(guī)則使我們的
批處理需求應(yīng)用起來(lái)非常方便。
???
???
1、用{}表示多個(gè)URL
??? 如 http://site.{one,two,three}.com,
只要在{}中寫上不同的部分,就可以表示3個(gè)URL了。
???
???
2、用[]表示多個(gè)URL
??? 如 ftp://ftp.numericals.com/file[1-100].txt,ftp://ftp.numericals.com/file[001-100].txt,ftp://ftp.letters.com/file[a-z].txt,
[]中表示按數(shù)字或字母的順序排列。
??? 還能表示不連續(xù)的排列,如
http://www.numericals.com/file[1-100:10].txt,
???
???
3、結(jié)合起來(lái)使用
??? 如 http://any.org/archive[1996-1999]/vol[1-4]/part{a,b,c}.html。
???
???
???
curl命令行工具的基本語(yǔ)句為:curl [options] [URL...],即 curl [選項(xiàng)]
[下載地址]。因此,如果你想下載百度的首頁(yè),最簡(jiǎn)單的方法啟動(dòng)cmd,進(jìn)入curl安裝目錄,輸入命令:curl http://www.baidu.com,回車,你的輸出窗口將立即出現(xiàn)百度首頁(yè)
的html數(shù)據(jù)。
???
對(duì)于所有的布爾型option,基本上--option表示支持這個(gè)選項(xiàng),--no-option表示禁用這個(gè)選項(xiàng)。下面總結(jié)幾個(gè)比較有用的
options。
???
???
1、-o/--output <file>
???
這個(gè)基本上要算最常用的選項(xiàng)了,用于將下載的數(shù)據(jù)保存到某個(gè)文件中。如 curl -o baidu.html http://www.baidu.com則將百度首頁(yè)保存到baidu.html
文件中了。下載過(guò)程中標(biāo)準(zhǔn)輸出還會(huì)顯示下載的統(tǒng)計(jì)信息,比如進(jìn)度、下載字節(jié)數(shù)、下載速度等。如果指定輸出為"-",則下載數(shù)據(jù)會(huì)輸出到標(biāo)準(zhǔn)輸出。
???
如果輸出的文件是一個(gè)多級(jí)目錄的話,則要配合--create-dirs選項(xiàng),--create-dirs將自動(dòng)創(chuàng)建設(shè)置的輸出目錄。
???
如果希望保存到本地的文件名和服務(wù)器上的相同,就可以直接用-O選項(xiàng)(大寫O),而省去指定本地文件名。
???
如果下載多個(gè)數(shù)據(jù)文件,可以使用上面提到的多URL規(guī)則。下載文件名也可以批量自定義,就是使用"#"。可以將"#"加到文件名當(dāng)中,這樣實(shí)際文件名中
的#將被多個(gè)URL中的當(dāng)前字符串代替,如
curl http://{site,host}.host[1-5].com
-o
"#1_#2",#1將被"site"或"host"代替,#2將被1-5之間的數(shù)字代替,也就是被當(dāng)前被處理的URL中的字符串代替。
???
另外下載數(shù)據(jù)的時(shí)候,可以加個(gè)"-#"選項(xiàng),用一個(gè)進(jìn)度條來(lái)代替文本表示進(jìn)度。
???
???
2、-c/--cookie-jar <file name> 和
-b/--cookie <name=data>
???
這是兩個(gè)操作cookie的選項(xiàng),很多服務(wù)器是需要cookie信息的。用前一個(gè)選項(xiàng)可以指定一個(gè)文件,將其他文件中的cookie或者從服務(wù)器得到的
cookie寫到文件中;后一個(gè)選項(xiàng)則用來(lái)向服務(wù)器發(fā)送cookie信息,可以用"name=data"的形式,也可以直接跟一個(gè)保存cookie的文件
名。
???
??? 3、-x/--proxy
<proxyhost[:port]>
???
該選項(xiàng)為http指定代理及端口,如果不指定端口,默認(rèn)為1080。如 curl -x 201.36.208.19:3128
http://curl.haxx.se/。
???
??? 4、-u/--user
<user:password> 和 -U/--proxy-user
<user:password>
???
登錄某些頁(yè)面或ftp需要先進(jìn)行認(rèn)證,輸入用戶名和密碼。curl的這個(gè)選項(xiàng)可以直接處理這類操作,用指定的賬號(hào)和密碼進(jìn)行登錄認(rèn)證。
???
后面的選項(xiàng)指定代理的用戶名和密碼,這樣便可以直接用這個(gè)代理訪問(wèn)網(wǎng)頁(yè)了,如? curl -U
user:password -x 201.36.208.19:3128 http://curl.haxx.se/。
???
???
5、-A/--user-agent <agent
string>
???
該選項(xiàng)可以指定客戶端類型,服務(wù)器通過(guò)該選項(xiàng)判斷用戶應(yīng)用的平臺(tái)及瀏覽器信息。如 curl -A "Mozilla/4.0
(compatible; MSIE 6.0; Windows NT 5.0)" http://www.clientinfo.com,
表示告訴服務(wù)器,客戶端是運(yùn)行在Windows 2000系統(tǒng)上的IE6.0。
???
???
6、-d/--data <data>
???
該選項(xiàng)用來(lái)以POST方式向http服務(wù)器發(fā)送特定數(shù)據(jù),最常用的就是提交表單。如 curl -d
"user=username&password=111" http://www.login.com,
表示用賬號(hào)username和密碼111向站點(diǎn)發(fā)送登錄申請(qǐng)。其中多個(gè)數(shù)據(jù)段可以用"&"進(jìn)行連接一起發(fā)送;如果數(shù)據(jù)前面加上符號(hào)"@",則數(shù)據(jù)
來(lái)源為后面指定的文件,如
curl -d password=@D:\pw.txthttp://www.login.com。
???
???
7、-C/--continue-at <offset>
???
改選項(xiàng)提供斷點(diǎn)續(xù)傳功能,與-o選項(xiàng)配合使用。如 curl -c -O
http://vfile.home.news.cn/music/public/vd05/200905/31/a8/MUfs052009053117155750a8be70.mp3。
如果指定offset,則從offset的位置開始續(xù)傳。如果未指定offset,或者直接用"-C
-",則curl會(huì)自己分析該從什么位置開始續(xù)傳。
???
???
8、-r/--range <range>
???
該選項(xiàng)指定下載字節(jié)的范圍,常應(yīng)用于分塊下載文件。range的表示方式有多種,如100-500,則指定從100開始的400個(gè)字節(jié)數(shù)據(jù);-500表示
最后的500個(gè)字節(jié);5000-表示從第5000個(gè)字節(jié)開始的所有字節(jié);另外還可以同時(shí)指定多個(gè)字節(jié)塊,中間用","分開。如
??? curl -r
0-1024000 -o new_divide_1.mp3
http://vfile.home.news.cn/music/public/vd05/200905/31/a8/MUfs052009053117155750a8be70.mp3
&
??? curl -r
1024001-2048000 -o new_divide_2.mp3
http://vfile.home.news.cn/music/public/vd05/200905/31/a8/MUfs052009053117155750a8be70.mp3
&
??? curl -r
2048001- -o new_divide_3.mp3
http://vfile.home.news.cn/music/public/vd05/200905/31/a8/MUfs052009053117155750a8be70.mp3
???
這樣就會(huì)將目標(biāo)mp3文件分塊下載為3個(gè)文件,然后可以用dos的copy命令:copy new_divide_1.mp3/b +
new_divide_2.mp3/b + new_divide_3.mp3/b
new_divide.mp3即可將3個(gè)分塊文件合并為一個(gè)完整的mp3文件。
???
???
9、-w/--write-out <format>
???
該選項(xiàng)格式化輸出一些用戶操作的數(shù)據(jù)信息,用到的格式化輸出符除了"\n","\r","\t"這些常見轉(zhuǎn)義符外,還包括"@"和"%"。其
中"@filename"表示輸出filename文件中的數(shù)據(jù),"@-"表示輸出用戶寫入標(biāo)準(zhǔn)輸入的數(shù)據(jù);"%"標(biāo)識(shí)符后面跟上定義的關(guān)鍵字,
則可以輸出對(duì)應(yīng)的curl數(shù)據(jù),常用的關(guān)鍵字有:
??? http_code ——
上次操作返回的響應(yīng)碼;
??? time_total
—— 上次操作耗時(shí),單位為秒;
??? time_connect
—— TCP連接遠(yuǎn)程主機(jī)的耗時(shí),單位為秒;
???
time_pretransfer —— 文件真正開始傳輸之前交互耗時(shí),單位為秒,可能主要包括一些命令處理和協(xié)議分析的耗時(shí);
???
time_starttransfer ——
文件的第一個(gè)字節(jié)開始傳輸之前的耗時(shí),單位為秒,包括time_pretransfer和服務(wù)器計(jì)算結(jié)果的時(shí)間;
???
size_download —— 下載的總字節(jié)數(shù);
??? size_upload
—— 上傳的總字節(jié)數(shù);
??? size_request
—— 發(fā)送http請(qǐng)求的總字節(jié)數(shù);
???
speed_download —— curl成功下載的平均下載速度;
??? speed_upload
—— curl成功上傳的平均上傳速度;
??? 舉例:curl -o
page.html -s -w %{time_connect}:%{time_starttransfer}:%{time_total}
http://curl.haxx.se/,其中-s表示安靜模式,即略去所有
狀態(tài)信息。
???
???
10、--connect-timeout <seconds> 和
-m/--max-time <seconds>
???
前者表示允許的連接的最長(zhǎng)耗時(shí),單位為秒;后者表示允許的整個(gè)操作的最長(zhǎng)耗時(shí),單位為秒,這個(gè)選項(xiàng)對(duì)于控制一個(gè)批處理操作的時(shí)長(zhǎng)非常有用。
???
???
11、--limit-rate <speed> 、
-Y/--speed-limit <speed> 和
-y/--speed-time <time>
??? --limit-rate
<speed>指定最大的數(shù)據(jù)傳輸率,單位為bytes/s,也可以用'k'或'K'表示kb/s,'m'或'M'表示mb/s,'g'或
'G'表示gb/s,所給的speed為平均傳輸率,短時(shí)間峰值可能會(huì)超過(guò)此值;
-Y/--speed-limit
<speed>指定最小傳輸率,單位為bytes/s,如果小于speed值,則傳輸中止,如此時(shí)-y選項(xiàng)沒(méi)有被設(shè)置,默認(rèn)time為
30;-y/--speed-time
<time>指定-Y選項(xiàng)的有效時(shí)間段,如果-Y選項(xiàng)沒(méi)有被設(shè)置,默認(rèn)為1。
?
???
12、--max-filesize <bytes>
???
該選項(xiàng)指定所要下載的文件的最大長(zhǎng)度,如果超過(guò)bytes值,則下載并不開始,curl返回退出碼63。
???
??? 13、--retry
<num> 、 --retry-delay
<seconds> 和 --retry-max-time
<seconds>
???
當(dāng)傳輸過(guò)程中出現(xiàn)錯(cuò)誤,如超時(shí)、FTP 5xx返回碼或者HTTP
5xx返回碼,curl會(huì)進(jìn)行按照設(shè)置進(jìn)行重試,這幾個(gè)選項(xiàng)都與重試有關(guān)。--retry
<num>設(shè)置重試次數(shù),--retry-delay
<seconds>設(shè)置兩次重試的間隔時(shí)間,--retry-max-time
<seconds>設(shè)置兩次重試間隔的最長(zhǎng)時(shí)間。默認(rèn)情況下,curl不進(jìn)行重試;如果重試,第一次間隔1秒,之后每次都間隔上一次的2倍時(shí)
間,直到間隔時(shí)間達(dá)到10分鐘,之后的重試都將采用10分鐘間隔。如果這3個(gè)選項(xiàng)的值被重新設(shè)置,則執(zhí)行設(shè)置值。
???
???
14、-T/--upload-file <file>
???
該選項(xiàng)是上傳命令,如向http服務(wù)器上傳一個(gè)文件:curl -T D:\new_divide.mp3 http://www.uploadserver.com/path/;
向一個(gè)ftp服務(wù)器上傳文件:curl
-T D:\new_divide.mp3 -u user:password ftp://upload_site:port/path/。
?
???
curl定義了一組"EXIT
CODES",用來(lái)標(biāo)識(shí)在出現(xiàn)錯(cuò)誤時(shí)的相關(guān)信息,目前范圍從1-83,具體信息可以查閱curl庫(kù)自帶的文檔。這些退出碼對(duì)于我們分析錯(cuò)誤及原因有很大幫
助。
???
???
???
以上簡(jiǎn)單介紹了一下利用curl命令行工具進(jìn)行一些簡(jiǎn)單的http和ftp應(yīng)用,大家可以試著多用一下,會(huì)慢慢發(fā)現(xiàn)curl的強(qiáng)大功能,有很多獨(dú)特的功能
用起來(lái)非常簡(jiǎn)單方便。