linux命令学习之:curl详解程序员

  curl命令是一个利用URL规则在命令行下工作的开源文件传输工具。它支持文件的上传和下载,所以是综合传输工具,但按传统,习惯称curl为下载工具。作为一款强力工具,curl支持包括HTTP、HTTPS、ftp等众多协议,还支持POST、cookies、认证、从指定偏移处下载部分文件、用户代理字符串、限速、文件大小、进度条等特征。它被广泛应用在Unix、多种Linux发行版中,并且有DOS和Win32、Win64下的移植版本。

  如果系统没有curl可以使用yum install curl安装,也可以下载安装。

语法

  curl(选项)(参数)
选项

        linux命令学习之:curl详解程序员

        linux命令学习之:curl详解程序员

        linux命令学习之:curl详解程序员

        linux命令学习之:curl详解程序员

        linux命令学习之:curl详解程序员

        linux命令学习之:curl详解程序员

常用实例

1、文件下载

  下载单个文件,默认将输出打印到标准输出中(STDOUT)中。curl是将下载文件输出到stdout,将进度信息输出到stderr,不显示进度信息使用–silent选项。

curl http://www.centos.org

  通过-o/-O选项保存下载的文件到指定的文件中:

  -o:将文件保存为命令行中指定的文件名的文件中;

  -O:使用URL中默认的文件名保存文件到本地;

  –progress:显示进度条;

# 将文件下载到本地并命名为mygettext.html 
curl -o mygettext.html http://www.gnu.org/software/gettext/manual/gettext.html 
# 将文件保存到本地并命名为gettext.html 
curl -O http://www.gnu.org/software/gettext/manual/gettext.html

  同样可以使用转向字符”>”对输出进行转向输出。

  同时获取多个文件

curl -O URL1 -O URL2

  若同时从同一站点下载多个文件时,curl会尝试重用链接(connection)。

  通过-L选项进行重定向。
  默认情况下CURL不会发送HTTP Location headers(重定向),当一个被请求页面移动到另一个站点时,会发送一个HTTP Loaction header作为请求,然后将请求重定向到新的地址上。
  例如:访问google.com时,会自动将地址重定向到google.com.hk上。

curl http://www.google.com 
<HTML> 
<HEAD> 
    <meta http-equiv="content-type" content="text/html;charset=utf-8"> 
    <TITLE>302 Moved</TITLE> 
</HEAD> 
<BODY> 
    <H1>302 Moved</H1> 
        The document has moved 
        <A HREF="http://www.google.com.hk/url?sa=p&amp;hl=zh-CN&amp;pref=hkredirect&amp;pval=yes&amp;q=http://www.google.com.hk/&amp;ust=1379402837567135amp;usg=AFQjCNF3o7umf3jyJpNDPuF7KTibavE4aA">here</A>. 
</BODY> 
</HTML>    

  上述输出说明所请求的档案被转移到了http://www.google.com.hk。

  这是可以通过使用-L选项进行强制重定向

# 让curl使用地址重定向,此时会查询google.com.hk站点 
curl -L http://www.google.com

2、断点续传

  通过使用-C选项可对大文件使用断点续传功能

  curl URL/File -C

  偏移量 #偏移量是以字节为单位的整数,如果让curl自动推断出正确的续传位置使用-C –

# 当文件在下载完成之前结束该进程 
$ curl -O http://www.gnu.org/software/gettext/manual/gettext.html 
##############             20.1% 
# 通过添加-C选项继续对该文件进行下载,已经下载过的文件不会被重新下载 
curl -C - -O http://www.gnu.org/software/gettext/manual/gettext.html 
###############            21.1%

3、对CURL使用网络限速
  通过–limit-rate选项对CURL的最大网络使用进行限制

# 下载速度最大不会超过1000B/second 
curl --limit-rate 1000B -O http://www.gnu.org/software/gettext/manual/gettext.html

  使用–max-filesize指定可下载的最大文件大小, 如果文件大小超出限制,命令则返回一个非0退出码,如果命令正常则返回0:

curl URL --max-filesize bytes

4、下载指定时间内修改过的文件

  当下载一个文件时,可对该文件的最后修改日期进行判断,如果该文件在指定日期内修改过,就进行下载,否则不下载。
  该功能可通过使用-z选项来实现:

# 若yy.html文件在2011/12/21之后有过更新才会进行下载 
curl -z 21-Dec-11 http://www.example.com/yy.html

5、CURL授权

  在访问需要授权的页面时,可通过-u选项提供用户名和密码进行授权。

curl -u username:password URL 
# 通常的做法是在命令行只输入用户名,之后会提示输入密码,这样可以保证在查看历史记录时不会将密码泄露 
curl -u username URL

6、从FTP服务器下载文件

  CURL同样支持FTP下载,若在url中指定的是某个文件路径而非具体的某个要下载的文件名,CURL则会列出该目录下的所有文件名而并非下载该目录下的所有文件。

# 列出public_html下的所有文件夹和文件 
curl -u ftpuser:ftppass -O ftp://ftp_server/public_html/ 
# 下载xss.php文件 
curl -u ftpuser:ftppass -O ftp://ftp_server/public_html/xss.php

7、上传文件到FTP服务器

  通过 -T 选项可将指定的本地文件上传到FTP服务器上。

# 将myfile.txt文件上传到服务器 
curl -u ftpuser:ftppass -T myfile.txt ftp://ftp.testserver.com 
 
# 同时上传多个文件 
curl -u ftpuser:ftppass -T "{file1,file2}" ftp://ftp.testserver.com 
 
# 从标准输入获取内容保存到服务器指定的文件中 
curl -u ftpuser:ftppass -T - ftp://ftp.testserver.com/myfile_1.txt

8、获取更多信息

  通过使用 -v 和 -trace获取更多的链接信息。

9、通过字典查询单词

# 查询bash单词的含义 
curl dict://dict.org/d:bash  
# 列出所有可用词典 
curl dict://dict.org/show:db 
# 在foldoc词典中查询bash单词的含义 
curl dict://dict.org/d:bash:foldoc

10、为CURL设置代理

  -x 选项可以为CURL添加代理功能:

# 指定代理主机和端口 
curl -x proxysever.test.com:3128 http://google.co.in

11、保存与使用网站cookie信息

# 将网站的cookies信息保存到sugarcookies文件中 
curl -D sugarcookies http://localhost/sugarcrm/index.php 
# 使用上次保存的cookie信息 
curl -b sugarcookies http://localhost/sugarcrm/index.php

12、传递请求数据

  默认curl使用GET方式请求数据,这种方式下直接通过URL传递数据,可以通过 –data/-d 方式指定使用POST方式传递数据。

# GET 
curl -u username https://api.github.com/user?access_token=XXXXXXXXXX 
 
# POST 
curl -u username --data "param1=value1&param2=value" https://api.github.com 
 
# 也可以指定一个文件,将该文件中的内容当作数据传递给服务器端 
curl --data @filename https://github.api.com/authorizations

  注:默认情况下,通过POST方式传递过去的数据中若有特殊字符,首先需要将特殊字符转义在传递给服务器端,如value值中包含有空格,则需要先将空格转换成%20,如:

curl -d "value%201" http://hostname.com

  在新版本的CURL中,提供了新的选项 –data-urlencode,通过该选项提供的参数会自动转义特殊字符。

curl --data-urlencode "value 1" http://hostname.com

  除了使用GET和POST协议外,还可以通过 -X 选项指定其它协议,如:

curl -I -X DELETE https://api.github.cim

13、上传文件

curl --form "[email protected]" http://hostname/resource
curl -F "key=value" -F "[email protected]" http://localhost/upload

  如果使用了-F参数,curl会以multipart/form-data的方式发送POST请求。-F以key=value的形式指定要上传的参数,如果是文件,[email protected]

  如果使用-d命令,curl会以application/x-www-url-encoded格式上传参数。

curl -d "action=del" -d "id=12" http://localhost/test

  如果要以json格式上传参数,需要使用-H在命令中指定。

curl -H "Content-Type: application/json" -X POST -d '{"username":"xyz","password":"xyz"}' http://localhost/api/log

14、只打印响应头部信息

  通过-I或者-head可以只打印出HTTP头部信息:

[[email protected] text]# curl -I http://man.linuxde.net  
HTTP/1.1 200 OK  
Server: nginx/1.2.5  
date: Mon, 10 Dec 2012 09:24:34 GMT  
Content-Type: text/html;charset=UTF-8 
Connection: keep-alive
Vary: Accept-Encoding
X-Pingback: http://man.linuxde.net/xmlrpc.php

15、用curl设置用户代理字符串

  有些网站访问会提示只能使用IE浏览器来访问,这是因为这些网站设置了检查用户代理,可以使用curl把用户代理设置为IE,这样就可以访问了。

  使用–user-agent或者-A选项:

 curl URL --user-agent "Mozilla/5.0" curl URL -A "Mozilla/5.0"

  其他HTTP头部信息也可以使用curl来发送,使用-H”头部信息” 传递多个头部信息,例如: 

curl -H "Host:man.linuxde.net" -H "accept-language:zh-cn" URL

16、使用curl设置参照页字符串

  参照页是位于HTTP头部中的一个字符串,用来表示用户是从哪个页面到达当前页面的,如果用户点击网页A中的某个连接,那么用户就会跳转到B网页,网页B头部的参照页字符串就包含网页A的URL。

  使用–referer选项指定参照页字符串:

curl --referer http://www.google.com http://man.linuxde.net

原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/1184.html

(0)
上一篇 2021年7月15日
下一篇 2021年7月15日

相关推荐

发表回复

登录后才能评论