掌握HTTP协议的通信方式
了解HTTP请求中不同字段的作用
了解HTTPheader中状态码的作用
掌握使用wireshark提取HTTP传输文件的方法
听说用户在网站上下载了一个好玩的图片?是什么呢?
HTTP协议即超文本传输协议,由TCP承载,实际上是基于TCP建立的可靠连接,进行数据传递。wireshark根据一个数据包既是TCP包,它的来源和目的端口是80(HTTP端口),对它进行http协议数据包格式的解析,并识别成HTTP数据包。我们可以通过分组详情和TCP的标志位PSH,看出来:
wireshark载入HTTP.pcapng流量包。根据上节实验,我们可以得到前三个数据包是192.168.233.1向192.168.233.131请求建立一个TCP连接的过程。请求连接的目的端口是80,即HTTP端口。第四个是向服务端发送的HTTP请求。
我们打开Hypertext Transfer Protocol,可以看到分组详情中GET /move.php HTTP/1.1\r\n
,展开之后,GET即请求方法,请求的URL是/move.php,采用的HTTP协议版本是1.1。
紧接着是请求的Host字段,即请求的ip地址或域名。后面的字段内容我们等下会讲到。
HTTP请求的方法有很多:GET、HEAD、POST、PUT、DELETE等等,常用的有GET,POST等等。GET常用语请求某种资源,而POST则常用于向服务器发送数据等等。HTTP协议版本目前最新的是2.0,目前常用HTTP1.1.
我们可以通过刚才第四个数据包分组详情中的Response in frame:6 判断这个请求包的响应包位置,也可以通过wireshark在分组列表点击对应包,前面的小箭头确认发送包和回包,如下图中分组列表中No列的小箭头:
现在分析这个返回的数据包,同样展开分组详情中HTTP/1.1 301 Moved Permanently\r\n
,可以得到HTTP版本1.1,Status Code(状态码)301,状态报告:临时移动(重定向)。
注意下面有一个Location,当我们的状态码是301/302重定向的时候,Location字段的内容告诉浏览器应该去请求这里的内容,浏览器转而向这个地址发送GET请求。就是将当前页面重定向到了另一个页面。在当前数据包情况下,我们可以得知访问move.php,重定向到了this.php。这样我们跟踪流量包,可以看到序号为7的数据包请求了this.php这个页面。这样我们就明白了HTTP状态码301的作用。
在这个流量包中,序号8,14,19都返回了HTTP状态码200.200表示OK,即没有问题的把你请求的东西给你。序号11的数据包返回的HTTP状态码404,404表示没有找到,即请求的资源在该服务器上没有找到。这个场景是我们大多数的浏览器在访问一个web页面的过程中都会主动请求这个网页的图标,当然这个也页面没有设置图标(favicon.ico)的时候,返回的就是404.
请求中常见:
Referer,这个字段的作用是标记来源页面,允许服务器生成回退链表,可用来登陆、优化cache等。在这个流量包中,序号16的数据包是包含referer字段的,因为我们通过download.html点击了一个图片文件,这是浏览器去请求这个图片文件的时候就会带上Referer这个字段,告知服务端来源页面。
User-Agent,用于发送用户端信息,如当前操作系统版本,浏览器版本,内核版本等等,方便服务端根据不同UA判断浏览器,提供更好的服务,也常被用来绕过一些浏览限制。UA的标准格式为:浏览器标识 (操作系统标识; 加密等级标识; 浏览器语言) 渲染引擎标识 版本信息
。见上图Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.71 Safari/537.36
,我们可以得到使用了chrome54.0.2840.99,浏览器内核WebKit 537.36,windows 10 64位操作系统(Windows NT 10.0内核版本号)等等。
Cookie,用于辨别用户身份。
Cache-Control,指定请求和响应遵循的缓存机制。
Accept,指定可以接收的内容:
响应中常见:
Server,标识服务器信息
Date,时间信息
Content_type,返回内容类型
Content_length_header,内容长度
Last_modified,最后编辑,用于优化缓存
Connection,是否终止TCP连接
网页提取:
比如我们要提取download.html也买年内容,可以选择返回的HTTP内容的包,即序号为14的数据包。展开分组详情,最下面是Line-based text data: text/html。在这里右键,选择导出分组字节流,或者选中之后Ctrl+H,将内容导出,并命名成对应的文件类型,使用浏览器打开。
图片提取:
同理,在当前流量包中包含有一个xianyu.jpg的图片请求,我们找到对应的返回包。在wireshark的分组详情中,显示为JPEG File Interchange Format
,同理右键导出分组字节流,保存为jpg格式,打开即可。我们得到了:
根据download.html的内容即可获知xianyu.jpg为用户下载的文件。