最近深度学习了下**HttpClient 4.5.2,大家都知道,HttpClient 是Apache Jakarta Common 下的子项目,可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包,并且它支持 HTTP 协议最新的版本和建议**。
理解不是太深刻,理解错误之处还请指出。废话不多说,开始记录。
#####使用工具
- HttpClient 4.5.2
- maven依赖
<dependency> <groupId>org.apache.httpcomponents</groupId> <artifactId>httpclient</artifactId> <version>4.5.2</version> </dependency>
public static void main(String[] args) {
// 获取连接客户端工具
CloseableHttpClient httpClient = HttpClients.createDefault();
// 创建GET请求对象
HttpGet httpGet = new HttpGet("https://www.baidu.com");
String entityStr = null;
CloseableHttpResponse response = null;
try {
// 执行请求
response = httpClient.execute(httpGet);
// 获得响应的实体对象
HttpEntity entity = response.getEntity();
// 使用Apache提供的工具类进行转换成字符串
entityStr = EntityUtils.toString(entity);
} catch (ClientProtocolException e) {
System.err.println("Http协议出现问题");
e.printStackTrace();
} catch (ParseException e) {
System.err.println("解析错误");
e.printStackTrace();
} catch (IOException e) {
System.err.println("IO异常");
e.printStackTrace();
} finally {
if (null != response) {
try {
// 释放连接
response.close();
httpClient.close();
} catch (IOException e) {
System.err.println("释放连接出错");
e.printStackTrace();
}
}
}
// 打印响应内容
System.out.println(entityStr);
}
我们平常使用浏览器进行访问网站时,httpClient
就相当于浏览器的一个标签页
,httpGet
就相当于浏览器上面的每一个超连接
。我们需要建立在已经存在标签页的基础上,才能发起一个新的请求。EntityUtils
就相当于浏览器的渲染引擎,把服务端响应回来的数据解析出来,当然,这里解析出来的是字符串,而浏览器解析出来的结果是已经渲染好的界面。httpClient
的每一次访问都需要开启一个Http连接,而每一个Http连接都是很珍贵的,随意这地方后边会使用连接池
进行管理。
- 打印结果:
上图所示,出现响应结果,但是细心可以发现,有一部分是 乱码显示
,这部分为**中文乱码
**。
解决办法是把上面代码中的entityStr = EntityUtils.toString(entity);
修改成entityStr = EntityUtils.toString(entity, "UTF-8");
指定编码格式解析响应数据即可解决;
- 打印结果:
- #####关于消耗HTTP实体内容
HttpClient推荐使用HttpEntity的getConent()方法或者HttpEntity的writeTo(OutputStream)方法来消耗掉Http实体内容。HttpClient也提供了EntityUtils
这个类,这个类提供一些静态方法可以更容易地读取Http实体的内容和信息。和以java.io.InputStream流读取内容的方式相比,EntityUtils提供的方法可以以字符串或者字节数组的形式读取Http实体。但是,强烈不推荐使用EntityUtils这个类,除非目标服务器发出的响应是可信任
的,并且http响应实体的长度不会过大
。
有些情况下,我们希望可以重复读取
Http实体的内容。这就需要把Http实体内容缓存在内存或者磁盘上。最简单的方法就是把Http Entity转化成BufferedHttpEntity
,这样就把原Http实体的内容缓冲到了内存中。后面我们就可以重复读取BufferedHttpEntity中的内容。
CloseableHttpResponse response = <...>
HttpEntity entity = response.getEntity();
if (entity != null) {
entity = new BufferedHttpEntity(entity);
}
文章评论