Java实现URL编码、Base64编码、MD5编码的方法【20210430】

发表于 2021-04-26 18:06:01
阅读 1190

介绍

介绍

今天开始福哥要给大家讲解关于字符编码的知识,所谓字符编码就是将一个字符串或者是一个二进制字节数组里面的每一个字符根据一定的规则替换成一个或者多个其他字符的过程。

字符编码的意义有很多种,有的是为了将一些不可见的字符以可见字符替代保证可见度;有的是为了以少数字符去描述更多的其他字符便于传递数据;还有的是为了将不定长的字符串转成定长的规则字符串来实现字符串加密的目的。

编码

编码,英文是Encode,意思是从一个原始的字符串根据编码规则转换成一段新的字符串的过程。

编码后的字符串里面的字符会更加统一,或者更加单一,甚至会变成固定长度。

解码

解码,英文是Decode,和编码正好相反,意思是从一段已经编码后的字符串还原成编码前的原始字符串的过程。

并不是所有的经过编码规则进行编码后的字符串都可以解码会原始字符串的,能够解码回来的编码方式称之为可逆编码方式,不能够解码回来的编码方式称之为不可逆编码方式

URL

URL编码规则是这样的,首先按顺序取出字符串当中的每一个字符,将字符转换为ASCII码的十六进制数值,然后在十六进制数值前面加上一个百分号“%”,最后把每一个字符编码后的组合拼接起来就完成了。而解码规则就是反过来,将编码后的字符串以百分号“%”拆分开,然后将每个十六进制数值转换回ASCII码,最后在拼接到一起就好了。

需要注意的GBK的字符串和UTF-8的字符串在进行URL编码后得到的字符串是不一样的,例如:GBK的“福哥”编码后是“%B8%A3%B8%E7”,而UTF-8的“福哥”编码后是“%E7%A6%8F%E5%93%A5”。

编码

Java使用URLEncoder类来完成URL编码的,使用也非常简单,传入原始字符串和字符串编码,返回编码后的字符串。

String dataOrg, dataEncoded;

dataOrg = "福哥说:Java的URL编码/解码非常好用";
dataEncoded = URLEncoder.encode(dataOrg, "UTF-8");

home/topic/2021/0501/08/2405d3a4adf3694c2565cfab727f60b5.jpg

解码

Java使用URLDecoder类来完成URL解码的,使用也很简单,传入编码后的字符串和原始字符串编码,返回原始字符串。

String dataOrg, dataEncoded;

dataEncoded = "%E7%A6%8F%E5%93%A5%E8%AF%B4%EF%BC%9AJava%E7%9A%84URL%E7%BC%96%E7%A0%81%2F%E8%A7%A3%E7%A0%81%E9%9D%9E%E5%B8%B8%E5%A5%BD%E7%94%A8";
dataOrg = URLDecoder.decode(dataEncoded, "UTF-8");

home/topic/2021/0501/08/4fd49dc31c15aca04aa2f8d32a5637ee.jpg

Base64

Base64编码就是基于64个可见字符将任何十进制字符或者二进制字节转换成这些字符的过程,64个字符包括大小写字母和十个数字以及“+”和“/”,通常情况下“=”用来放在最后补位使用。

Base64编码方式同样受GBK或者UTF-8的影响,GBK的“福哥”的Base64码是“uKO45w==”,而UTF-8的“福哥”的Base64码是“56aP5ZOl”。

编码

Java通过Base64.Encoder类来实现Base64的编码的,使用也非常简单,传入原始字符串的字节数组,返回编码后的字符串。

Base64.Encoder encoder;
String dataOrg, dataEncoded;

encoder = Base64.getEncoder();
dataOrg = "福哥说:Java的Base64编码/解码非常好用";
dataEncoded = encoder.encodeToString(dataOrg.getBytes());

home/topic/2021/0501/08/276961cbb7128214ba909c0b495276ab.jpg

解码

Java通过Base64.Decoder类来实现Base64的解码的,使用也很简单,传入编码后的字符串,返回原始字节数组,再通过String类转换成字符串。

为什么不直接转换成字符串?因为原始数据有可能是二进制的字节数组。

为什么不直接弄要个decodeToString方法?福哥也想知道。。。

Base64.Decoder decoder;
String dataOrg, dataEncoded;

decoder = Base64.getDecoder();
dataEncoded = "56aP5ZOl6K+077yaSmF2YeeahEJhc2U2NOe8lueggS/op6PnoIHpnZ7luLjlpb3nlKg=";
dataOrg = new String(decoder.decode(dataEncoded.getBytes()));

home/topic/2021/0501/08/bcbbe668022385f070e8d26b30704e39.jpg

MD5

MD5是一种不可逆的编码,它采用摘要信息拼凑的方式可以将任意长度的十进制字符串或者二进制字节转换成固定32位长度的只包含小写字母的字符串。

通常情况下,MD5编码用来实现大数据的比较使用,MD5编码方式同样受GBK或者UTF-8的影响,GBK的“福哥”的MD5码是“d5c74952687fa8c993147a6f7b7ff12a”,而UTF-8的“福哥”的MD5码是“acc08377677515492df02556cf415f63”。

编码

Java通过DigestUtils类来实现MD5编码,使用也非常简单,传入原始字符串,返回编码后的字符串。

String dataOrg, dataEncoded;

dataOrg = "福哥说:Java的MD5编码非常好用";
dataEncoded = DigestUtils.md5DigestAsHex(dataOrg.getBytes());

home/topic/2021/0501/08/54b1fff7fd78d41554edea0fc02b2078.jpg

总结

今天福哥带着童鞋们了解了关于URL编码、Base64编码和MD5编码的知识,学会了在Java语言当中使用这三种编码方式的技巧,一般情况下,学会这三种编码方式就足以应付绝大多数的场景下的数据编码的需要了。

下一课福哥将介绍在JavaScript语言里面实现这三种编码方式的技巧,敬请期待~