JS中URL参数的编解码
HTML中的$("form").serialize()函数,在submit按钮点击时,将form表单中含有name的input整理成一个“name=aaa&pass=bbb”这样的字符串,使用get方法请求时会将此字符串添加到请求url后面作为参数后缀,如果请求内容中存在汉字(即form表单中需要传输的input中有汉字),汉字将转换为一种由“%”开头的编码,如下图:
下图是将$("form").serialize()返回的字符串通过split('&')分割之后的数组,上面为未解码的数组,下面为解码之后又split('=')分割的右值:(纯获取数值完全可以使用正则,这里只做演示)
从上面的数组可以看到,汉字在url中传输时会被编码,其实不仅汉字,某些特殊字符,如空格等在传输时也会被编码。编码方式主要有两种:
1.encodeURI编码
定义和用法:: encodeURI() 函数可把字符串作为 URI 进行编码。
语 法: encodeURI(URIstring)
参数 描述: URIstring 必需。一个字符串,含有 URI 或其他要编码的文本。
返 回 值: URIstring 的副本,其中的某些字符将被十六进制的转义序列进行替换。
说 明: 该方法不会对 ASCII 字母和数字进行编码,也不会对这些 ASCII 标点符号进行编码: - _ . ! ~ * ' ( ) 。
该编码方法的目的是对 URI 进行完整的编码,因此对以下在 URI 中具有特殊含义的 ASCII 标点符号,encodeURI() 函数是不会进行转义的:;/?:@&=+$,#
2.encodeURIComponent() 编码
定义和用法: encodeURIComponent() 函数可把字符串作为 URI 组件进行编码。
语 法: encodeURIComponent(URIstring)
参数 描述: URIstring 必需。一个字符串,含有 URI 组件或其他要编码的文本。
返 回 值: URIstring 的副本,其中的某些字符将被十六进制的转义序列进行替换。
说 明: 该方法不会对 ASCII 字母和数字进行编码,也不会对这些 ASCII 标点符号进行编码: - _ . ! ~ * ' ( ) 。
其他字符(比如 :;/?:@&=+$,# 这些用于分隔 URI 组件的标点符号),都是由一个或多个十六进制的转义序列替换 的。
提示:
注意 encodeURIComponent() 函数 与 encodeURI() 函数的区别之处,前者假定它的参数是 URI 的一部分(比如协议、主机名、路径或查询字符串)。因此 encodeURIComponent() 函数将转义用于分隔 URI 各个部分的标点符号。
例如当传递的参数为某个http地址时,需要使用encodeURIComponent()编码,如下:
<a href="http://passport.baidu.com/?logout&aid=7&url='+encodeURIComponent("http://cang.baidu.com/bruce42")+'">退出</a>');
还有这种例子:
解码方式:
encodeURI()编码的解码函数为 decodeURI()
encodeURIComponent()编码的解码函数为 decodeURIComponent(),
一定要注意的是,参数中正常的“+”依然被解码成原来的“+”,但是参数中的空格也会被解码成“+”,这就需要在解码前进行对空格的处理:decodeURIComponent(str.replace("/\+/g","%20")),这里str中原来正常的“+”经过编码之后会被转成“%2B”,正常的空格被转成“+”,而不是转成一个编码,所以解码的时候“%2B”自然被解码为“+”,但“+”却依然被解码为“+”,就出现了“+”编码解码后是“+”,空格编码再解码之后也是“+”的局面。
拓展:
encodeURI()编码 和 encodeURIComponent()编码方式是替代早期 escape() 的方法, 因为ECMAScript v3 反对使用escape()方法,
escape()方法也是对参数的编码方式,不会对 ASCII 字母和数字进行编码,也不会对下面这些 ASCII 标点符号进行编码: * @ - _ +
. / 。其他所有的字符都会被转义序列替换,其解码方式为unescape()。