前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >get请求中url传参中文乱码问题–集锦「建议收藏」

get请求中url传参中文乱码问题–集锦「建议收藏」

作者头像
全栈程序员站长
发布于 2022-07-19 06:30:56
发布于 2022-07-19 06:30:56
7.1K0
举报

大家好,又见面了,我是全栈君。

=================================================

在项目中经常会遇到中文传参数,在后台接收到乱码问题。那么在遇到这种情况下我们应该怎么进行处理让我们传到后台接收到的参数不是乱码是我们想要接收的到的,下面就是我的一些认识和理解。

一:get请求url中带有中文参数,有三种方式进行处理防止中文乱码

1、如果使用tomcat作为服务器,那么修改tomcat配置文件conf/server.xml中,在 <Connector port=”8082″ protocol=”HTTP/1.1″ 中加入 URIEncoding=”utf-8″的编码集

2、前台需要对中文参数进行编码,调用js方法encodeURI(url),将url编码,然后请求。

后台接受时,需处理String str = new String(request.getParameter(“param”).getBytes(“iso8859-1″),”UTF-8”);

原因:tomcat不设置编码时,默认是iso8859-1,即tomcat默认会以iso8859-1编码接收get参数。 以上操作是将参数以iso8859-1编码转化为字节数组,然后再以UTF-8将字节数组转化为字符串。

另外需注意在框架的使用中:request.setCharacterEncoding(encoding);只对post请求有效。而且,spring的CharacterEncodingFilter也只是做了request(和response).setCharacterEncoding(encoding);的操作。所以spring的filter配置不作用于get参数接收。

3、解决get请求,后台接受中文参数乱码处理的方法(搜索功能带参数)

(1)前台获取数据,在js中进行编码处理

encodeURI函数采用utf-8进行编码,而在服务器的进行解码时候,默认都不是以uft-8进行解码,所以就会出现乱码。

两次encodeURI,第一次编码得到的是UTF-8形式的URL,第二次编码得到的依然是UTF-8形式的URL,但是在效果上相当于首先进行了一 次UTF-8编码(此时已经全部转换为ASCII字符),再进行了一次iso-8859-1编码,因为对英文字符来说UTF-8编码和ISO- 8859-1编码的效果相同。

(2)后台解码处理

在后台接收参数时候,首先通过request.getParameter()自动进行第一次解码(可能是 gb2312,gbk,utf-8,iso-8859-1等字符集,对结果无影响)得到ascii字符,然后再使用UTF-8进行第二次解码,通常使用 java.net.URLDecoder(“”,”UTF-8″)方法。

两次编码两次解码的过程为:

UTF-8编码->UTF-8(iso-8859-1)编码->iso-8859-1解码->UTF-8解码,编码和解码的过程是对称的,所以不会出现乱码。

注:

1:这种两次encodeURI方式不用去知道服务器的解码方式,也可以得到正确的数据。

2:get请求建议尽量不带中文参数,如果使用建议使用两次encodeURI进行编码

3.参考资料 URL编码与两次encodeURI:http://blog.sina.com.cn/s/blog_8af112fd0102vxb7.html

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/121288.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022年2月2,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
python爬虫之url中的中文问题
在python的爬虫学习中,我们的url经常出现中文的问题, 我们想要访问的url就需要对url进行拼接,变成浏览器可以识别的url 在python中已经有了这样的模块了,这就是urlencode urlencode需要对中文和关键字组成一对字典,然后解析成我们的url
py3study
2020/01/07
3.6K0
解决ASP.NET中的各种乱码问题
总结分类: 一、页面显示乱码 1、如果web.config配置:<globalization fileEncoding="utf-8" /> 如果文件编码不是UTF-8,则会乱码,反之不然。 2、不设置fileEncoding,不会乱码 3、fileEncoding="gb2312",文件以utf-8编码,此时也不会有乱码现象。 建议最好让所有文件都以UTF-8编码保存,从而解决这类乱码问题。 二、Ajax提交的数据乱码问题 URL拼写参数的时候,如果遇到一些特殊字符。 <p><a id="link2"
小端
2018/04/16
2K0
【博客同步】js中三种URI编码方式比较
三种方法都不会对 ASCII 字母、数字和规定的特殊 ASCII 标点符号进行编码,其余都替换为十六进制转义序列 【escape & unescape】
CS逍遥剑仙
2025/02/28
710
中文参数乱码问题——js字符串编码
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/135446.html原文链接:https://javaforall.cn
全栈程序员站长
2022/09/05
4.7K0
js中三种URI编码方式比较
三种方法都不会对 ASCII 字母、数字和规定的特殊 ASCII 标点符号进行编码,其余都替换为十六进制转义序列 【escape & unescape】
csxiaoyao
2019/02/15
1.7K0
关于URL编码
一般来说,URL只能使用英文字母、阿拉伯数字和某些标点符号,不能使用其他文字和符号。比如,世界上有英文字母的网址"http://www.abc.com",但是没有希腊字母的网址"http://www.aβγ.com"(读作阿尔法-贝塔-伽玛.com)。这是因为网络标准RFC 1738做了硬性规定:
ruanyf
2018/09/21
1.8K0
关于URL编码
解决ASP.NET中的各种乱码问题
经常发现有人被乱码困扰着,而我感觉比较幸运,很少为此烦恼过。 在这篇博客中,我将把我想到的一些与乱码有关的经验总结出来,供大家参考。 页面显示乱码问题 在一个网站中,有些页面会正常显示,然而,有些
小端
2018/04/16
2.9K0
解决ASP.NET中的各种乱码问题
第二十九期:浏览器导航---URI 和 URL
术语中,统一资源标识符(Uniform Resource Identifier,URI)是一个用于标识某一互联网资源名称的字符串。该种标识允许用户对任何(包括本地和互联网)的资源通过特定的协议进行交互操作。URI由包括确定语法和相关协议的方案所定义。
terrence386
2022/07/15
7140
PHP字符串的编码问题
大家都知道,不同字符编码,其在内存占用的字节数不一样。如 ASCII编码字符占用1个字节,UTF-8编码的中文字符是3字节,GBK为2个字节。
黄规速
2022/04/14
2.5K0
Web开发须知:URL编码与解码
通常如果一样东西需要编码,说明这样东西并不适合传输。原因多种多样,如Size过大,包含隐私数据,对于Url来说,之所以要进行编码,是因为Url中有些字符会引起歧义。   例如,Url参数字符串中使用k
李海彬
2018/03/27
2.7K0
Web开发须知:URL编码与解码
深入浅出URL编码
一、问题:         编码问题是JAVA初学者在web开发过程中经常会遇到问题,网上也有大量相关的文章介绍,但其中很多文章并没有对URL中使用了中文等非ASCII的字符造成服务器后台程序解析出现乱码的问题作出准确的解释和说明。本文将详细介绍由于在URL中使用了中文等非ASCII的字符造成乱码的问题。
全栈程序员站长
2021/05/19
1K0
Nginx Lua集成Kafka
这里我们看到了redis和ngx集成软件包,说明我们可以之间使用nginx和redis而无需导入任何依赖包!!!!
星哥玩云
2022/07/27
1.7K0
Nginx Lua集成Kafka
在Java Web中设计的编解码
数据经过网络传输都是以字节为单位的,所以所有的数据都必须能够被序列化为字节。在Java中数据要被序列化,必须继承Serializable接口。
MickyInvQ
2020/09/27
1.3K0
在Java Web中设计的编解码
URI编码解码和base64
概述 对于uri的编解码,在js中有3对函数,分别是escape/unescape,encodeURI/decodeURI,encodeURIComponent/decodeURIComponent。 它们的适用范围不同,而且遵循的编码规范也不同。 对于上述函数而言,所有的ASCII的字符编码相同,采用%XX的形式。而对于unicode字符,escape编码形式为%uXXXX,而其余两个函数 则先将unicode字符按照utf-8对其进行编码,然后继续进行uri编码(百分号)。对于中文字符,每个字符用urf
欲休
2018/03/15
2.6K0
Python-数据传输-urllib库
在爬取网页时,通过 URL 传递数据给服务器,传递数据的方式主要分为 GET 和 POST 两种。这两种方式最大的区别在于:GET 方式是直接使用 URL 访问,在 URL 中包含了所有的参数;POST 方式则不会在 URL 中显示所有的参数。
小团子
2019/07/18
6260
Python-数据传输-urllib库
decodeURI与decodeURIComponent区别
Global对象的encodeURI()和encodeURIComponent()方法可以对URI进行编码,以便发送给浏览器。有效的URI中不能包含某些字符,例如空格。而这URI编码方法就可以对URI进行编码,它们用特殊的UTF-8编码替换所有无效的字 符,从而让浏览器能够接受和理解。
全栈程序员站长
2022/09/16
1.6K0
Javascript中的url编码与解码(详解)
摘要 本文主要针对URI编解码的相关问题做了介绍,对url编码中哪些字符需要编码、为什么需要编码做了详细的说明,并对比分析了Javascript中和编解码相关的几对函数escape / unescap
Angel_Kitty
2018/04/17
3.1K0
URL汉字编码
一、问题的由来 URL就是网址,只要上网,就一定会用到。 一般来说,URL只能使用英文字母、阿拉伯数字和某些标点符号,不能使用其他文 字和符号。比如,世界上有英文字母的网址 “http://www.abc.com”,但是没有希腊字母的网址“http://www.aβγ.com”(读作阿尔法-贝塔-伽玛.com)。这是 因为网络标准RFC 1738 做了硬性规定: "...Only alphanumerics [0-9a-zA-Z], the special characters "$-_.+!*'()
wangxl
2018/03/07
3.1K0
URL汉字编码
Python爬虫-04:贴吧爬虫以及GE
目录 1. URL的组成 2. 贴吧爬虫 2.1. 只爬贴吧第一页 2.2. 爬取所有贴吧的页面 3. GET和POST的区别 3.1. GET请求 3.2. POST请求 3.3. 有道翻译模拟
py3study
2020/01/19
1.3K0
简简单单对比encodeURI与encodeURIComponent
encodeURI和encodeURIComponent 是两个很相近的方法,用来encode URI。但是他们之间也存在着细微的差异,如果不能很好的理解这个差异,可能会导致一些不必要的麻烦。本文将尝试用最简单的形式展示这个差异。
技术小黑屋
2020/01/21
9300
相关推荐
python爬虫之url中的中文问题
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档