在区码和位码的基础上,分别加上0XA0的偏移,便是GB2312编码; 我们制作ASCII字库时,一般只做可以显示出来的字符字模,前面命令型的ASCII字符,我们不做字模,即从“空格开始”,ASCII...该空格的区位码是“0101”,所以任意一个汉字的偏移地址公式是,Address= ( (CodeH-0x30-1)*94+(CodeL-0x30-1) )*( 16*16 )/8;CodeH是GB2312...的第一个字节,CodeL是GB2312的第二个字节,减一 是因为区位码是从第一区开始的,而字模数组表是从0开始的; (以上的计算均是按16*16取模时计算的) 当我使用单片机编程工具写程序时,编译的时候...,编译器会根据我们的选择(如MDK)会自动将字符串转换成机内码即GB2312形式进行存储,所以我们可以根据GB2312与区位码的关系进行寻找地址偏移。...uint16 hz ) 可以这样找区位码,CodeH=hz>>8; CodeL=hz&0x00ff; 注意英文和汉字的参数定义类型一个是8位uchar 型的,一个是u16位int16型的,因为GB2312
介绍 URL 编码URL 编码也被称为百分号编码。...URL 编码的规则:简单来说,如果需要对一个字符进行 URL 编码,首先需要判断该字符是否是 ASCII 字符:如果一个字符是 ASCII 字符,那么对该字符进行 URL 编码,首先需要把该字符的 ASCII...如果参数值中包含了 & 字符,那么会对 URL 解析造成影响,因此需要对造成歧义的 & 符号进行编码)URL 编码的规则URL 编码需要遵循 RFC 3986 标准。...URL 编码: “未保留字符” 不需要进行 URL 编码。...---对 “百分号 %” 进行 URL 编码:由于 “百分号 %” 用于 URL 编码,因此用于 URL 内部的 “百分号 %” 应该被编码。 “百分号 %” 的 URL 编码结果为 "%25"。
──高尔基 // URL编码 String encode = URLEncoder.encode("你好,世界", Encoder.UTF_8); System.out.println(encode...); // URL解码 String decode = URLDecoder.decode(encode, Encoder.UTF_8); System.out.println(decode); 运行结果
html url编码、url解码 url编码:encodeURI(),encodeURIComponent() url解码:decodeURI(),decodeURIComponent() encodeURI...()编码的解码函数为 decodeURI() encodeURIComponent()编码的解码函数为 decodeURIComponent(), 使用方法:直接在浏览器界面,按F12,点击console...,如图:便可以直接编码,解码。
我们知道,"春"和"节"的GB2312编码(我的操作系统"Windows XP"中文版的默认编码)分别是"B4 BA"和"BD DA"。...也就是说,同样采用GB2312编码,但是在每个字节前加上了%。 所以,结论2就是,查询字符串的编码,用的是操作系统的默认编码。...-8编码;如果是GB2312,URL就以GB2312编码。...举例来说,百度是GB2312编码,Google是UTF-8编码。因此,从它们的搜索框中搜索同一个词"春节",生成的查询字符串是不一样的。...也就是说,在Ajax调用中,IE总是采用GB2312编码(操作系统的默认编码),而Firefox总是采用utf-8编码。这就是我们的结论4。
假如不经过编码,这个GET请求中的URL就是”http://del.icio.us/flimsy?url=http://www.qingbo.org/?...注意不是对整个URL(指del.icio.us的GET请求中的长URL)做,如果flimsy后面的问号被编码,服务器便不知道它后面是query部分了。...URL编码要求先将URL转换为一个UTF-8的字节序列,然后再做percent encoding, 这在RFC 3986和W3C的网站上都有介绍。...在为Firefox做插件时,主要用Javascript实现程序逻辑,而Javascript中的字符串是UTF-8编码,且有一个方便的encodeURIComponent函数可以做URL编码。...有时间的时候我会再写一篇关于怎么在Windows中把中文转换为UTF-8字节序列的文章,对进行中文URL编码的朋友也许会有帮助。见“GBK(GB2312)向UTF-8的编码转换”一文。
%3F % %25 # %23 & %26 2.1 JS的三种编码函数 上面说了编码方式的混乱,那么如何统一呢?...**使用Javascript先对URL编码,或者将可以在后台编码的参数编码后再发送给前端使用。...然后再向服务器提交,不要给浏览器插手的机会,这样就能保证客户端只用一种编码方法向服务器发出请求 ** escape js中编码出生最早的一个,不提倡使用,真正作用是: 返回一个字符的Unicode...函数(推荐使用) 这个函数才是javascript中真正用来对URL编码的函数 它着眼于对整个URL进行编码,因此除了常见的符号以外,对其他一些在网址中有特殊含义的符号"; / ?...encodeURIComponent函数(推荐使用) 与encodeURI()的区别是,它用于对URL的组成部分进行个别编码,而不用于对整个URL进行编码。 因此,"; / ?
原创仅供学习,转载请注明出处 需求背景 有时候通过浏览器传递过来的数据,经过url编码之后,就无法直接处理了。 需要进行反编码之后才能获取正确的结果。 下面使用ipython演示一下。...url编码以及反编码演示 In [50]: import urllib.parse ## 首先模仿浏览器生产的编码格式,不管是中文或者空格都会转码 In [51]: urllib.parse.quote...('终极肥仔白') Out[51]: '%E7%BB%88%E6%9E%81%E8%82%A5%E4%BB%94%E7%99%BD' ## 使用 unquote 进行反编码,这个步骤基本都是服务端接受浏览器传递的数据时候处理
我们常常听到如下编码: UTF-8、GBK、GB2312 和 Unicode。这些编码方式之间有何不同呢?下面我们来详细了解一下。...它与 ASCII 编码完全兼容,即在 UTF-8 编码中,英文字符仍然使用一个字节来表示,与 ASCII 编码相同。...但是,GBK 编码的范围比较有限,对于一些生僻字或者少数民族字符就无法表示。 3.GB2312 GB2312 是中国国家标准的另一种编码方式,它是 GBK 的前身。...它也是一种双字节编码,主要用于表示简体中文。 相比 GBK 编码,GB2312 编码的范围更小一些,但它能够支持的字符数量也相对较少。...同时,GB2312 编码的兼容性不如 GBK 和 UTF-8,因此在现代的应用中使用的较少。 通过上面的介绍,可以了解到utf-8, gbk, gb2312的区别。
unicode、utf-8、ansi、gbk、gb2312编码详解 前言 作为一个开发人员或是测试人员,免不了要与各种各样的编码打交道,而且这些各种编码总是让人头大,现在我们就来揭开他们的庐山真面目 移动还是联通...中国人民看到这样很不错,于是就把这种汉字方案叫做 "GB2312"。GB2312 是对 ASCII 的中文扩 展。 但是,你以为这样就够用了吗?...当然不行,gb2312能够表示很多简体汉字,但是繁体怎么办呢?台湾群众很不满啊,于是也自己搞了一套编码,于是big-5诞生了,你以为这样就完了?...gb2312仅仅可以表示6000多个常用汉字你让其它不常用的怎么办?...于是扩展呗,把之前gb2312中没有利用的位好好利用起来,就成了gbk,这又增加了20000多个汉字,但是咱们少数名族也要用电脑啊,于是有了后来的 GB18030 GB2312和GBK都是用两个字节来编码的
我们知道,“春”和“节”的GB2312编码(我的操作系统“Windows XP”中文版的默认编码)分别是“B4 BA”和“BD DA”。...也就是说,同样采用GB2312编码,但是在每个字节前加上了%。 所以,结论2就是,查询字符串的编码,用的是操作系统的默认编码。...-8编码;如果是GB2312,URL就以GB2312编码。...举例来说,百度是GB2312编码,Google是UTF-8编码。因此,从它们的搜索框中搜索同一个词“春节”,生成的查询字符串是不一样的。...也就是说,在Ajax调用中,IE总是采用GB2312编码(操作系统的默认编码),而Firefox总是采用utf-8编码。这就是我们的结论4。
id=255&m=hello#top' 利用上述方法,即可解析得到 URL 的任意部分。 URL 编码 为什么要进行URL编码?通常如果一样东西需要编码,说明这样东西并不适合直接进行传输。...escape只是对字符串进行编码(而其余两种是对URL进行编码),与URL编码无关。编码之后的效果是以 %XX 或者 %uXXXX 这种形式呈现的。...它着眼于对整个URL进行编码。...它的作用是对 URL 中的参数进行编码,记住是对参数,而不是对整个 URL 进行编码。 因为它仅仅不对 ASCII字母、数字 ~ ! * ( ) ' 进行编码。...() 便能够很好的处理 URL 的编码问题。
本文中先介绍一下ASCII,GB2312,GBK和GB18030编码。 之所以把这几个放在一起介绍,是因为他们的相关性非常强。...例如GB2312编码的文件中可以出现ASCII字符,GBK编码的文件中可以出现GB2312和ASCII字符,GB18030编码的文件可以出现GBK、GB2312、ASCII字符。...每种编码方式的特点: 【1】ASCII 每个字符占据1bytes,用二进制表示的话最高位必须为0(扩展的ASCII不在考虑范围内),因此ASCII只能表示128个字 【2】GB2312 最早一版的中文编码...于是GBK中在保证不和GB2312、ASCII冲突(即兼容GB2312和ASCII)的前提下,也用每个字占据2bytes的方式又编码了许多汉字。...实际生活中,我们用到的99%以上的汉字,其实都在GB2312那一块区域内。至于GB2312每个编码对应的到底是哪个汉字本文不再赘述,可以参考链接(链接地址)查询。
6.URL 编码 6.1 为什么需要对 URL 编码 URL 是一个字符序列,由数字、字母和特殊字符组成。...对 URL 进行编码主要原因有如下几点: ASCII 无法表示的字符 URL 只使用 ASCII 编码字符集中的可打印字符来编写,因此不可打印字符以及 ASCII 之外的字符如果出现在 URL 中,...wd=春节 因为上面的 URL 参数部分存在 ASCII 无法表示的汉字"春节",因此需要对上面 URL 参数部分进行编码,编码后的 URL 是: https://www.baidu.com/s?...URL 的参数进行了编码,如果 URL 中的路径部分存在特殊字符,比如 / 或者 ?...---- 参考文献 [1] rfc1738 [2] rfc3986 [3] URL 编码解码在线工具 [4] 查看字符编码(UTF-8) [5] 关于url编码标准的说明
在理清字符集和字符编码关系一文中我们介绍了常见字符集以及字符编码之间的关系,本期我们继续朝着这个方向介绍常见的编码算法。...URL编码 URL编码是浏览器发送数据给服务器时使用的编码,它是编码算法,而不是加密算法,URL编码的目的是把任意文本数据编码为以%前缀表示的文本,编码后的文本仅包含A~Z,a~z,0~9以及-_....为了帮助大家理解,举一个更加具体的例子,一条完整的URL是"http://www.mukedada.com/login?username=admin&password=123456?...remark=管理员",它的URL编码是http%3A%2F%2Fwww.mukedada.com%2Flogin%3Fusername%3Dadmin%26password%3D123456%3Fremark...由于将原先的3个字节变成4个字节,也就是说长度增加了33%,因此,传输效率降低了,目前我们通过将Base64应用于传输少量二进制数据的常见中,例如Cookie、URL等。
的一些处理必不可少,如拼接、中文编码和空格编码等问题,从网上找了下比较琐碎,所以自己简单封装了一个,主要处理了下url拼接和中文编码的问题。...运行环境:python3 、pycharm编辑器 代码如下: 1 # -*- coding: utf-8 -*- 2 # au: cpy 3 # 20181016 4 # url拼接和编码问题...): # domain:域名 19 if type(url) is not str and hasattr(url, "decode"): 20 url = url.decode...() 21 if not url.startswith("http"): 22 url = urljoin(domain, url) 23 url = check_zh(...ps: 代码在pycharm编辑器中正常运行,其它方式运行可能会提示存在编码问题
总结:在HTML4.0.1中,基于RFC-1738标准,‘ ’在URL编码以后为 ‘+’,只有JS中由于基于RFC-2396标准,‘ ’在URL编码以后为‘%20’。...由于之前做过比较久web前端,映像中URL编码规则应该是将空格转为%20。上网看了下,又貌似都是对的,决定试一试。...最后用JS试一下: ? 好吧,原来是JS坑了我,罪魁祸首是JS,这到底是为什么呢?...而JS使用的将‘ ’ 转义为%20的编码标准为RFC-2396标准。...总结: ###在HTML4.0.1中,基于RFC-1738标准,‘ ’在URL编码以后为 ‘+’,只有JS中由于基于RFC-2396标准,‘ ’在URL编码以后为‘%20’。
public static String toUtf8String(String s) { StringBuffer sb = new Stri...
但是添加到list里面是中文的情况(比如‘丽江’),url的地址编码却是'%E4%B8%BD%E6%B1%9F',因此需 要做一个转换。这里我们就用到了模块urllib。...BD%E6%B1%9F') '\xe4\xb8\xbd\xe6\xb1\x9f' >>> print urllib.unquote('%E4%B8%BD%E6%B1%9F') 丽江 细心的同学会发现贴吧url...中出现的是%C0%F6%BD%AD,而非'%E4%B8%BD%E6%B1%9F',其实是编码问题。
简介 虽然知道什么是 URL编码 ,之前也学习过 SSRF漏洞 ,但是对 SSRF漏洞 中要进行一次URL编码或者两次URL编码甚是疑惑。 相信很多如我一般初学的小伙伴也有此疑惑。...详解 URL编码 首先认认真真的了解URL编码。 URL编码是一种将URL中的特殊字符转换为可安全传输和处理的字符序列的过程。...什么内容url编码 空格:空格在URL中会被编码为"%20"或加号"+",以避免与URL中的参数和路径混淆。 非字母数字字符:除了字母和数字之外的字符,如符号、标点符号等都需要进行URL编码。...例如,#会被编码为%23,&会被编码为%26。 保留字符:某些字符在URL中有特殊含义,被称为保留字符。为了在URL中表示保留字符本身,它们需要被编码。例如,/会被编码为%2F,?会被编码为%3F。...例如,汉字中国会被编码为%E4%B8%AD%E5%9B%BD(UTF-8编码)。 url编码格式 url编码由%+字符十六进制编码构成。
领取专属 10元无门槛券
手把手带您无忧上云