字符,字符集,字符编码 简书郭文圣 现在Unicode已然一统天下,我想很多年轻的程序员可能都没遇到过编码问题,更不用说了解编码的发展了。...字符集是字符组成的集合,通常以二维表的形式存在,二维表的内容和大小是由使用者的语言而定,是英语,是汉语,还是阿拉伯语。 字符编码是把字符集中的字符编码为特定的二进制数,以便在计算机中存储。...字符集和字符编码一般都是成对出现的,如ASCII、IOS-8859-1、GB2312、GBK,都是即表示了字符集又表示了对应的字符编码,以后统称为编码。...关于各种UTF的实现细节可以点击链接查看(FQ),已经说得很清楚了,就不赘述了,但不得不提一下,UTF-16的设计还挺巧妙的。...参考:关于常用的字符集和编码 (一个好看的故事)
因此如果你的PHP文件是采用带BOM标记的UTF-8进行编码的,那么有可能会出现问题。 6.8 Unicode编码和以前的字符集编码有什么区别? 早期字符编码、字符集和代码页等概念都是表达同一个意思。...例如GB2312字符集、GB2312编码,936代码页,实际上说的是同个东西。...但是对于Unicode则不同,Unicode字符集只是定义了字符的集合和唯一编号,Unicode编码,则是对UTF-8、UCS-2/UTF-16等具体编码方案的统称而已,并不是具体的编码方案。...7、总结 字符集定义了一组字符,编码定义了如何来表示字符集中的字符(是不是有点类似抽象类与实现类的关系呢?)。...比如 Unicode 是一个「字符集」,而 UTF-8 是一种「编码方式」,其他的编码方式还有 UTF-16 和 UTF-32.
文件主要分为二进制文件和文本文件这两种,看你想要查看哪种文件的编码,如果是文本文件的话,open 函数里的就要用 r,二进制文件用的是 rb,别搞错哦!...文本编码查看方法 我们所用的是 chardet 这个库。
查看字符集 一、查看MySQL数据库服务器和数据库MySQL字符集。...mysql> show variables like '%char%'; 二、查看MySQL数据表(table)的MySQL字符集。...mysql> show table status from sqlstudy_db like '%countries%'; 三、查看MySQL数据列(column)的MySQL字符集。...mysql> show full columns from countries; 修改字符集 [root@Centos7 bin]#vim /etc/my.cnf [mysqld] datadir=
请前往 Tiga on Tech 查看原文以及更多有趣的技术文章。最近用Python写了个简单的爬虫工具,用于爬取Google Play上的游戏类app的信息。...字符集和字符编码的概念字符集:一个系统所支持的所有字符的集合。...字符集 vs 字符编码:从上述对两者的描述中可以看出,我们这里讨论的字符集和字符编码是两个完全不同的概念。...常见字符集简介以下将按照出现时间从早到晚,简单介绍几个常见的字符集:(1) ASCII字符集 & 字符编码ASCII是最早的一种字符集及字符编码,计算机出现之初,使用的就是ASCII,也是现行最通用的单字节编码系统...(4) Unicode字符集及其字符编码像中文使用的GB2312、BIG5字符集和字符编码一样,很多其他非英文国家和地区,也创造了自己的一套字符集和字符编码。
编码EnCode:将字符转化为字节 解码DeCode:将字节转化为字符 乱码:打个比方—比较多人知道的联通 用字符集GBK的时候出现这样的情况:��ͨ,这就是乱码 常见的中文字符集有:GBK 和 UTF...-8 国际上常用的字符集:Unicode(大字典)、ANSI UTF-8,中文占三个字节,英文占一个字节(变长),还有定长占两个字节(耗费空间多) GBK,中文占两个zijie 下面模拟编码: 我的默认的编码字符集为...: import java.io.UnsupportedEncodingException; /** * 编码:将字符转化为字节 * @author Administrator * */ public...static void main(String[] args) throws UnsupportedEncodingException { String msg = "性命生命使命a"; //默认字符集编码...,这里默认为GBK byte[] datas = msg.getBytes(); System.out.println(datas.length); //使用不同字符集编码,如UTF-
在服务器的日常使用中,有时候会遇到某些端口被占用的情况发生,那么怎么查看端口被占用了呢? 下面简单介绍一下使用命令,可以参考端口被占用的情况。及时解决端口被占用的问题。...方法一: 1.先用ps -ef | grep xxx(某个进程),可以查看某个进程的pid。 2.再用netstat -anp | grep pid号,可以查看到该进程占用的端口号!...方法二: 直接用lsof命令可以查看端口使用情况! 常用命令: 1,lsof -i:端口号 2,netstat -tunlp|grep 端口号 这两个命令都可以查看端口被什么进程占用。
本文链接:https://blog.csdn.net/weixin_40313634/article/details/101630426 查看端口占用 $: netstat -anp | grep 8888
du命令 参考文章:how to check directory size in Linux 用于显示目录或文件的大小。...显示当前目录文件或者文件占用空间:du 显示指定文件或文件夹的大小:du test.txt 方便阅读的格式查看目录所占空间情况:du -h test 仅显示当前文件夹的总计:du -s * 以方便阅读的方式查看指定目录层级的空间占用情况...:du -lh --max-depth=1 du命令排序 查看目录大小的命令是du(当然也可以查看文件大小),例如:du ems_data,就是查看ems_data目录下各子目录的大小;du,就是查看当前目录下各子目录的大小...;du *,就是查看当前目录下各子目录和文件的大小。...为了提高查看效果,我们需要对结果进行排序,因为du的命令结果很乱,例如: 从大到小排列:du ems_data | sort -nr 按目录名排列:du ems_data | sort +1 -2 选出排在前面的
这里所谓的Linux版本信息,包括Linux内核版本信息和Linux系统版本信息。...下面分别介绍 >>> (笔者在Ubuntu12.04中进行操作并截图如下) 一、查看Linux内核版本信息 方法1:登陆Linux,在终端输入 cat /proc/version 方法2:登陆Linux...,在终端输入 uname -a 方法3:登陆Linux,在终端输入 uname -r 二、查看Linux系统版本信息 方法1:登陆Linux,在终端输入 cat /etc/issue 方法2:登陆...而我们使用命令 uname -a 的信息就是从该文件获取的,当然用 cat /proc/version 方法直接查看它的内容也可以达到同等效果。...另外,加上参数”-a”是获得详细信息,如果不加参数为查看系统名称。
msdos: dos文件系统类型 vfat:支持长文件名的dos分区文件系统,可以理解为winds文件系统类型 iso9660: 光盘格式文件系统 ext2/ext3/ext4: linux下主流的文件系统...xfs: linux下一种高性能的日志文件系统,在centos7.x中默认的文件系统 nfsd: 一种分布式文件系统 1....查看文件系统类型: #mount 查看分区挂载到某个文件系统及文件类型 2.
2常用字符集和字符编码 常见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集、GB18030字符集、Unicode字符集等。...ASCII编码:将ASCII字符集转换为计算机可以接受的数字系统的数的规则。...上述编码规则就是GB2312。GB2312或GB2312-80是中国国家标准简体中文字符集,全称《信息交换用汉字编码字符集·基本集》,又称GB0,由中国国家标准总局发布,1981年5月1日实施。...下图是GB2312编码的开始部分(由于其非常庞大,只列举开始部分,具体可查看GB2312简体中文编码表) 由于GB 2312-80只收录6763个汉字,有不少汉字,如部分在GB...为了更好的可靠性,可以使用正则表达式来统计非法过长和替代值(可以查看W3 FAQ: Multilingual Forms上的验证UTF-8字符串的正则表达式)。
UnicodeDecodeError: 'utf-8' codec can't decode bytes in position 0-1: invalid continuation byte 1、百度的时候,大家都建议在代码文件头加上字符集定义...可以用下面的方式查看: sys.getdefaultencoding() 可以用下面的方式修改: reload(sys) sys.setdefaultencoding('utf-8') sys.getdefaultencoding...() 所以,代码文件第一行加 字符集定义,解决Python解释器读取Python代码文件时的字符集识别问题 2、在print的时候出现异常,或者写文件,或者解析网络报文,或者做str对象处理的时候出现乱码...print之后,在pycharm的输出窗口,或者windows的CMD命令行窗口,或者Linux的shell窗口,需要适配终端的编码方式 3)、字符编码基本可分为三大类:起源于美国的ASCII,支持英文字符...、数字、标点符号、键盘上的特殊字符;国际编码unicode,支持ascII的字符集外,又支持中文,韩语,日语等。
常见的字符集包括ASCII字符集、GB2312字符集(简体字符集)、GBK字符集(简繁字符集)和通用字符集(UCS)和Unicode字符集。...ASCII字符集包含128个字符,它用8bit表示,其中,第一位用0表示。ASCII编码则是一种将ASCII字符集中的字符映射到二进制数的关系,譬如:A -> 65。...Unicode 为了整合全世界的所有语言文字,我们的先辈们想出了一个方法Unicode(Universal Mutiple-Octet Coded Character Set),它只是字符集,却没有规定这个二进制该如何存储...而UTF(Unicode Transformation Format)规定了字符如何传输和存储。UTF又分为UTF-8、UTF-16和UTF-32。我们重点介绍下UTF-8。...根据Huffman编码的思想(最常出现的字符编码尽量的短),以及不同符号使用不同的字节长度表示,因此UTF-8采用了1-4个字节表示一个符号,这种变长的编码方式。
文本文件都有编码格式,常见格式有UTF8、GBK、latin1等,因为编码不统一,所以在文件处理的时候经常会遇到编码导致的乱码问题 查看文件编码 file命令 $ file utf8_hello.txt...utf8_hello.txt: UTF-8 Unicode text 文件编码转换 命令用法 iconv -f src_encoding -t target_encoding inputfile -o...outputfile 示例 # 把utf8编码的文件utf8_hello.txt转换为gbk编码的gbk_hello.txt iconv -f utf-8 -t gbk utf8_hello.txt...-o gbk_hello.txt 按照指定编码打开文件 vim ## 使用gbk编码打开文件file.txt vim file.txt -c "e ++enc=gbk" Sublime File ->...Reopen with Encoding 参考 vim 读写 gbk 编码的文件 linux查看文件编码格式
在Windows平台下,进入DOS窗口,输入:chcp ,可以得到操作系统的代码页信息,你可以从控制面板的语言选项中查看代码页对应的详细的字符集信息。...例如:我的活动代码页为:936,所以它对应的编码格式为GBK。 ? 代码页是字符集编码的别名,也有人称"内码表"。早期,代码页是IBM称呼电脑BIOS本身支持的字符集编码的名称。...当时通用的操作系统都是命令行界面系统,这些操作系统直接使用BIOS供应的VGA功能来显示字符,操作系统的编码支持也就依靠BIOS的编码。现在这BIOS代码页被称为OEM代码页。...图形操作系统解决了此问题,图形操作系统使用自己字符呈现引擎可以支持很多不同的字符集编码。早期IBM和微软内部使用特别数字来标记这些编码,其实大多的这些编码已经有自己的名称了。...虽然图形操作系统可以支持很多编码,很多微软程序还使用这些数字来点名某编码。
为了避免字符出现问题,请将所有的字符集设置为使用 UTF-8 编码(或者根据你配置的数据库来制定正确的 UTF-8 编码字符集,例如在 Oracle 中使用的是 AL32UTF8 )。...配置 Confluence 字符集编码 在默认的情况下,Confluence 使用的是 UTF-8 字符集编码。...Confluence 中也有多个检查来确保你的数据库也是使用的 UTF-8 编码(或者对应的编码)。 当然,你也是可以对你的字符集进行修改的,我们并不推荐你这样做。...如何修改 Confluence 字符集编码(不推荐): 进入 ? ...> 基本配置(General Configuration) 然后选项 编辑(Edit)choose 在你选择的 编码(Encoding )文本输入框的边上输入新的字符集编码,然后单击 保存(Save)。
查看Linux版本 cat/etc/issue Linaro 12.07 \n \l 2....查看内核版本 1)cat/proc/version Linux version 2.6.38-13-generic(buildd@rothera) (gcc version 4.5.2 (Ubuntu/...Linaro 4.5.2-8ubuntu4)) #57-Ubuntu SMP Mon Mar 5 18:10:14 UTC 2012 Linux version 3.4.29+ (ubuntu@linux-server...ubuntu 2.6.38-13-generic#57-Ubuntu SMP Mon Mar 5 18:10:14 UTC 2012 i686 i686 i386GNU/Linux Linux ubuntu...print the kernelrelease 查看内核发行版本 -v, –kernel-version print the kernelversion 查看内核版本 -m, –machine print
今天iptables居然不能使用了,赶紧查看了一下Linux版本了。居然更新到了CentOS7。...这里分享下查看命令: cat /etc/redhat-release cat /etc/centos-release 或者 rpm -q redhat-release rpm -q centos-release...:systemctl is-enabled firewalld.service 查看已启动的服务列表:systemctl list-unit-files|grep enabled 查看启动失败的服务列表...:systemctl --failed 3.配置firewalld-cmd 查看版本: firewall-cmd --version 查看帮助: firewall-cmd --help 显示状态: firewall-cmd...--state 查看所有打开的端口: firewall-cmd --zone=public --list-ports 更新防火墙规则: firewall-cmd --reload 查看区域信息: firewall-cmd
领取专属 10元无门槛券
手把手带您无忧上云