首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

mysql 字符集中文

基础概念

MySQL字符集是用于定义数据库、表、列中存储和表示数据的编码方式。中文字符集主要用于支持中文字符的存储和显示。常见的中文字符集包括GBK、GB2312、UTF-8等。

相关优势

  1. 支持中文显示:中文字符集能够正确存储和显示中文字符,避免乱码问题。
  2. 兼容性:UTF-8等字符集具有较好的兼容性,能够支持多种语言字符。
  3. 存储效率:不同的字符集有不同的存储效率,UTF-8虽然占用空间较大,但支持所有Unicode字符。

类型

  1. GBK:是一种常用于简体中文的字符集,兼容GB2312,能够表示约21000个汉字。
  2. GB2312:是早期的简体中文字符集,包含约6763个常用汉字。
  3. UTF-8:是一种Unicode Transformation Format-8的字符集,能够表示所有Unicode字符,包括中文。

应用场景

  • 中文网站:需要存储和显示中文内容的网站,如新闻网站、论坛、博客等。
  • 企业系统:企业内部管理系统,如ERP、CRM等,需要支持中文输入和显示。
  • 移动应用:移动应用中的中文输入法、聊天应用等。

常见问题及解决方法

问题1:MySQL中文乱码

原因:通常是由于字符集设置不一致导致的,如数据库、表、列的字符集不一致,或者客户端连接时使用的字符集与服务器不一致。

解决方法

  1. 确保数据库、表、列的字符集一致,推荐使用UTF-8。
  2. 确保数据库、表、列的字符集一致,推荐使用UTF-8。
  3. 确保客户端连接时使用的字符集与服务器一致。
  4. 确保客户端连接时使用的字符集与服务器一致。

问题2:存储效率问题

原因:UTF-8字符集虽然支持所有Unicode字符,但每个字符占用3-4个字节,相比GBK等字符集占用空间较大。

解决方法

  1. 根据实际需求选择合适的字符集。如果主要存储中文,GBK可能更合适;如果需要支持多种语言,UTF-8更优。
  2. 使用压缩技术减少存储空间。

参考链接

通过以上信息,您可以更好地理解MySQL字符集中文的相关概念、优势、类型、应用场景以及常见问题及解决方法。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

mysql字符集配置&mysql中文乱码

毫无疑问,这定然是mysql字符集的配置问题。找到了解决问题的方向,那么,自然就很好办了。...解决问题 我的问题是出现在ubntu上的,如果你是windows用户,那么直接去安装mysql的根目录找配置文件就好了,修改方式和ubuntu上的是一样的。我接下来就会说明。...首先,进入到ubuntu的安装目录 cd /etc/mysql/ 如果你安装的是5.7的版本,我的就是5.7的,那么继续使用cd命令进入这个文件夹 cd mysql.conf.d 进去之后就会发现,这个其实是...mysql的各种配置文件所在的文件夹,现在你可以在百度上搜索到的mysql字符集解决办法好像都有点落后了,因为配置文件在无声无息的发生了位置改变。...结语 以上就是mysql的乱码配置过程,也可以是字符集配置过程,utf8这种编码格式是适用于所有的字符的,所以一般我们配置都是用的这种编码。

3.6K20

MySQL字符集中文乱码剖析

不同编码,字符集合不完全一样,存在某字符集的字符无法映射到另外一个字符集。 比如gbk编码中的中文字符,转成latin-1编码时,就找不到对应的二进制编码。...MySQL字符集转换的时候,gbk中文字符->latin-1,很多就转成'?'号(0x3f),这种大集合转成小集合,基本是不可逆的。...MySQL执行过程 对一个 MySQL 的执行过程,字符集转换,一般涉及到一下三个步骤: 收到请求,将请求数据从 character_set_client ->character_set_connection...Character_set_client告诉MySQL Server,传入的是一个 gbk 编码的,'中'这个输入,当作了0xD6 D0传入。...其实很简单,表创建的字符集和set names都设置成同一个字符集,就基本可以满足输入数据不会在转换过程中失真,也就是说输入是什么,输出就是什么。建议有中文的都设置成utf8字符集,一劳永逸。

4.1K00
  • MySQL字符集

    MySQL字符集 字符集介绍 gbk/gb2312 gbk/gb2312 采用双字节字符集,不论中、英文字符均使用双字符来表示,为了区分中文,将其最高位都设定成1 gb2312是gbk的子集,gbk...是gb18030的子集,gb2312仅能存储简体中文字符 gbk包括中日韩字符的大字符集 通常使用gbk字符集足够 国际通用性比utf8差,不过utf8占用的数据库比gbk大(utf8是三字节字符集)...存储空间:char(N)类型的存储空间和字符集有关系,结合刚才字符集的知识点,一个中文在utf8字符集中占用3个bytes、gbk占用2个bytes、数字和字符统一用一个字符表示。...存储空间:varchar(N)类型的存储空间和字符集有关系,结合刚才字符集的知识点,一个中文在utf8字符集中占用3个bytes、gbk统一占用2个bytes、数字和字符一个字符表示。...(长度小于255字节,使用一个字节来表示长度;大于255字节使用两个字节来表示长度) 修改数据库实例字符集 临时生效 mysql> set character_set = 'gbk'; mysql> set

    3.6K10

    Mysql字符集-Mysql进阶(一)

    上面提到的mysql连接,缓存,解析,优化都数据mysql service,他们都会调用各式各样的api来访问最后说的存储引擎。...2、字符集转成二进制叫编码,二进制转成字符集叫解码。...(所以在排序的时候,如果排序没有区分大小写或者有异常,可以看看他的比较级是什么) Mysql字符集的比较规则和字符集分为四个模块:服务器级别、数据库级别、表级别、列级别。...这上面有一个共同的特点,当修改了字符集,则自动变成当前字符集对应的比较级,如果修改了比较级,则自动变成对应的字符集。...Mysql字符集的转换 如果存入的是utf-8的编码,然后解析的是gbk的,这时候就会解码失败,于是我们看到的就是一堆乱码。

    2.4K20

    MySQL字符集详解

    一、MySQL字符集编码简单介绍   在使用MySQL时要注意6个需要编码的地方:系统的编码、客户端、服务端、库、表、列。...字符集编码不仅影响数据存储,还影响client程序和数据库之间的交互.在mysql中输入命令show session variables like '%char%'能够看到例如以下一些字符集(下面是以win10...character_set_filesystem为binary,因此'\xe6\x96\x87\xe4\xbb\xb61'不会转换,这样终于还是'\xe6\x96\x87\xe4\xbb\xb61',这样在zh_CN.UTF8的系统中文件名称不会乱码...二、MySQL字符集编码层次   第一部分主要是归纳了MySQL文档中关于字符集编码的说明。这部分主要说明下MySQL字符集编码层次:服务端-->数据库-->表-->字段。   ...三、MySQL连接字符集   前面谈到的编码内容基本都不会产生乱码问题,mysql中容易产生乱码的地方在character_set_client, character_set_connection, character_set_results

    3.4K10

    mysql字符集小结

    UTF8字符集: Unicode字符集的一种, 支持了所有国家的文字字符, utf8采用1-4个字节表示字符. GBK字符集: 支持中文, 字符有一字节编码和两字节编码方式. 一....MySQL字符集 1.1 字符集 只要涉及到文字的地方, 就会存在字符集和编码方式....MySQL服务端接到插入或更新SQL后, 发现有字符, 会查看客户端字符集(character_set_client), 当MySQL发现客户端字符集与自己的connection不一样时, 会将client...的字符集转换为connection的字符集, MySQL将编码转换后的数据存储到MySQL表的列上, 在存储时, 会再判断编码是否与列字符集上的编码是否一致, 如果不一致需要再次转换....字符集做下小结, 说明字符集MySQL 中都有哪些应用方式, 以及他们之间的关系又是什么样的.

    3K20

    MySQL字符集学习

    ISO 8859-1 字符集合:有256个字符,在ASCII字符集基础上扩展了128个西欧常用字符(包括德法字符)。...如果字符集包含在ASCII字符集中,则采用一个字节编码,否则采用两个字没编码。 GBK字符集:对GB2312字符集进行了扩充。编码方式兼容GB2312....UTF-8字符集:收录了当今世界各个国家地区使用的字符,并且还在扩充。它兼容ASCII字符集。采用变长编码方式,编码一个字符时需要使用1到4字节。 mysql 不区分字符集和编码方案的概念。...mysql utf8mb3: "阉割"过的utf-8字符集,只使用1-3个字节表示字符。 mysql utf8mb4: 正宗的utf-8字符集,使用1-4个字节表示字符。...字符集与比较规则有四个级别:服务器级别/数据库级别/表级别/列级别 mysql> SHOW variables like "%character_set_server%"; +-------------

    2.9K20

    理解MySql字符集

    # 理解MySql字符集 # 字符集 字符集即为字符编码的集合。...# MySql中的字符集 MySql是一款关系型数据库,它存储的数据不应该受限于特定的语言文字,所以它支持不同字符集。...所以MySQL中我们可以按照这种虚拟关系对:database,table,column分别设置字符集,而它们使用字符集的优先关系为:column > table > database。...# 设置修改MySql中的字符集 MySql默认字符集 在安装MySql的时候我们可以通过源码编译的方式设置字符集,当然这种安装方式比较难就不做说明了,真实的环境中这么做的好处并不明显。...修改MySql默认字符集 通过配置文件修改默认字符集,如果在创建database的时候我们没有指定字符集,则该设置会默认应用于database上。

    2K20

    MySQL字符集乱码总结

    但自从4.1以来MySQL加入了多字符集的支持,很多MySQL使用者发现中文居然不能使用了,显示变成了一堆乱码!...出现这个问题的原因是:MySQL在查询字符串时是大小写不敏感的,在编绎MySQL时一般以ISO-8859字符集作为默认的字符集,因此在比较过程中中文编码字符大小写转换造成了这种现象。...现在mysql上遇到一个问题,我们的字符集是gb2312.在中文模糊查找时,会有不相关的结果集. 从问题的根本原因分析,还有下面的问题。...出现这个问题的原因是:MySQL在查询字符串时是大小写不敏感的,在编绎MySQL时一般以ISO-8859字符集作为默认的字符集,因此在比较过程中中文编码字符大小写转换造成了这种现象。.../my.cnf 1)去掉注释,修改为: max_connections = 200 2) 重启MySQL生效 参考推荐: mysql查询中文问题解决方法 第10章:字符集支持(MySQL官方,推荐)

    9.2K20

    实战分析: MySQL字符集

    实战分析: MySQL字符集说明 在本文中讨论以下几个问题: 1. GBK和UTF8占用几个字节 2. ASCII码在不同字符集中占用几个字节 3....MySQL中UTF8MB4在存储空间中是不是都是占用4个字节? 字符集问题比较枯燥,知数堂MySQL DBA实战班中,经常遇到一些很利害的同学也对字符集一知半解,想着应该有很多同学也存在这个问题。...从上面两个例子来看, 字符集这个大老虎,我们可以借助于16进制进行观查。 Q3 MySQL中UTF8MB4在存储空间中是不是都是占用4个字节?...MySQL中UTF8MB4在存储空间中是不是都是占用4个字节?...答: 在UTF8MB4中并不是所有的字符都占用4个字节, 例如: ASCII码还是占用1个字节, 一般的中文汉字还是占用3个字节,目前知道的emoji表情是占用4个字节。

    1.6K10

    CMD进入mysqlmysql字符集设置

    1.开始-运行-cmd-回车 或者windows+r, 进入电脑或者服务器的cmd, 2.执行net start mysql,启动mysql服务(net stop mysql为停止服务), 3.1找到自己...mysql安装目录的bin目录(我的是C:\Program Files (x86)\MySQL\MySQL Server 5.1\bin), 操作顺序如下图 3.2在路径栏输入cmd , 3.3...回车, 3.4在出现的dos窗口输入mysql -u root -p,回车输入密码,进入mysql, 二、字符集 在dos窗口运行mysql> SHOW VARIABLES LIKE ‘character_set..._%’;查看当前mysql的各种字符集,出现下图 默认就是瑞典latin1,一下是换成我们自己的编码,如utf8: 外部访问数据乱码的问题就出在这个connection连接层上,解决方法是在发送查询前执行一下下面这句...创建数据库 mysql> create database name character set utf8; 3.

    3.8K20

    MySQL5.7 字符集设置

    MySQL5.7 字符集设置 character-set-client-handshake = FALSE character-set-server = utf8mb4 collation-server...= utf8mb4_unicode_ci init_connect=’SET NAMES utf8mb4’ character-set-client-handshake 用来控制客户端声明使用字符集和服务端声明使用的字符集在不一致的情况下的兼容性...= true # 设置为 True, 即使客户端字符集和服务端字符集不同, 也允许客户端连接 character-set-server 声明服务端的字符编码, 推荐使用utf8mb4 , 该字符虽然占用空间会比较大..., 但是可以兼容 emoji 表情的存储 character-set-server = utf8mb4 collation-server 声明服务端的字符集, 字符编码和字符集一一对应, 既然使用了utf8mb4...如果 init_connect 的内容有语法错误, 导致执行失败, 会导致用户无法执行查询, 从mysql 退出 使用 init_connect 执行 SET NAMES utf8mb4 意为: 声明自己

    3.3K20
    领券