MySQL collation方法

在以前用oracle的时候,很少关于它的collation方法,但是在mysql中,这点不加注意的话,却有可能会出现问题。

问题是这样的:
一张test的表,字符集采用的latin1。

select to_id from test where to_id=’cn象_王’;
+—————+
| to_id |
+—————+
| cn陶_陶 |
| cn象_王 |
+—————+
2 rows in set (0.00 sec)

取cn象_王的数据,居然把cn陶_陶的数据也取回来了。
这显然是不允许的。

查看它们的编码:

(root@im_offlog1a)[test]> select hex(‘cn陶_陶’);
+—————-+
| hex(‘cn陶_陶’) |
+—————-+
| 636ECCD55FCCD5 |
+—————-+
1 row in set (0.00 sec)

(root@im_offlog1a)[test]> select hex(‘cn象_王’);
+—————-+
| hex(‘cn象_王’) |
+—————-+
| 636ECFF35FCDF5 |
+—————-+
1 row in set (0.00 sec)

编码的确是不一样的,但是为什么mysql会认为这两条记录是一样的呢?

一开始我们就把问题定位于collation引起的问题。

show variables查看
| collation_connection | latin1_swedish_ci
| collation_database | latin1_swedish_ci
| collation_server | latin1_swedish_ci

手工把这些参数修改为latin1_bin,结果居然一样。这下感觉真是奇怪了。

这里先解释一下mysql collation的命名规则:
它们以其相关的字符集名开始,通常包括一个语言名,并且以_ci(大小写不敏感)、_cs(大小写敏感)或_bin(二元)结束

比如latin1字符集有以下几种校正规则:

校对规则 含义
latin1_german1_ci 德国DIN-1
latin1_swedish_ci 瑞典/芬兰
latin1_danish_ci 丹麦/挪威
latin1_german2_ci 德国 DIN-2
latin1_bin 符合latin1编码的二进制
latin1_general_ci 多种语言(西欧)
latin1_general_cs 多种语言(西欧ISO),大小写敏感
latin1_spanish_ci 现代西班牙

最后我们将表格重建,手工指定表格级别的collation为latin1_bin。
这个问题就得到了解决。

那么问题又来了,为什么我前面手工测试latin1_bin时不生效呢?

原来MySQL按照下面的方式选择表字符集和 校对规则:
如果指定了CHARACTER SET X和COLLATE Y,那么采用CHARACTER SET X和COLLATE Y。
如果指定了CHARACTER SET X而没有指定COLLATE Y,那么采用CHARACTER SET X和CHARACTER SET X的默认校对规则。
否则,采用服务器字符集和服务器校对规则。

而我们在建表的时候指定了character set,所以它永远是采用对应的默认的校对规则。

当然我们其实也没必要重建表格,只需要alter table db_allot CONVERT TO CHARACTER SET latin1 COLLATE latin1_bin这样转换即可。

另外建议collation都尽量采用字符集相应的bin类型的校对规则,这样不容易出错。

再说说我自己的体会

觉得 character set latin1 collate latin1_bin 就是老版的 VARCHAR BINARY 的改进,只是新版的先用 character set 定字符集,再用此字符集名字加 _bin 定校对规则为二进制的,从而确保中文查询正确。
再测试了一下,把此字段属性改为不带 BINARY 的
ALTER TABLE `comment_content_1_01` CHANGE `thread` `thread` VARCHAR( 50 ) DEFAULT NULL
然后再看表结构确实变成 `thread` varchar(50) default NULL, 即不带 character set latin1 collate latin1_bin 了,可见character set latin1 collate latin1_bin 就是老版的 VARCHAR BINARY 的改进。

此外还读到更方便的做法,不用逐个改字段属性,而只要表格级别的collation为latin1_bin就行了。
测试:
alter table comment_content_1_01 CONVERT TO CHARACTER SET latin1 COLLATE latin1_bin
后,

再导出表结构

CREATE TABLE comment_content_1_01 (
content_id int(11) NOT NULL auto_increment,
thread varchar(50) collate latin1_bin default NULL,
uname varchar(100) collate latin1_bin default NULL,
nick varchar(100) collate latin1_bin default NULL,
uid int(11) unsigned default NULL,
content text collate latin1_bin,
post_time datetime default NULL,
post_ip int(10) unsigned default NULL,
`status` enum(‘unaudit’,’normal’,’deleted’) collate latin1_bin NOT NULL default ‘unaudit’,
PRIMARY KEY (content_id)
) ENGINE=MyISAM DEFAULT CHARSET=latin1 COLLATE=latin1_bin;

即便原来没定各字段的 collate,现在也全都是 collate latin1_bin 了。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/455530.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月8日 01:14:08
下一篇 2025年11月8日 01:18:16

相关推荐

  • C语言网络编程中数据库连接的优化措施问答

    优化措施:使用连接池预创建数据库连接,避免连接/断开开销。优化查询语句,只查询必要字段,避免通配符或子查询。使用批处理将多个操作组合成一个请求,减少网络开销。尽量使用乐观的锁定机制,减少锁定粒度。考虑使用无服务器数据库,由供应商管理数据库,减少开销。 C语言网络编程中数据库连接的优化措施 在C语言网…

    2025年12月18日
    000
  • C++ 函数库在哪些场景下使用?

    c++++ 函数库预先定义了代码模块,可用于处理常见任务,广泛应用于:输入/输出操作字符串操作数学运算此外,还有特定领域的场景,如:图形处理网络编程数据库连接示例:使用 matplotlibcpp 函数库绘制折线图,实现了便捷的图形化展示。 C++ 函数库的应用场景 简介C++ 函数库提供了预定义的…

    2025年12月18日
    000
  • C++框架内置功能在跨平台开发中的作用

    在跨平台开发中,c++++ 框架的内置功能发挥着至关重要的作用,包括:跨平台兼容性:在多平台上稳定运行,简化移植。图形用户界面 (gui) 支持:提供跨平台的 gui 库,无需编写平台特定代码。数据库集成:支持多种数据库系统,实现数据访问和操作的跨平台性。网络通信:提供网络通信机制,用于分布式应用程…

    2025年12月18日
    000
  • C++框架中的数据处理和存储机制

    本文介绍了 c++++ 框架中处理和存储数据的关键技术:数据处理:stl 容器(vector、map、set)boost 库(额外容器和算法)eigen 库(优化矩阵和向量)数据存储:关系数据库管理系统(rdbms)(mysql、postgresql、sqlite)文档存储(mongodb、redi…

    2025年12月18日
    000
  • C++框架在行业中的实际案例

    c++++ 框架广泛应用于行业中,提供高效且可维护的代码解决方案。这些框架用于开发跨平台 gui(qt)、科学计算(armadillo、eigen)、线性代数运算(eigen)、计算机视觉(opencv)和高性能网络应用程序(ace)。例如,spotify 使用 boost(线程管理和网络操作)、a…

    2025年12月18日
    000
  • C++框架在后端开发方面的优缺点?

    c++++框架在后端开发中的优缺点:优点:高性能低内存使用跨平台原生数据库支持丰富的库生态缺点:学习曲线陡峭内存管理复杂缺乏动态关注编译时间长缺乏垃圾回收 C++ 框架在后端开发中的优缺点 优点: 高性能: C++ 是一种编译语言,可生成高效机器码,从而实现优异的性能。低内存使用: C++ 提供直接…

    2025年12月18日
    000
  • 在线资源和教程如何帮助降低 C++ 框架的学习难度?

    通过在线资源和教程,你可以降低 c++++ 框架的学习难度:利用官方文档和外部教程学习框架的基本概念和最佳实践。加入 stack overflow 和讨论论坛等社区,寻求具体问题的帮助和支持。通过构建 restful api、数据库应用程序和网络服务器等实战案例,获得实践经验。 通过在线资源和教程降…

    2025年12月18日
    000
  • 不同C++框架在特定领域的专业化和适用性对比

    不同的 c++++ 框架针对特定领域进行了专业化,以优化性能和易用性。对于 web 开发,boost.asio 以其轻量级和跨平台能力脱颖而出。用于 gui 开发的 qt 提供了丰富的功能和跨平台支持,而 qtsql 简化了数据库访问。poco 在网络编程中很突出,openmp 在并行计算中表现出色…

    2025年12月18日
    000
  • C++ 框架如何优化大型项目中资源管理和性能

    c++++ 框架通过资源管理和性能优化,提升了大型项目的效率:资源管理优化:通过资源池和智能指针管理资源,优化分配和释放操作。性能优化:利用并发编程和内存管理库,实现跨平台并发编程和提升内存管理性能。 C++ 框架:优化大型项目中资源管理和性能 大型 C++ 项目经常面临资源管理和性能问题。为了解决…

    2025年12月18日
    000
  • C++ 框架性能基准:与其他语言和平台的比较

    基准测试结果表明,c++++ 框架在 http 请求处理和数据库查询方面表现优异,boost.asio 适用于高并发连接,cpp-httplib 和 libuv 具有较低延迟。开发人员应根据不同场景选择最合适的框架。 C++ 框架性能基准:与其他语言和平台的比较 引言 性能是任何软件应用程序的关键方…

    2025年12月18日
    000
  • C++ 框架在网络安全领域的应用:提升网络抵御能力与威胁防御

    c++++ 框架在网络安全中广泛应用,提升网络抵御和威胁防御能力:高性能:c++ 速度和效率使其适合构建实时网络安全应用。内存管理:c++ 提供对内存的细粒度控制,确保安全和资源高效。跨平台支持:c++ 可在多种平台编译,便于构建跨平台安全解决方案。应用包括:入侵检测系统、防火墙、恶意软件分析和取证…

    2025年12月18日
    000
  • C++ 框架的学习指南:快速上手

    对于使用 c++++ 框架,本指南提供了分步指导,包括:了解基础知识:熟悉框架概念和 oop 原则。探索框架功能:容器、算法、线程管理、网络操作和数据库集成。实战案例:创建一个文件管理程序,演示框架的使用。扩展知识:探索其他框架、参与社区和练习项目。 C++ 框架的学习指南:快速上手 随着 C++ …

    2025年12月18日
    000
  • C++ 框架设计中实现代码重用的技术

    在 c++++ 框架设计中,实现代码重用的技术包括:模板方法模式:定义算法大纲,由子类定义具体步骤。策略模式:分离算法实现和使用对象,提高灵活性。工厂方法模式:创建对象的方法由子类实现,允许创建不同类型对象。抽象工厂模式:创建相关对象家族的方法,无需指定具体类,促进松耦合。单例模式:确保类只有一个实…

    2025年12月18日
    000
  • c++是什么语言

    C++ 是一种通用、面向对象、跨平台的编程语言,由比雅尼·斯特劳斯特鲁普开发于 1985 年。它具有面向对象、跨平台、高效、可扩展和低级控制等特点。C++ 被广泛应用于开发操作系统、数据库管理系统、游戏引擎、网络应用程序和大型企业软件。其优点包括效率高、可移植性好、面向对象和强大;缺点则包括复杂性、…

    2025年12月18日
    000
  • C++ 开源库指南:探索丰富的库资源,拓展编程能力

    c++++开源库为开发者提供了丰富的工具,包括:boost库:提供算法和数据结构,可用于字符串操作和图表处理。eigen:线性代数库。opencv:计算机视觉和机器学习库。qt:跨平台gui框架。mysql connector:与mysql数据库交互的库。wxwidgets:图形用户界面库。选择最合…

    2025年12月18日
    000
  • c++怎么连接数据库

    在C++中,可以使用ODBC或第三方库连接到数据库。ODBC步骤:初始化环境,连接到DBMS。其他库:MySQL Connector/C++、PostgreSQL libpq++、SQLite3,根据数据库类型和需求选择库。 C++连接数据库 在C++中连接数据库,可以使用标准的C++数据库连接库(…

    2025年12月18日
    000
  • 在 C++ 生态系统中,如何选择合适的库和框架?

    在 c++++ 生态系统中进行库和框架选择时,应考虑功能、性能、稳定性、社区支持和许可证等因素。实战案例包括 qt(图形库)、rapidjson(json 库)、boost.asio(网络库)和 mysql-connector-cpp(数据库连接库)。使用库管理器和仔细研究文档有助于做出明智的选择。…

    2025年12月18日
    000
  • 学习C++ Web开发所需的技能和资源有哪些?

    c++++ web 开发需要掌握 c++ 编程基础、网络协议和数据库知识。必备资源包括 cppcms、pistache 等 web 框架,cppdb、pqxx 等数据库连接器,以及 cmake、g++、wireshark 等辅助工具。通过学习实战案例,如创建简单的 http 服务器,可以开启 c++…

    2025年12月18日
    000
  • c++属于前端还是后端

    C++ 既可用于前端(用户界面创建)也可用于后端(服务器端逻辑处理),因为它强大且高效,支持多范例编程。决定因素包括应用类型、性能要求和开发团队技能。 C++:前端还是后端? C++ 既可以用于前端开发,也可以用于后端开发。因此,它不属于前端或后端的单一类别。 前端开发 涉及用户界面(UI)的创建,…

    2025年12月18日
    000
  • Dapper如何封装通用仓储 Dapper Repository模式实现方法

    Dapper通用仓储应借鉴EF思想而非照搬,核心是泛型约束+手写SQL灵活性:定义IRepository接口(GetById/Find/Insert/Update/Delete),实现类通过特性识别主键与列映射,动态生成安全SQL,支持事务参数,分页由具体方法处理,查询逻辑下沉至具体仓储,连接由DI…

    2025年12月17日
    000

发表回复

登录后才能评论
关注微信