【产品调研】关于“GBK 字符集”的支持功能,参与即送80分积分

【产品需求背景】

在 字符集 的选择上,

TiDB 较早 地已经支持了 UTF-8

我们都清楚 UTF-8 是大部分人 首选或在用 的字符集,因为它基本上 包含 了 GBK 的字符。

对于“GBK 字符集”的支持功能,

可能有些小伙伴会认为,这是一个 倒退 的行为。

而在产品调研中,我们又发现了,一些传统企业,还一直沿用 GBK 的字符集,

GBK ,最大的一个优点就是节省存储空间,且使用单位最小可以细化到一个表的不同列。

而如果 TiDB 不对 GBK 字符集 进行支持的话,

有些企业将 无法正常使用 TiDB。

所以我们希望使用 GBK 字符集伙伴可以参与本次调研,

一同来建造属于你和 TiDB 的产品共创时刻。

【参与产品调研】

GBK 字符集的支持功能 即将开发 ,我们会认真研究大家提供的每一个例子,大家可以按照以下方式提供:

  1. 在使用 GBK 字符集时,collation 的使用情况,比如:
  • 经常使用是哪个 collation? gbk_bin 或者 gbk_chinese_ci。
  • 是否接受非标准 collation,比如按偏旁部首排序。
  1. 列举在使用 GBK 字符集时,一些跟字符相关函数的使用情况,比如使用 Hex 。
  2. 字符集转换的支持情况,是否使用 convert 等函数转换 GBK 字符的使用,如果使用,请列举几个常用的使用方式。
  3. 使用 GBK 字符集后,比起 UTF-8 字符集,性能损失接受度,比如读写性能损失 10%,或者 20%。
  4. 关于非法 GBK 字符处理,是否可以接受兼容 MySQL 行为,直接报错或者返回 warning。

【调研奖励】

  • 完成答复5个问题的伙伴,即可获得 80积分 ,80经验值。

  • 如果您不想公开答复的内容,您也可以 私信 给我,同样也能获得积分哟~

1 个赞

部分场景需要按中文拼音排序,mysql 使用 order by convert(column using gbk) asc 这种语法实现

1 个赞

汉字首字母排序的需求,比如张三 需要Z的排序需要。

2 个赞

顶楼上的,支持汉字排序