【产品需求背景】
在 字符集 的选择上,
TiDB 较早 地已经支持了 UTF-8 ,
我们都清楚 UTF-8 是大部分人 首选或在用 的字符集,因为它基本上 包含 了 GBK 的字符。
对于“GBK 字符集”的支持功能,
可能有些小伙伴会认为,这是一个 倒退 的行为。
而在产品调研中,我们又发现了,一些传统企业,还一直沿用 GBK 的字符集,
用 GBK ,最大的一个优点就是节省存储空间,且使用单位最小可以细化到一个表的不同列。
而如果 TiDB 不对 GBK 字符集 进行支持的话,
有些企业将 无法正常使用 TiDB。
所以我们希望使用 GBK 字符集伙伴可以参与本次调研,
一同来建造属于你和 TiDB 的产品共创时刻。
【参与产品调研】
GBK 字符集的支持功能 即将开发 ,我们会认真研究大家提供的每一个例子,大家可以按照以下方式提供:
- 在使用 GBK 字符集时,collation 的使用情况,比如:
- 经常使用是哪个 collation? gbk_bin 或者 gbk_chinese_ci。
- 是否接受非标准 collation,比如按偏旁部首排序。
- 列举在使用 GBK 字符集时,一些跟字符相关函数的使用情况,比如使用 Hex 。
- 字符集转换的支持情况,是否使用 convert 等函数转换 GBK 字符的使用,如果使用,请列举几个常用的使用方式。
- 使用 GBK 字符集后,比起 UTF-8 字符集,性能损失接受度,比如读写性能损失 10%,或者 20%。
- 关于非法 GBK 字符处理,是否可以接受兼容 MySQL 行为,直接报错或者返回 warning。
【调研奖励】
-
完成答复5个问题的伙伴,即可获得 80积分 ,80经验值。
-
如果您不想公开答复的内容,您也可以 私信 给我,同样也能获得积分哟~