Parser 如何处理不支持的字符集 token

【 TiDB 使用环境】生产环境
【 TiDB 版本】8.0.11

【遇到的问题:问题现象及影响】
项目使用 TiDB 的 parser 解析 SQL,有一个 case 是解析 MySQL 的 CREATE TABLE 语句,获取表的信息。

有一张表使用了 utf32 字符集,在解析这条 SQL 时报错 Unknown character set,从源码上来看是因为不支持 utf32 这种字符集,遇到这个 token 就直接抛出错误了。

想问下有没有不修改源码就可以解决的办法;如果我 fork 一份源码来修改,只是让不支持的字符集 token 不报错,是不是可以解决问题。

感谢

1 个赞

改代码,把你需要的字符集都加上

只能应用侧改了

:thinking:换成我们的话,就会重建这个表,不会去fork源码。现在我们的表都是统一字符集,统一排序规则。因为在实际使用过程中,发现两个表的排序规则如果不同,会造成索引不命中的尴尬场景。

1 个赞

此话题已在最后回复的 7 天后被自动关闭。不再允许新回复。