使用 val df = sqlContext.read
.format(“tidb”)
.options(tidbOptions)
.option(“database”, dbName)
.option(“table”, tableName)
.option(“useUnicode”,“true”)
.option(“characterEncoding”,“utf8”)
.load() 读取tikv数据中文乱码。
但是 val df = sqlContext.read
.format(“jdbc”)
.options(tidbOptions)
.option(“database”, dbName)
.option(“table”, tableName)
.option(“useUnicode”,“true”)
.option(“characterEncoding”,“utf8”)
.load() 读取的结果正常。
tikv和tispark都是最新的,spark集群2.4.6版。
数据库表字符集:CHARACTER SET utf8 COLLATE utf8_bin;