寻求TiDB处理半结构化数据的最佳实践

为公司接下来要启动的一个项目做技术调研。预计一半结构体数据,一半半结构化数据。系统部署在内网机房。
如果是在部署在公有云上,估计就MySQL+MongoDB了,反正几乎不要运维。
如果在内网机房,怎么着也得分布式数据库。而且估计会拆分为几个子系统,每个子系统有自己独立的数据集群。
如果TiDB集群+MongoDB集群,感觉太复杂。期望一套搞定。
事务操作估计不多,结构化数据塞MongoDB问题也不大。但感觉MongoDB社区跟没有也没差别。
如果TiDB,很担心对半结构化数据的支持。查了文档,TiDB对json有一些简单的支持,貌似还在实验阶段:https://docs.pingcap.com/zh/tidb/dev/data-type-json

所以想寻求下tiDB处理半结构化数据的一些实践经验,和技术选型建议。

TiKV 可以直接作为一个 NoSQL 数据库使用
参考 TiKV | TiKV API v2

Data in TiKV is separated by modes, supports using TiDB, TxnKV, and RawKV in a single cluster at the same time.

可以满足一套搞定的需求

有几个参考的点,我列举一下:

  1. 单列 Json 的大小 (最大 6 MB)
  2. 事务操作的范围需要确定 (列过大,需要更多内存来保持事务的二阶段提交)
  3. Json 查询能力和索引的能力,还在实验阶段 (需要深度参与,后期可能才会有更好的优化效果)
  4. 能接受单纯的CURD,依靠主键来完成操作(操作速度有保证)

以上的列举的信息,如果能够接受,可以大胆的使用

以下是行列以及类型的限制参考

2 个赞

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。