魔礼养羊
(Ti D Ber 8 Au7g0 Rq)
1
需求:
1、采集:主要是从oracle、mysql,集团数据共享交换平台,以及大量单机系统(可能由sqllite,access)的数据采集。采集的周期一般是一天为单位。
2、计算:微批计算即可,OLTP数据量很小;OLTP有一些需求,但是变化不大;日志分析的量也不大。
3、存储:华为云存储,一年的数据量应该把不超过1000万条。
4、治理:有治理需求
5、共享交换:需要提供共享交换功能。
6、可视化:有一个IOC平台,需要从数据中台调用数据指标结果。
计划:
用tidb做数据导入、存储、数仓、服务,用flink做流批处理,kafka做消息队列,redis做缓存,es做日志采集,data hub做数据治理(领英开源的,非阿里),ZK/YARN/HDFS不强调。
缺陷:
tidb是否做得到这些功能?希望有一个统一的web管理界面。
只有理论知识,对mysql有点CRUD经验,希望得到大家的指点,轻喷!!
TiDB是一个分布式数据库,它的设计目标是兼容MySQL协议并支持水平扩展。要基于TiDB和开源组件打造一个轻量级中台,可以考虑以下几个方面:
- 数据存储和管理:使用TiDB作为数据存储和管理的基础,可以实现分布式、高可用、水平扩展等特性。此外,还可以使用TiDB的分布式事务特性来保证数据的一致性和可靠性。
- 服务注册和发现:使用Consul等开源组件实现服务注册和发现功能,以便于服务之间的通信和协作。这样可以实现中台的服务化架构,提高整个系统的灵活性和可扩展性。
- 配置管理:使用Etcd等开源组件实现配置管理功能,可以将各个服务的配置信息集中管理,方便对配置进行统一管理和调整。
- API网关:使用API网关(如Kong、Nginx等)对外提供服务接口,可以实现请求转发、鉴权、限流等功能,同时也可以提高系统的安全性和稳定性。
- 监控和日志:使用Prometheus等开源组件实现监控和日志管理功能,可以对整个系统的运行状态进行监控和分析,及时发现和解决问题。
- 微服务框架:使用Spring Cloud等开源微服务框架实现服务之间的调用和协作,可以将业务逻辑进行拆分和解耦,提高系统的可维护性和可扩展性。
综上所述,基于TiDB和开源组件打造一个轻量级中台需要综合使用多个开源组件,并且需要考虑它们之间的集成和协作。这需要有一定的技术水平和实践经验,同时也需要根据实际需求进行合理的选择和配置。
以上是chartGPT的回答!
魔礼养羊
(Ti D Ber 8 Au7g0 Rq)
5
我感觉这个答复很不错,但是缺陷还是很大。
至少数据治理和数据共享交换没考虑。
其他共性组建之前没考虑那么多,非常感谢
魔礼养羊
(Ti D Ber 8 Au7g0 Rq)
6
感谢网易的兄弟。他们给我的思路是BI+湖仓+数据治理平台。
算下来,的确是成本最优的解决方案。