【TiDBer 唠嗑茶话会 133】一起聊聊通过 RAG 技术有哪些特定的场景/需求可以得到改善吧!

文档生成,最佳实践生成,问答sql生成,最佳场景案例提供者

知识库

目前大部分场景个人感觉主要集中在知识库,比如基于企业知识库的RAG、文档机器人等等。

个人感觉金融行业对大模型的应用场景比较深入,比如对于有大量研报路演资料的情况,研究员可以基于 RAG 快速总结关键点或者筛选文档;交易员的模型策略选择可能也会有应用场景。

对于传统行业的企业知识库 RAG 场景,目前会有一个比较大的问题就是,传统行业的操作手册或操作文档里包含了大量的图片。也许可以用 image embedding 或者 image2text + text embedding,感觉涉及不到向量库的改动 ?

除了基于文档的场景,这种场景可能需要用户手动搜索。也许还存在一种主动推送 or 推荐的,基于 RAG 做相关性检测?不过这块可能只需要 embedding + vector db + reranker 就行,甚至不一定会用大模型…

最后说回向量库,目前除了向量搜索比较常用的应该就是全文检索了,全文检索自然会带来另一个问题即多语言分词尤其是 CJK 语言的分词,中文用的比较多的好像是 jieba。因为目前个人体感方面向量+全文的混合检索会比纯向量检索好一点点 orz

2 个赞

智能AI

离线自主学习AI助手

目前比较大家认可的是垂直领域的知识库,和问答机器人客服。
未来的场景应该还是面更广阔,类似私人助理,数据分析助理等更多场景

智慧问答,中文版

智能知识库,搜索时间稍长

Tidb.ai已经把官方文档融合的非常好了,如果可以把代码也融合进去,应该可以解决更深入的问题。

智能问答

希望能够用于解决线上出现的一些问题,可以更有效的搜索到解决方案,提供解决方法

中文提问,回答问题的连接,tidb的文档,能不能也换成中文的

这个没问题了,给出的连接,里可以选择语言

这个好像真的只适合垂直应用,主要是用来补充gpt对于某项专业的领域较新的知识学习还不够的问题。。。。

分析知识库更方便,能分析日志就好了

AI的内部知识库定义聊天机器人

给定一段tidb的日志,能生成一个性能报告,并分析出可能的风险点,并给出具体的建议

智能文档库

新增AI学习的功能对话解答了嘛

1 个赞

知识库问答

1 个赞