目前大部分场景个人感觉主要集中在知识库,比如基于企业知识库的RAG、文档机器人等等。
个人感觉金融行业对大模型的应用场景比较深入,比如对于有大量研报路演资料的情况,研究员可以基于 RAG 快速总结关键点或者筛选文档;交易员的模型策略选择可能也会有应用场景。
对于传统行业的企业知识库 RAG 场景,目前会有一个比较大的问题就是,传统行业的操作手册或操作文档里包含了大量的图片。也许可以用 image embedding 或者 image2text + text embedding,感觉涉及不到向量库的改动 ?
除了基于文档的场景,这种场景可能需要用户手动搜索。也许还存在一种主动推送 or 推荐的,基于 RAG 做相关性检测?不过这块可能只需要 embedding + vector db + reranker 就行,甚至不一定会用大模型…
最后说回向量库,目前除了向量搜索比较常用的应该就是全文检索了,全文检索自然会带来另一个问题即多语言分词尤其是 CJK 语言的分词,中文用的比较多的好像是 jieba。因为目前个人体感方面向量+全文的混合检索会比纯向量检索好一点点 orz