关于星伴「数据仓」中用户上传文档的调用方式
需求
在日常使用过程中突发奇想,想要上传各种开发语言的官方文档,实现:在使用大模型分析互联网内容协助开发的同时,调用解析的文档内容使答案更准确。
提问 1
根据我对大模型的理解,这种方式对提升准确度理论上是有效的。
但是:从具体实现原理角度,此方式对提高准确度是否有帮助?
提问 2
在具体测试时,我已经上传一系列 Python 的官方最新中文文档并显示解析完成。
随后我分别以 不选用文件直接询问 和 选用问题相关的具体文件并使用「文件问答(beta)」询问 这两种方式来询问星伴「如何配置 Python 程序的日志」,而最终得到的结果如下:
直接询问
使用 ACT(一长串回答,但是结尾并没有显示「答案来源」)
从结果来看,直接提问使用了互联网内容且偶尔会使用文件内容(在之前使用时偶尔会显示「答案来自xx文件」),而使用 ACT 直接询问文件时似乎并不搜索互联网内容。
那么,如何稳定地实现:在使用互联网内容的同时调用上传的文件,只能通过自己编写 ACT 吗?
提问 3
对于上传文件的调用,我猜测能做到的是:将上传的文件全都解析为元数据并储存,当后续相关内容需要被使用时即可直接调用相关内容,因此能实现类似于 跨源文件 查找内容的功能。
那么:我的猜测是正确的吗?如果正确,这是否意味着「提问 2」中类似的场景下,选择多个文件(5 个及以上?)同时提问是可行的,且对整体速度的影响并没有特别大?
提问 4
在向星伴提问时发现了 「深度问答模式」,这个模式与「普通问答模式」有什么区别?