关于数据脱水与浸泡的一些思考
初步试用了定制 ACT,开发文档中让我觉得最迷人的模块就是数据脱水与浸泡。这也是个人眼中 KOS 最大的与众不同。更高的维度看,AI 下个阶段的重点和难点也是数据,尤其数据的处理能力和精确度,这恰恰是 AI 作为智能工具最本质的价值。
所以个人看好 KOS。
从数悟空到重写西游
以数悟空和“数一数” ACT为例,当前的模块的核心能力有两个:高精准度的count和rephrase。区别于某一段的精准重写,我好奇现有的功能是否能够实现如下重排:
- 单一人物视角维度的重排
- 单一地点维度的重排
- 某个利益集团角度的重排
以上三种重排之后,都可以再重写一本更有意思的《西游记》。
重排和重写的本质是什么?
脱水是对具象数据的抽象,浸泡是把抽象数据根据给定条件再具象。
从人类角度视角看这个循环,就是把个体过往的经验抽象成方法论,再把方法论结合现实场景还原成解决当前问题的工具。公有大模型场景下,用户尝试通过提示词工程同时解决这两个问题,但数据隐私和幻觉是两个致命伤。
数据脱水与浸泡=借鉴过往的经验解决当前问题
KOS有机会成为通往“巨人的肩膀”的梯子。
结语
以上更多是有些形而上的内容,最后说点实际的。
当前用户基本分两类,一类是开发者,一类是非开发者。其实这两类人大致有一个共同的目标:成为一个独立开发者,但是貌似两者当前都举步维艰。
好消息是还有哈哈这样的热心人在写入门教程,KOS 也在尝试类似“ACT 揭榜大赛”的活动打通这两类不同的用户。
这个帖子也在尝试给出一些解决问题思路:
开发者善于使用方法论(比如开发者文档),非开发者有很多“当前问题”。有没有可能:
- 把开发文档脱水
- 语义计算用户的输入
- 匹配之后再浸泡输出
- 用最短的上下文由 LLM 输出代码框架
如果可行,开发者对于元空间的理解肯定更深刻了,非开发者也形成编程思维,KOS 肯定可以收集到足够多的反馈。
由举步维艰,到皆大欢喜。
这个 ACT 的名字我有个建议,就叫“搓一个”。就像小男孩捏橡皮泥那样,这应该是每个独立开发者都曾有过的经历吧。
就此打住,否则结语比正文还长了。
脑子里还有很多关于脱水与浸泡的想法,等我再用用,再想想。也期待看到更多这方面的实例分享。