发布于 2024-03-03 15:55:42

关于数据脱水与浸泡的一些思考

初步试用了定制 ACT，开发文档中让我觉得最迷人的模块就是数据脱水与浸泡。这也是个人眼中 KOS 最大的与众不同。更高的维度看，AI 下个阶段的重点和难点也是数据，尤其数据的处理能力和精确度，这恰恰是 AI 作为智能工具最本质的价值。

所以个人看好 KOS。

从数悟空到重写西游

以数悟空和“数一数” ACT为例，当前的模块的核心能力有两个：高精准度的count和rephrase。区别于某一段的精准重写，我好奇现有的功能是否能够实现如下重排：

单一人物视角维度的重排
单一地点维度的重排
某个利益集团角度的重排

以上三种重排之后，都可以再重写一本更有意思的《西游记》。

重排和重写的本质是什么？

脱水是对具象数据的抽象，浸泡是把抽象数据根据给定条件再具象。

从人类角度视角看这个循环，就是把个体过往的经验抽象成方法论，再把方法论结合现实场景还原成解决当前问题的工具。公有大模型场景下，用户尝试通过提示词工程同时解决这两个问题，但数据隐私和幻觉是两个致命伤。

数据脱水与浸泡=借鉴过往的经验解决当前问题

KOS有机会成为通往“巨人的肩膀”的梯子。

结语

以上更多是有些形而上的内容，最后说点实际的。

当前用户基本分两类，一类是开发者，一类是非开发者。其实这两类人大致有一个共同的目标：成为一个独立开发者，但是貌似两者当前都举步维艰。

好消息是还有哈哈这样的热心人在写入门教程，KOS 也在尝试类似“ACT 揭榜大赛”的活动打通这两类不同的用户。

这个帖子也在尝试给出一些解决问题思路：
开发者善于使用方法论（比如开发者文档），非开发者有很多“当前问题”。有没有可能：

把开发文档脱水
语义计算用户的输入
匹配之后再浸泡输出
用最短的上下文由 LLM 输出代码框架

如果可行，开发者对于元空间的理解肯定更深刻了，非开发者也形成编程思维，KOS 肯定可以收集到足够多的反馈。

由举步维艰，到皆大欢喜。

这个 ACT 的名字我有个建议，就叫“搓一个”。就像小男孩捏橡皮泥那样，这应该是每个独立开发者都曾有过的经历吧。

就此打住，否则结语比正文还长了。

脑子里还有很多关于脱水与浸泡的想法，等我再用用，再想想。也期待看到更多这方面的实例分享。

交个朋友

浏览 (466)

哈哈 2024-03-05 11:33:17

开发者善于使用方法论（比如开发者文档），非开发者有很多“当前问题”。有没有可能： - 把开发文档脱水 - 语义计算用户的输入 - 匹配之后再浸泡输出 - 用最短的上下文由 LLM 输出代码框架我觉得以后这个会达到的，等CACT规模起来以后，相当于各种基础能力都具备了，非开发者用户用自然语言描述需求，系统找到对应的ACT组合调用，就类似于低代码了，只不过低代码是图形化操作，而这是用自然语言。

2024-03-05 16:06:28

嗯，是有个过程，但现在应该就能具体描述这个过程并启动，简单说就是把这个相对复杂的任务拆解成当前能力可以实现的多个子任务ACT，再做一个能够调度这些子任务的 ACT输出主程序框架，然后手动拼接。这样思考的目的是：在开始的时候就以解决复杂问题为目标，这样 ACT 本身的价值厚度和生命周期才会有质变，这也是 AI 工具的价值所在，学渣变学霸，把不可能变成可能。

哈哈回复 mud&god

2024-03-05 17:04:21

这可能就是AI时代程序员的工作了，开始偏向任务拆解能力而不是代码编写能力。我觉得kOS肯定规划这个能力了，我之前就想过一个初期实现，NACT提供一个调度器，它可以根据用户提供的自然语言描述过程和用到的ACT列表，然后它自己自动调用，这就剩下了手动拼接的过程。但这就要求ACT库比较丰富了，用户才能选用，当然后续它应该会自己选择。现在还是ACT不够丰富。

mud&god 回复哈哈

2024-03-05 17:15:38

0 到 1 阶段，先有鸡还是先有蛋的问题总是最难解的。好消息是，如果AI 带来的是增量，就应该有解。

构造世界 2024-03-04 10:02:45

有启发到~学习了

泽儒 2024-03-03 22:24:53

赞赞，感谢这么有启发的分享，“搓一个”有意思，期待未来更多关于“脱水与浸泡”的思考和实例分享。

银河系遛弯儿 2024-03-03 17:47:54

特别喜欢你关于橡皮泥的类比～我不是开发者，我自己之前还觉得像乐高积木，kos提供的是乐高零件，开发者自己搭建成各种有趣的模型～但是橡皮泥，感觉更有趣～给到开发者更多的空间和想象力。