Sparks ✲
real_kai42
Kai
@real_kai42

一点小感受,AI 取代人类工作的一个关键点在于,这个工作是否是容易 测试/评价/获得反馈的

例如,CRUD 的任务,就容易取代,因为任务清晰,容易测试,并且可以根据测试和的结果进行迭代,实现方法也比较套路化了。 类似 typeChat 也是类似的思路,把一些面向 AI 的任务用 AI 好理解的方式进行编码,且在 AI 出错的时候,也能提供 AI 容易理解的报错信息。

而交互、UI 这些不容易被 AI 取代。虽然我现在 UI 大部分也是 AI 写,但测试需要我自己去运行 + 调试一下,再手动反馈给 AI。

两者核心的区别在于,评价和测试 UI 的是人类,而评价和测试 API 可以是机器

real_kai42
Kai
@real_kai42

之前还在做可视化的时候,工业界有两个 team 一个 team 做面向数据分析师的工具 另一个 team 说,国内没有数据分析师的群体和土壤,他们认为核心的使用场景,就是你心里已经有了关于数据的 insights,只是希望用工具更好的把这个 insights 展示出来

所以他们的产品就是把数据,用非常炫酷的可视化展示出来,面向的就是汇报的场景,越炫酷越好

real_kai42
Kai
@real_kai42

读书做可视化相关研究时,主要的思路就是: 算法是不能做到 100% 正确率的,那就用算法做初筛,把值得关注的数据点用更高质量的可视化工具展示出来,然后由人类进行详细的分析,最终发现需要进一步处理的异常点。

以散点图寻找聚集区域为例,在巨大的数据量中由人类观察就是低效的。先有算法找到可疑的区域,再用可视化的密度图等方式叠加一个图层上去,让人类进一步分析和标记,就能在正确率和效率中取得平衡。

Github copilot/ any-copilot 都是类似的思路,工具化的 gpt 应该是未来。由 AI 给出 一个/多个 可能的解决方案,然后由人类选择并继续优化,也能作为数据反馈给训练数据

real_kai42
Kai
@real_kai42

有个 idea,能否把 prompt 结构化 例如,分成 角色-信息-任务-提示-其他,四个模块

角色:你是一个 xxx 信息:下面是关于 xxx 的信息 任务:你的任务是提取 xxx 提示:如果遇到 xx,可以返回 NAN 其他:无

结构内部可以用 LLM 合成 例如拖动 ‘严谨’ 和 ‘增强能力’ tag 到 角色 结构区,就可以给现有的角色增加 “你是一个严谨的 xx,你每次输出前会认真思考”。 不是单纯用字符串拼接进行合成,而是用 LLM 进行语义化合成

也可以拖动一些 tricks 进 其他 区,例如:“这对我很重要” “快到 ddl 了” “如果你做的好,我会给我 10 刀 tips”,依旧是 LLM 语义化合成

感觉交互和动画可以做的很有意思

real_kai42
Kai
@real_kai42

在表单场景下,我们能否让大模型根据需要的信息返回一个 JSON 数组,每一个元素内容是 UI 类型和 UI 的目的。 然后我们可以根据这个数组去生成对应的表单 UI,让用户进行填写并提交。 大模型就可以通过这种 UI 的方式去获取用户的信息

这样可以生成自定义的 UI。 比如一共 10 个消息,用户已经提供了 3 个,那大模型就可以生成 7 个信息的表单让用户填写。 或者根据每个用户的特殊情况去生成特殊组合的 UI,比如用户提供的地址没有城市,就只生成城市的下拉框

看起来是一个不错的玩具 idea 也像在大模型时代和传统 UI 的一个中间产物