我想着趁周末给她整理几道针对性练习,问题是卷子是纸质的,我只能拍成照片,不是文字。而且卷子上的答案+笔记,通常最后就是这样的。

如果你使用豆包/千问这类工具,大概率可以用它来帮你总结错题和知识点,但Workbuddy 这样的工具不仅只会聊天,真能干活。
workbudy 下载: https://www.codebuddy.cn/events/invite?inviteCode=okun9b0bya97c4d

这里我最初的想法也是,搞个好看点清晰点的错题知识总结,打印出来给我女儿学习。下载并安装 workbuddy 后,对话框里我把n张错题截屏拖了进去,我就说了一句话:“把图片中的错题按照知识点归纳总结,形成一个html网页,方便打印学习”。

然后出来的就是这个:

这里补充一句就是,在产物中尽量使用 html网页(关于什么是 html 网页各位有兴趣可以自己科普下,这可能是 80 后目睹初代互联网成长,还玩过点 frontpage/dreamweaver的意外好处了)。这种产出比文档要更容易渲染(画图,配色等等),比如我后来总结数学的错题,有关周长面积的这几道题:

但我又想,既然如此,为什么我不直接就生成个错题集呢?于是我又抛了问题,把错题汇总生成一个可以互动做题的网页,而且不管做对做错,都应该提示下知识点。
workbuddy 一通忙活,抛来了这个

看上去不错,女儿觉得做起来也很有意思,一边做一边读这里的解释。44 道题不到一会就做好了。为了能加强理解和记忆,我又从其他 APP 里搞来了一套期末测试的 PDF 卷子,照样扔到 workbuddy 里,让它生成一套新的练习网页。
不过这次我又琢磨,我得看看她做每道题花的时间,于是除了要求生成互动练习 html 之外,我还要求 workbuddy 给我在里面加上计时器的功能,每道题都能记录所花费的时间(实际应该就是点击上一题答案到点击这一题答案的间隔)。

这些产物都会存在 workbuddy 的工作区里,如下图

最近升级之后,现在 workbuddy 还可以直接通过互联网分享,

比如最初的测试网页在网上地址是
https://codebuddy.work/agents/share/Lv1csXwTIFJXTneYlIAxekP_V8-lbQQzjrmBwa9H845hih-0EGw6gdXLZ8AX6ao_?platform=workbuddy
这意味着我可以给我女儿发到她平板上,就可以做题了,也不需要全程在我电脑上。
看到这里,你可能已经发现了,这次的“错题集大作战”,其实完美展示了到底什么是 AI Agent,以及它为什么和普通“只能聊天”的 AI 工具不一样。
如果拆解我这次的操作:
-
第一步:吃下“非结构化”的烂摊子(多模态输入)我扔给它的,是手机拍的、带有红叉叉、涂改笔记、甚至不同格式(有照片、有跨 App 截屏、有 PDF)的非结构化数据。
-
第二步:不仅能思考,还能“调用工具” 当我提出“要能互动”、“要做成网页”时,Agent 不是在用文字给你解释代码,而是直接在后台调用了代码编写、前端渲染等一系列“工具技能”,把一个想法变成了一个真正可以跑起来的程序。
-
第三步:交付高度定制化的复杂产物 普通聊天是你问一句它答一句。而 Agent 是目标导向的——我说要“错题集+能互动+带计时器+能线上分享”,它就能把这一串复杂的逻辑缝合在一起,最终交付一个拿来即用的网页链接。
很多觉得 AI 离自己很远的人,往往是被“提示词工程”、“大模型参数”这些技术名词吓退了。而目前 Agent 这类工具,是很鼓励我们能够自己去做出点什么的,即便是上面这种小项目,也很给我自己带来点 build 的乐趣。
Bluesky Discussion
View on BlueskyNo replies yet. Be the first to comment on Bluesky!



