发布日期:2026-05-20 10:45 点击次数:87

最近我准备做一场线下分享ipz-921磁力搜索,
主题是使用Skill的四个阶段,虽然说一个好用的Agent,还有hook,定时,记忆等等等等,但skill确实是能带来比较明显的使用体验差异的。
按之前的流程来,最少要先定个主题,写个大纲,做PPT,准备讲稿,再搞一张海报,一个报名页和一个物料表。
就是用Agent来做,也要提前弄清楚这场分享到底讲给谁听,
是刚接触AI的小白,
还是已经用过Claude Code,OpenClaw,Hermes的进阶玩家。
还要把这件事讲得足够具体。
我很不喜欢上来就讲XXX Agent时代来了,一代版本一代神这种唬人的大词。
大家都听太多了。
老话说得好,十米内必有解药。
我觉得没有比用一个Agent完成上面的那一大串东西,更能够说明Agent+Skill能做出来什么的了。如果只是按照下载量公开的排行榜去说,去推荐10个skill,直接问Agent就行也没必要分享。

tiangong。cn
这,也是我测试天工超级智能体的主case。
我不想再测能不能联网搜索做一份PPT出来。
这个测试太薄了。
现在几乎所有AI办公产品都能说自己会做PPT,会写文档,会生成图片,会总结资料。
问题是,用起来的时候我需要的从来不是一个文件,一个光好看没有内容逻辑的PPT。
所以我给天工准备了一个完整任务。
让它从0开始帮我筹备这场分享。
我要办一场线下分享,主题是「普通人如何使用Agent Skill完成复杂工作」。把它当成一个真实项目来筹备,不只做PPT。
这场分享面向的人群是,已经听说过Claude Code、Codex、OpenClaw、Hermes、Agent Teams,但还没有真正掌握Agent Skill用法的AI工具用户和内容创作者。
我希望这场分享解决的问题是,很多人知道Agent有Skill,却不知道怎么找Skill、怎么把自己的资料和流程打包成Skill、怎么从主动调用一个技能,过渡到培养多个批量化定时化,有职责、有记忆、有技能的数字同事。
依次完成这些交付物。
1. 梳理这场分享的听众画像和他们最容易卡住的地方2. 提炼这场分享最重要的一句话主线3. 设计一份30到45分钟的分享大纲4. 生成PPT结构,包括每一页标题、核心观点和建议配图5. 给每一页PPT写逐页讲稿,语气要适合线下分享,不要像说明书6. 设计现场互动问题,让听众能马上理解Skill怎么用7. 生成活动海报文案,包括主标题、副标题、卖点和报名引导8. 生成报名页文案,包括活动介绍、适合人群、你能带走什么和注意事项9. 制作活动筹备表,包括时间推进、物料清单、人员分工和风险清单10. 生成一条30秒预热视频脚本,用来介绍这场分享为什么值得来11. 最后把整套筹备流程整理成一个下次可以复用的Agent Skill,包含使用场景、输入要求、执行步骤、输出格式和检查标准
这段提示语我故意留得很长ipz-921磁力搜索,也没有把ppt模版上传给它。
我想测的是,当我把一个真实项目从零开始交给云端Agent,
它会怎么理解这个项目,会怎么拆,会不会知道不同阶段应该产出不同样式的东西。

我觉得第一个亮点就是天工做出来的每一页,都是一个完整的HTML PPT的页面,也支持下载成PPTX。
所以它在保留了风格比一般的编程Agent做出来好看的同时,国产jazz亚洲护士无码里面的每一个组件每一行字都是可以单独添加到对话框进行修改的。
也保留了像普通的办公软件的快捷功能,能够在每页PPT上去调这个标题大小,字体的样式和字号,相当于它在两个方向里面取了个平衡。
还可以加载少于10M的Skill,我这里就导入了Claude自带的frontend-design skill重新生成的。

这个思路也是从PPT覆盖到了生图环节。
在生图这个方面,天工可以把生成好的图做拆分,也可以支持局部重绘。
那我们也可以去用生图片提示语的skill,去生成纯英文的图片,或者是直接给参考图,就生成这种黑白文字排版。
或者直接跟它对话,在后面加一个可能产品特写的,像登山一样有寓意的图片,或者是用刚刚安的这个frontend-design skill来去排版字体设计思路,然后生成图片,非常灵活。

我觉得按照天工这样的一个制作思路,
他们应该是想把所有类型的文件,只要在他那里做的,都把原来常见用来打开它的这个软件的功能全部搬到他们内置的查看器上面。
所以说打开这个Excel查看器,我们照样是可以选AI重新生成还是手动编辑,插入更多的数据源,然后插图表,公式,还有视图。
纯命令行和对话界面用多了,
回到这个熟悉的操作界面还有点顺手,
我真的可以接受用智力不那么高的模型去一次性完成90%的任务,然后我手动调整它。

轮到数据生成的时候,综合+萝莉天工给我做了一堆清单,
出乎意料,还挺准的。
就像我之前也会遇到电脑连接的线,当时是没有办法兼容我的电脑的。所以临时是拿另外一个人的,又因为我的PPT做比较大,同步的时间要很久,延误了五分钟,场面是相当尴尬。
然后包括我觉得比较可惜的就是当时分享的时候没做录音,我回来后想复盘,结果还得重新讲一次,但就没有办法复刻现场的那种氛围了。
所以我觉得,这个分工表提醒的做现场录音,和请个主持人去cue我,确实能避免冷场。
我已经开始熟悉天工的套路了,
他们在支持生成AI视频的Skill的同时也把一个基础的剪辑软件搬到了网页里。

不过在生成视频上我觉得一句话生成的版本是有优化点的。
首先,天工出的语音是很稳定的,但是它在画面的连贯程度上面,以及画面跟画面之间的画风统一上面ipz-921磁力搜索,我觉得还是可以去优化的。
所以在我跟他第二轮优化的途中,我就先让他生成了我想要的影片时长,设计分镜,设计图片,再生成影片。
然后再去生成一遍这个视频。
生成后的视频也不是不能调整,是能够随时回退回去,重新生成图片,语音和音乐的。
还可以把这个过程保存成skill,把流程固定下来,那么下次我们生成视频的时候直接用就好。

这一点是我最关心的。
因为Agent Skill最有意思的地方,不是你今天找到一个别人写好的Skill,然后点一下用掉。
那只是第一阶段。
我觉得普通人使用Skill,大概会经历四个阶段。
第一阶段,是找Skill。
知道有这个东西,但不知道去哪找,不知道该用哪个,也不知道什么时候该用。
第二阶段,是打包Skill。
开始把自己的资料、流程、偏好、风格、业务规则放进去,让Agent别每次都从零理解你。
第三阶段,是培养数字同事。
你不再每次手动说「现在调用某某技能」,而是开始培养几个不同职责的Agent。它们知道自己是谁,知道要干什么,也知道什么时候该用什么工具。
第四阶段,是批量化和定制化。
多个Agent围绕不同项目长期工作,持续处理,持续复盘,最后形成一个团队生产系统。
很多人现在还卡在第一阶段。
所以我这次才想用一场线下分享把它讲明白。
天工这次还支持接飞书,所以我在手机上也可以安排定时任务,比方说经典到不能再经典的。
每天早上10点总结AI信息,读取的是我之前开源的伯乐Skill做出来的ai news rader,在获得页面json数据的基础上,总结出来这里面能有多少个公众号选题,切入的角度都是什么。
就刚刚的分享我临时想起来,还可以在手机上再coding一个报名页出来,作为一个专门为这次分享定制的页面来说是够用了。
当然,云端Agent也有自己的能力边界。
本地Agent,比如OpenClaw,Hermes,Claude Code这类,优势很明显。
它们能自由访问本地文件,愿意折腾的话,自由度非常高。
但代价也很明显。
部署,配置,长期维护,这些东西都是成本。
不然OpenClaw也不会被Hermes超车,
对我来说就是因为它出错的概率太高了。
想同时养三四个全记忆全技能的Agent,
本地的空间压力也会慢慢上来。
天工的做法更像是给用户一个更均衡的方案。
它不要求读取整台电脑,
你只管把这次项目需要的资料丢到知识库,
它就围绕这些资料交付结果。
我自己是挺喜欢这个边界的。
从吃虾,到Hermes,再到Claude Code和Codex,这次轮到天工。
看起来我们一直在换工具。
但我现在越来越觉得,
大家真正想找的东西其实没变。
我们在找一个kuku干活的数字同事,
这个同事曾经是角色扮演提示词,
是GPTs,
是被蒸馏的Skill,
也是今天的Agent。
@ 作者 / 卡尔
最后,感谢你看到这里如果喜欢这篇文章,不妨顺手给我们点赞|在看|转发|评论
如果想要第一时间收到推送,不妨给我个星标
如果你有更有趣的玩法,欢迎在评论区聊聊
更多的内容正在不断填坑中……