“小米发布了MiClaw产品了。”
“Kimi也支持一键部署Claw啦。”
“阿里云支持一键部署Open Claw到云服务器了。”
“腾讯推出了WorkBuddy。你的私人工作助手。”
短短的一天之内,我已经在手机上看到了四家厂商推出了自己的龙虾助手。不过紧随而来的,是各司的安全团队警告,严禁在公司电脑上接入龙虾助手,尤其是授权给他公司内部各种账号是严重违规行为。
AI确实已经深刻的影响到了我们的生活工作,比如说我现在已经基本上告别搜索引擎了,有什么问题都是直接问Kimi。在工作中也会熟练使用AI助手来辅助自己编程。我甚至自费购买了Copilot Pro版本。但是对于这波龙虾热潮,我还是保持着观望的态度。
“最近很火的那个什么Open什么来着是什么东西呀?”晚饭桌上,老婆突然问我。
“你说的是Open Claw吧。你也看到这方面的新闻了啊。”老婆并不是程序员,也不是互联网行业从业者,龙虾这股风都吹到她的手机上了,说明已经接近于全名狂热了。
“嗯,我就看到说这个东西非常厉害,但是我还是搞不懂它到底能干啥。”
“给你打个比方,它就像你的私人电脑助手。”我准备完全跳出程序员的视角,从一个普通人的角度去解释这个事情:“比如说,你们外贸是怎么开发国外的客户的呢?”
“有的时候,我会打开国内不存在的搜索引擎搜索搜我们产品的名字,然后能搜出来很国外的店铺啥的,然后上边不就有联系方式吗。然后我就尝试加他们的国内不存在的聊天软件,向他们发信息,推销我们公司的产品。看能不能成单。”老婆回答。
“那你这种行为,一天能加多少个客户,发多少条信息呢?”我接着说:“你一个人在电脑面前估计一天撑死了能加二三十个好友对吧。但是使用这个龙虾,你对它说命令,它就能自动帮你搜客户联系方式,然后自动帮你发信息。”
我顿了顿继续说道:“其实我也不确定这个龙虾到底能不能做到,吃完饭我们实验一下吧。如果它真的能做到的话,那你的工作就能节省很多力气了。”
吃完饭。我和老婆打开了电脑,因为对于Open Claw的安全问题我很不放心,我决定先下载一个腾讯的WorkBuddy来试试。我将这个操作分成两个步骤。先汇总搜索结果的联系方式到一个Excel中,然后读Excel的内容去发送信息。
“请你打开某个国内不存在的搜索引擎,以XXX为关键字搜索,并且将所有的结果汇总到一个表格中,需要包含名称,联系方式,网址等内容。”
在我的预想中,我期待的是,它自己打开Chrom浏览器,然后输入关键字,像一个真人一样操作我的电脑。然后打开一个Excel表格,将屏幕上显示的联系方式填入表格中。因为我现在是站在一个纯龙虾小白和纯非技术人员的视角去观看这个问题,我认为我的期待是合理的。
但是WorkBuddy的行为并非我所期待的,他的思路是使用python的某个操作浏览器的库,然后打浏览器,读取dom元素,从dom元素里去用正则提取出来我想要的信息。这其实还是偏向于程序员的思维去写一个爬虫去解决这个问题的。
虽然他的行为不满足我的期待,但是我还是耐着性子让它做下去了。这个过程中给我的感受就是两个字。
傻——可能是我的模型选择的不太好,在我的电脑已经明确表示npm不存在的情况下,还不会主动去安装Node。逼得我自己不得不先把python和node安装好了,再让它继续,然后接下来的过程也是不时的出现这种情况,我必须帮他做点什么,他才能继续推进下一步。
慢——这个东西干活的速度真的是太慢了,我就看着他的思考过程,左右脑互搏。然后一思考就是半天。在经过了至少四个小时的痛苦煎熬。他的第一版爬虫终于写好了。
接下来的就是测试环节,在测试过程中我又发现了很多漏洞和功能不完善,然后喊它改,它一思考又是小半天。最后终于在七八小时之后,他完成了自己的脚本。
但是这个时候,我细心的发现。相比我人工搜索得到的数量,他的爬虫自己打开Chrom浏览器获得的结果是大幅度减少的。因为他的爬虫打开的网页上清晰的写着——受限制的访问内容。
我赶紧问问Kimi,这句话是什么意思?Kimi回答说这是因为网页自己检测到了疑似爬虫的操作,所以刻意做的反爬逻辑。这个时候,我已经很累了,先睡觉明天再说。
第二天我思考了一下,觉得使用爬虫不是正确的路子,我应该编写一个Chrom扩展插件来实现这个功能。在这里我要先声明一下,本人没有任何编写Chrom插件的开发经验。是纯新手小白。
“请你编写一个Chrom插件,在搜索结果列表上增加一个保存按钮,当我点击保存按钮后,就可以保存所有的搜索结果到一个csv文件中。”我对WorkBuddy发出如上命令。
在我清晰的思路加持下,这次的插件编写的很快。然后我测试一下,发现名字提取出来了,但是联系方式没正确提取出来。于是我把下载下来的csv文件贴给他,告诉它修复这个问题。
于是第二版很快又修改出来了。这次电话提取出来的,但是它被放在了地址栏而不是电话栏。
“请你继续修复这个问题。”我接着发命令。第三次的结果是电话又消失了。之前好的东西又改坏了。这个时候我才发现,龙虾是根本读取不到Chrom浏览器里实际的dom文件长什么样子的,在不知道文件的情况下,它就是在猜。此时我已经身心俱疲了。
“什么辣鸡玩意。”我愤怒的骂了一句:“去你的氛围编程吧。”转手将已经写好的插件文件夹拖入了VS Code里。
因为我购买了Copilot Pro。所以我决定使用 Copilot 的 Agent 模式继续开发这个插件。我直接保存了浏览器的html页面。将它贴给 Copilot,让它读取这个文件然后把联系方式给我正确的提取出来。可惜的是,这个文件太大了,有好几万行,大概是上下文存在限制,它读取不了这么长,它在文件里尝试搜一些关键字去找到联系方式。如果放任不管,怕是又要小半天了,于是我果断打断了它。直接告诉它读取第198283行,那里就是联系方式的dom的元素。
“你提供的信息非常有用,我已经读取到这些内容,并且知道联系方式是放在class为 12jsdsns 的div元素下,我将改进的脚本,直接以 12jsdsns 为关键字读取dom内容,这样子保证可以提取到正确的联系方式。”
看到这种乱码的 class 让我心头一紧,连忙打开Kimi。问它这是不是某种反爬机制。Kimi告诉我这种乱码的 class 可能是网页使用Vue或者RN编写在打包后得到的随机的class 名字。每次打包都会变。所以不能以此为关键字来提取消息。否则后边人家一重新打包就提取不出来了。
于是我再次告诫 Copliot 不要以特定的class和id去提取信息。这次大概只折腾了两个小时,这个插件终于比较完美了。
至于读取Excel并且批量发送数据,同样也是使用Agent模式写了一个python的GUI程序去成功实现了。
最后,再写写我个人的看法吧。
我周围的大部分人包括我,在使用Cursor这种带有Agent模式的功能的时候,说的最多的一句话就是:“怎么额度又空了!这个月才到五号啊。”
AI不是你的辅助工具,而是你雇佣的人。你雇佣人就要付工资,你用AI就要交Token钱。你用AI干活就是自己做老板雇佣工人干活。但是自己做老板真的只要掏钱就可以了吗?如果只用掏钱,什么都不管,什么方向都不指引。那勇哥说餐饮里怎么会倒闭那么多店铺呢。
我相信很多人都会有自知之明,认为自己不是个当老板的料子。不会管理人和店铺。但是在AI时代下,却有太多的人觉得自己什么都不会都没有关系,只要给AI付Token钱,事情自然就圆满了,自己等着数钱就好了。
同样开一个店,我会管理员工,可以雇佣两个员工就能维持店铺的运营并且赚到钱。而不会管理员工的人,没有基本知识储备的人,就算雇佣十个员工,也没法给员工以合理的方向,并且及时把走错路子员工拉回来。结果就是店铺的运营成本远远大于收入,关门走人。
使用AI也是同样的道理,我相信以后的发展趋势是AI的Token费用急速膨胀,而人力酬劳大幅下跌,最后发展到雇佣一个人和使用Token的费用达到平衡为止。而这些大模型公司将取代互联网新地主成为下一个时代的收租人阶级。
我在这里做一个推断。AI刚出来的那一两年,大部分公司都会鼓励员工使用AI,并且谁使用的Token越多,就越厉害,越有上升空间。而后AI时代,将彻底扭转这个评价。大家都在使用AI,你用的Token数量越少,就越为公司节省支出,然后才有晋升空间。
如果同样的酬劳,你每个月花的Token钱是别人的两倍,产出却是一样,那公司不裁你裁谁呢。