上一次测试auto-gpt0.2.2,发现1:不停地重复在网上找和下载文件,结果还是没有能力把指定文件下载下来。
2:我手动下载了文件,让它读取分析,发现读了之后马上报错自动退出了。说是提交给openai的token超字数了。。。
今天我又配置了当前最新的stable 0.3 auto-gpt,还是测试同样的任务,让它整理《红楼梦》中的小说人物关系图谱。
首先,发现下载文件还是下载不了。跟0.2.2很像。
没办法,我手动下载了文件给它。
然后,发现它执行代码一定要在docker运行。我查了代码,修改成直接可以运行了。
又然后,我发现它一直想执行还没保存的代码文件,我通过对话提示它先写好代码文件再执行文件。以后每次要执行代码我发现都要做这样的提示。显然里面有个逻辑问题。也许是execute_python_file命令应该对应一个新的文件,而execute_code应该创建一个新的文件,接的参数是代码内容,而不是文件名。操作的时候让代理先保存代码文件,然后执行。
又又然后,我发现在访问代码时,openai.error.APIConnectionError,不知道是不是网络环境问题,遇到这个问题程序就中止了。我修改了代码,让它遇到问题后重试。
最后,还是发现了tokens遇长的问题,我不知道哪里的代码又不严谨。。。到这里,愉快的一下午就快结束了。
看来这个任务还是很难完成。
目前看来,auto-gpt还十分不成熟,原因是,1里面的代码里的bugs非常多;2系统有几个如google查询,读写文件,执行代码等功能模块,但这几个模块的调动很不协调,操作很不连贯,它们的组合经常十分生疏,如同请一个有理论,但完全没有实践基础的几个技术人员一起完成一个大任务。
显然,在人工智能发展的路上,这些问题都会被解决。但现在而言,从效率角度看,在实际工作中用auto-gpt还是比较早的。auto-gpt在设计的时候,是用来完成通用任务的。我感觉现在来说,还需要很多的调整和磨合。让人工智能做不同的事,本身要学习经验。而让人工智能做重复的事,这可我感觉现阶段应该使用prompt+特定的任务代码+gpt的形式可能更实在一些。