2023-07-09 12:40 | 出处: AIGC
来源:新智元
坐等3个多月,ChatGPT「代码解释器」终于全面开放了,一大波魔法来袭。
家人们,终于来了!
刚刚,ChatGPT「代码解释器」测试版正式向所有Plus用户开放。
OpenAI的科学家Karpathy对此还宣传了一波,代码解释器测试版相当强大。
它是你的个人数据分析师:可以读取上传的文件、执行代码、生成图表、统计分析等等。我预计社区将需要一些时间来充分展示其潜力。
前段时间,GPT4能力下降在网上引起轩然大波,甚至有人只觉得它比GPT3.5强一点点。
而现在,代码解释器让人们再次感觉到,那个熟悉而且强大的GPT-4又回来了!
插件一上线,许多网友纷纷上手实测了一番。
那么,「代码解释器」究竟能做什么?
这不,有网友竟用ChatGPT把图片变成了视频。这效果简直比Midjourney、Runway还炸裂。
这是如何做到的?网友给出了全套教程。
第一步:打开「代码解释器模型」。要启用它,请进入设置 -> 测试版功能 -> 代码解释器。
步骤二:
从下拉菜单中选择「代码解释器」选项。然后,上传你想做动画的图片。
步骤三:
我想展示一家豪华餐厅的一些食物。因此,我要求ChatGPT将这个食物图片从左到右制作成动画。通过修改我的GPT提示(见下文),你可以创建你自己的动画。
具体prompt如下:
步骤四:
按回车键。30秒后,ChatGPT会给你一个视频的下载链接。
联合创始人Greg Brockman转发称,在不可能记住ffmpeg调用的情况下,用于图像转换的代码解释器。
事实证明,「代码解释器」确实很牛,现在截个视频,只需要一句话就能搞定了。
「有一定内存容量限制,不过处理小文件是没问题了。刚扔给TA 4秒钟的gen-2视频,截取前两秒,没问题,迅速搞定。
会自动试验合适的代码,如果要编程序也完全可以先扔给ta某一文件提出要求,然后看看ta提供出来的代码」。
国内知名互联网科技博主「宝玉」用「代码解释器」实现了把PDF转成图片。
以往需要将每页内容合并成一张图,而现在,一个prompt就搞定了。
图片变视频之外,还可以实现GIF变视频。
网友给ChatGPT的提示为:我上传一个GIF,你给我一个5s的MP4,用一个故事性镜头缓慢放大。
上传GIF
最后ChatGPT立即生成了视频
,时长00:05
此外,ChatGPT还能做个「矩阵」GIF出来。
在前两天,OpenAI宣布ChatGPT「代码解释器」即将全面开放。
就展示了一个能够生成QR码的例子,短短一句话,简直动嘴就能完成任务。
代码解释器最大的用例就是进行数据分析。
比如,让它分析各国预期寿命数据,世界上最大的城市,(可上传CSV、word、PDF或视频文件)
然后,与数据交谈,问任何你可能想问的问题。
或要求从数据中提取独特的随机趋势,以获得惊喜。
比如,从两个数据中找出独特的趋势,并以表格的形式显示出来。
最后一步,可视化。
把数据变成你想要的任何图表或图形。最重要的是,只需点击一下完成。
比如,生成一个散点图,说明一个国家的人均GDP和其平均预期寿命之间的关系。
看到这么强大「数据分析师」,网友又开始R.I.P了。
「代码解释器」怎么用?来自沃顿商学院的一位教授Ethan Mollick专门为此写了一篇指南。
首先,Mollick就指出,Code Interpreter这个名字的起法延续了OpenAI给他们自己的产品起烂名儿的悠久传统。
因为——虽说它叫「代码解释器」,但实际上它对那些根本不懂编程的人最有用。
本质上,「代码解释器」能让GPT-4上传和下载信息,并为用户编写和执行程序,这使得AI能够做到以前无法做的各种事情。
具体来说,它为AI提供了一个解决问题的通用工具箱(通过用Python编写代码)、超大内存(最大100MB,可以是压缩形式),且用户可以把这个工具箱集成到AI里面,发挥LLM的优势。
这有助于解决以前版本的 ChatGPT 存在的许多问题。比方说,
它允许AI处理数学(哪怕很复杂),还能更准确地处理单词(例如实际计算段落中的单词),底层原因就是,它可以编写Python代码来解决LLM在数学和语言方面的天然弱点。
比如像下图这样。
可以看到,「代码解释器」能准确计算出段落中单词的数量。
此外,「代码解释器」降低了幻觉和瞎编乱造的发生机率。
当人工智能直接使用Python时,代码有助于让它「诚实」。道理也很简单,如果代码不正确,Python就会报错。由于代码操作的是数据,因此AI不会在数据中插入错误信息。
当然,这并不完美。AI仍然有概率会产生幻觉,但其实这并不常见,并且不太可能影响到代码或者数据本身。
这样一来,AI就更加靠近通用人工智能了——大量问题可以通过代码来解决。
而且,GPT-4非常擅长以新颖有趣的方式来决定什么时候用「代码解释器」。
Mollick举了个例子,假如他让GPT-4向用户证明地球是圆的,那么就会用上「代码解释器」,提供了多个论证,将文本与代码和图像结合在一起。
此前,各个专业需要编程的人都得会点儿写代码,但写完了还得自己调试。就算之前的AI能提供点儿帮助,但是对于没有Python学习基础的人来说,还是挺难,得借助AI的力量反复修改代码。
而现在,有了「代码解释器」,AI就能自己纠错并且Debug了!
接着,Mollick又讲了如何用「代码解释器」来处理数据,这算是真实戳中大量用户痛点了。
Mollick表示,「代码解释器」的运行水平非常先进,可以自动处理许多复杂的定量分析,并且能够采用非常复杂的数据方法。
用户只需点击加号即可轻松上传数据,甚至是ZIP文件等压缩数据。
同时,在提供数据时,用户能给个prompt就最好了。然后,AI就可以从上下文里找出数据含义和结构了!
此外,Mollick指出,在使用「代码解释器」时,用户更多的是在和AI进行「对话」,并不需要绞尽脑汁写一个又严谨又凝练的prompt出来。
就像和一个数据分析师聊天一样,和人怎么交谈,就怎么跟「代码解释器」沟通。
但是这里有两个特殊情况,还是需要写个类似prompt的东西。
一个是AI有时候会不记得自己能干什么,此时就需要一个prompt来给AI点醒。
比如:「你可以制作GIF,请尝试一下。」
另一种情况是在用户对结果不满意的时候,可以通过prompt来让「代码解释器」对结果进行优化。
比如:「请对该结果进行进一步的测试」,或者,「能不能让这个图表更好一点」。
在加载完数据以后,GPT就可以执行数据合并和清理的操作了。具体处理方式相当复杂,但就像上面所提到的一样,只要把「代码解释器」当做一个和你面对面的数据分析师就好了。
同时,Mollick提醒广大用户,AI在自我纠错并改正以后最好还是查一下结果,万一出错呢。
紧接着Mollick实操了一下,他让「代码解释器」搞个预测建模出来,预测超级英雄可能会有什么超能力。
可以看到,「代码解释器」构建了一个随机森林分布器。
当然,在实操过程中,用户还是得和GPT「多沟通」。Mollick就不想让AI用数值数据的方法来估算缺失的数据,Mollick想直接放弃掉没有的部分。
但他指出,也可以和GPT说,让它换个别的处理方法。
之后,Mollick给GPT输入了一个「你可以进行另一个复杂和有趣的分析吗」的prompt。他表示,「代码解释器」选择的一些分析方法让他印象深刻。
就像下图这样。
「代码解释器」巧妙地分析了超级大国的网络情况。可以看到,方法多样,而且非常有意思。
「代码解释器」最令人印象深刻的应该就是其推理能力了。Mollick概括为,非常「人性化」。
另外,可视化的交互性水平依然在线,且在不断提升。用户可以不断让AI来改进或者更改输出的内容。
Mollick让AI创建了一个交互式表格,包括6个图表,其中还有一个是3D的。
为了让图表更加美观,Mollick不断输入prompt,调整结果。
最终成果就像下图右边这样。
网友@GPTDAOCN近日总结了ChatGPT十大令人震惊的用例:
代码解释器的可视化
1. 将GIF转换为MP4:可以将动态图片(GIF)转换为视频文件(MP4)的功能,使你更方便地分享和使用。
2. 创建各种图形:你可以利用这个功能来生成各种如柱状图、折线图、饼图等图形,直观地呈现和分析你的数据。
3. 从图像中提取颜色以创建PNG调色板:这个功能可以从任何一张图像中提取主要颜色,然后生成一个PNG格式的调色板。
4. 清洗数据以生成深入的可视化:如果你有一些混乱的数据,这个功能可以帮你进行清洗和整理,再将其转换为清晰的可视化图形。
5. 将CSV文件转换为GIF:这个功能可以将CSV(逗号分隔值)文件中的数据以动态的方式展示,生成一张GIF图。
6. 分析歌单以概括你的音乐品味:你可以利用这个功能来根据你的音乐歌单进行分析,从而概括你的音乐品味。
7. 将你的数据集转换为一个完全功能的HTML网站:这个功能能将你的数据快速转换成一个功能齐全的网站,方便你进行展示和分享。
8. 创建可下载的股票数据集:这个功能能帮你创建一份股票数据集,并且这个数据集是可以下载的,方便你进行更深入的分析和研究。
9. 将图像转换为文本文件:如果你需要从图像中提取文字,这个功能可以帮你将图像中的文字转换成文本文件。
10. 对未格式化的数据进行详细分析:对于那些没有规定格式的原始数据,这个功能能帮你进行深入的分析,以获取有价值的信息。
其实,代码解释器的用例远不止这些。
网友点评
我正在尝试ChatGPT代码解释器。到目前为止,我只能建议「每个开发者现在就开始研究它」。
Code Interpreter断了多少人的生路?太多行政每天低效率的处理数据,现在只需要自然语言就可以办公自动化。
参考资料: