数据分析师噩梦?ChatGPT实时互动分析Excel数据,网友挖出背后新模型

IT知识
42
0
0
2024-11-02

新智元报道

编辑:桃子 好困

【新智元导读】GPT-4o之后,ChatGPT又迎来更新。这次,数据分析能力再上一个新台阶,将支持谷歌、微软在线文档上传,并实时交互,自定义图表。更重要的是,网友已经灰度测试到背后的新模型了。

ChatGPT更强了...

刚刚,OpenAI再次放出大招——ChatGPT可以直接打开线上数据文件,完成实时数据分析。

全新的增强功能,具体包括:

- 直接从Google Drive和Microsoft OneDrive上传最新版本的文件

- 在新的可扩展视图中与表格和图表进行交互

- 自定义并下载图表,用于演示文稿和文档

现在,ChatGPT可以支持单个/多个文档上传,通过写Python代码,即可分析数据。

不管是多么复杂的数据任务,它都可以轻松搞定,比如合并处理数据集,并创建图表,提供数据洞察。

「世界上某处的咨询分析师,刚刚流下了一滴幸福的泪水」。

还有网友表示,「OpenAI这一招又将扼杀许多初创公司了」。

ChatGPT这一强大能力,据称是在新模型加持下完成的。

同在今天,网友纷纷晒出自己灰度测试到的新模型ADA V2(GPT-4),而且它的编码能力非常强大。

GPT-4o发布会才过去三天,OpenAI不间断给每个人惊喜和震撼,而更强大「GPT-5」或许就等着我们呢。

一些免费用户已经灰度测试到GPT-4o

爆料人Flowers称,「GPT-5将会增加一种全新的模型,到目前为止还没人考虑过」。

微软谷歌「办公全家桶」,文件上传一键分析


ChatGPT数据分析能力,表现如何?

从Google Drive和Microsoft OneDrive添加文件

以往,若想让ChatGPT分析数据,唯一的入口是,上传电脑本地的文档。

这时,就需要,将文件下载到本地,然后再上传到ChatGPT。

单个文件还好,如果有数百个文件,就很麻烦了。

而现在,人们可以将Google Drive和Microsoft OneDrive关联ChatGPT,登录成功后,可以选择在线的文件了。

包括微软的Excel、Word、PPT,还有谷歌的Sheets、Docs、Slide,都可以一键上传。

如下图演示中,关联了谷歌账号。

然后,选择自己在线文件中的一个表格文件,然后就可以问ChatGPT任何信息了。

实时处理表格

此外,当你上传数据集后,ChatGPT便会创建一个交互式表格。

然后,可以选取表格中任何一部分,与ChatGPT进行互动。

比如,选取如下表格中的「类别」一列,让后让ChatGPT找出表中哪个类别花费最高。

然后,ChatGPT立刻分析得出了结果,还可以做出可视化的表格。

另外,你还可以从ChatGPT的建议提示中选择数据,进行更深入的数据分析。

自定义可供演示的图表

第三个新能力,便是自定义可供演示的图表。

也就是说,你可以让ChatGPT去生成条形图、折线图、饼图和散点图等形式,并可以与其交互。

比如,要求ChatGPT「按组群绘制保留率图表,并撰写几个简短的要点」。

随后,ChatGPT就给出了所示的图表。

你还可以在右上角的设置中,选择曲线标注的任意颜色,并下载图表,以便在演示文档中使用。

最后所有人担心的数据隐私问题,OpenAI称,他们不会用ChatGPT团队和企业客户的数据进行训练,ChatGPT Plus用户可以通过「数据控件」选择关闭数据用于训练的选项。

新模型ADA V2灰度测试中


GPT-4o刚刚上手没几天,ADA V2(GPT-4)又出现了,全网都在寻找这个新模型的蛛丝马迹。

有网友表示,ADA就是代表着Advanced Data Analysis V2,就是让ChatGPT分析数据变强大的主要原因。

还有人分析代码后得出,gpt-4-ada-v2模型有128k上下文,被标记为「机密」,看起来是内部开发的原型。

这似乎是一次意外的发布。

或许gpt-4-ada-v2还是一个嵌入模型。

用Reddit数据训LLM

OpenAI的数据版图,又扩大了一块。

几天前,OpenAI刚刚公布了与Stack Overflow的合作,却遭到了社区人员的反对。

有人甚至要把自己所有的回答,一一删除。

而今天一早,OpenAI再次宣布与另一个著名的AI社区Reddit合作,预计将Reddit内容用来训练ChatGPT。

OpenAI官博还为自己使用数据,找了一个非常高大上的理由:

Reddit是一个庞大而活跃的社区,长期以来一直是互联网上重要的对话空间。 保持互联网开放至关重要,开放的一部分意味着需要让Reddit的内容对那些致力于人类学习和研究如何在线构建社区、归属感和赋权的人士开放。

不仅如此,使用LLM、ML和AI技术可以帮助Reddit改善用户体验。

这项合作,将为用户群体带来诸多好处:

- OpenAI将把改进后的Reddit内容带到ChatGPT和新产品中,帮助用户发现并参与Reddit社区。

为此,OpenAI将访问Reddit的数据API,该API提供来自Reddit的实时、结构化和独特的内容。这将使OpenAI的人工智能工具更好地理解和展示Reddit内容,尤其是关于最新话题的内容。

「简之,我要用你们的数据,清洗过滤后,以训练自家的模型」。

- 这项合作还将使Reddit能够为Redditors和版主带来新的基于AI的功能。Reddit将基于OpenAI的人工智能平台,实现其强大的愿景。

「我用自己的AI能力和你的数据交换,这样,能够赋能Reddit全新的AIn能力」。

- 最后,OpenAI将成为Reddit的广告合作伙伴。

OpenAI首席运营官Brad Lightcap表示,「我们非常高兴能与Reddit合作,利用独特的及时且相关的信息来增强ChatGPT,并探索利用AI驱动的功能丰富Reddit体验的可能性」。

与此同时,Reddit联合创始人CEO对这项合作,也发表了自己的看法:

Reddit已经成为互联网上最大的开放档案库之一,汇集了关于任何事物的真实、相关的人类对话。将其纳入ChatGPT符合我们对互联互通的信念,帮助人们更容易找到他们想要的信息,并帮助新用户在Reddit找到社区。

有网友表示,现在谷歌对Reddit的访问量增加了5亿。

谷歌现在充斥着越来越多的Reddit搜索结果,排在前3名。这在某种程度上是让更多用户使用Reddit的交易的一部分,因此谷歌获得了更多的数据。

而现在,这一切数据,都要交给OpenAI了。

不知,这次AI社区研究人员对此的反应如何?

参考资料:

https://openai.com/index/improvements-to-data-analysis-in-chatgpt/

https://x.com/OpenAI/status/1791227287569932368

https://x.com/OpenAI/status/1791205420142670250

https://x.com/nanulled/status/1791232438334566783