您的位置：首页 >财经 >

GPT-4“自我反思”后能力大增，测试表现提升30%

来源：IT之家时间：2023-04-09 10:45:46阅读量：15120

，OpenAI 最新的语言模型 GPT-4 不仅能够像人类一样生成各种文本，还能够设计和执行测试来评估和改进自己的表现。这种“反思”技术让 GPT-4 在多项难度较高的测试中，都取得了显著的进步，测试表现提升 30%。

GPT-4 是继 GPT、GPT-2 和 GPT-3 之后，OpenAI 推出的最先进的系统，也是目前最大的多模态模型。其利用深度学习技术，使用人工神经网络来模仿人类的写作。

研究人员诺亚?辛恩和阿什温?戈平纳特(Ashwin Gopinath)在论文中写道:“我们开发了一种新颖的技术，让 AI 代理能够模拟人类的自我反思，并评估自己的表现。GPT-4 在完成各种测试的时候，会增加一些额外的步骤，让它能够自己设计测试来检查自己的答案，找出错误和不足之处，然后根据发现来修改自己的解决方案。”

在 HumanEval 编码测试中，GPT-4 使用自我反思环路，准确率从 67% 上升到 88%

GPT-4 可以通过设计和执行测试来批判其自身的性能，如 AlfWorld 测试结果所示，可以大大改善其性能

研究团队使用这种技术对 GPT-4 进行了几种不同的性能测试。在 HumanEval 测试中，GPT-4 需要解决 164 个从未见过的 Python 编程问题，原本准确率为 67%，使用反思技术后，准确率提升到了 88%。在 Alfworld 测试中，AI 需要在各种不同的交互环境中，通过执行一些允许的操作，来做出决策和解决多步任务。使用反思技术后，GPT-4 的准确率从 73% 提高到了 97%，只有 4 个任务失败。在 HotPotQA 测试中，GPT-4 可以访问维基百科，并回答 100 个需要从多个支持文档中解析内容和推理的问题，原本准确率为 34%，使用反思技术后，准确率提高到了 54%。

声明：以上内容为本网站转自其它媒体，相关信息仅为传递更多企业信息之目的，不代表本网观点，亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险，需谨慎。

热门资讯

601138工业富联3月24 2022年3月24日工业富联（60113...
陈小春开启京东汽车超级直播夜 11月9日晚18点，京东汽车11.11超...
挑战善行者丨2021速8酒店 热爱不止，善行不息善行者是一种勇气善行者...
布局宠物蓝海市场安心养宠物计 京东健康宠物医院作为安心养宠物最重要的升...

文章排行

图片新闻

苏炳添用9秒83的佳绩带领亚 每0.01秒的提升都是汗水与泪水...
4×100米接力决赛中国男 4×100米接力·决赛中国女队4...
JBL/UA PROJECT 在这七月热汗运动季，由高保真至潮...
中国队“00后”纷纷登上东京 杨倩、管晨辰、李雯雯、全红婵……...

精彩新闻

体育赛事招商的三大注意事项 今年4月姚明和篮协对CBA商务开发权的争...
传统体育文化的两大现代价值 中国传统体育文化丰富多彩，内容博大精深，...
当今世界体育对人的价值体现在 不知你想过没有，在当今这个高度互联网化、...
体育分析中机器学习的标准：预 运动分析有相当一部分属于机器学习，即从数...
进行冬奥会体育营销的五个关键 明年冬奥会将在北京和张家口举行，关于奥运...
父母如何从家庭教育当中反思自 某天晚上睡不着，忽然想到能够写这么一个角...
思维教育对幼儿的四大好处 思想教育对幼儿的益处，幼儿思想处于直观行...
父母教育孩子前必须要知道的前 网上的很多文章提到过，一些懵懂型鸡娃的家...
华为是第一大客户EDA第一股 在半导体芯片设计领域，EDA软件也是卡脖...
新的设计和技术风向奥迪gra 2021年9月3日消息，奥迪将在2021...