石南跨境物流导航

网站目录

对GPT-4o的英文理解能力的独立测试

石南物流15072024-05-24 17:20:27

一个普通用户拉尔斯·维克(Lars Wiik)测试了GPT-4o的英文阅读能力。

测试的方法是：准备了200个英文句子，需要根据语义，对其归类。

(测试的原始数据，可在英文原文里可以找到。)

有些模型会对公开的测试材料进行部分训练，所以会导致答案不客观。

而作者用自己的私有材料，进行测试，答案会相对客观。

原贴地址： https://medium.com/@lars.chr.wiik/gpt-4o-vs-gpt-4-vs-gemini-1-5-performance-analysis-6bd207a2c580

评测材料说明

这份测试材料，由 200 个句子组成，分为 50 个主题，其中一些句子密切相关，旨在使分类任务变得更加困难。

所有的内容，都是拉尔斯·维克手动创建、标记的。

评测的模型

主要测评了openai的GPT-4产品和谷歌的2款产品(Gemini和Palm 2)

Gemini和Palm 2都是谷歌出品的AI产品。

Gemini侧重多模态(可以处理图片、文件、音视频等)，

Palm 2更侧重于文本和编程

详细模型：

GPT-4o: gpt-4o-2024–05–13

GPT-4：gpt-4–0613

GPT-4-Turbo: gpt-4-turbo-2024–04–09

Gemini 1.5 Pro: gemini-1.5-pro-preview-0409

Gemini 1.0: gemini-1.0-pro-002

Palm 2 Unicorn: text-unicorn@001

评测的结果

表现最好的工具是：GPT-4o，只出现了2个错误。

表现最差的是Gemini-1.0. 出现了12个错误。

说明：错误率越低，说明模型表现的效果越好。

对GPT-4o的英文理解能力的独立测试第1张

小结

本文作者对ChatGPT和谷歌的6个模型的文本做了独立的个人测试，测试方向是：文本理解能力。

最后的结果是：在英文文本理解方面，openai最新发布的GPT-4o效果最好。

这和官方公布的测评结果一致。

(下图为openai官方公布的测评结果)

对GPT-4o的英文理解能力的独立测试第2张

忍不住吐槽一下谷歌的Gemini

一个不喜欢Gemini的原因：经常会出现拒绝回答的情况。

前面聊的好好的，突然整这么一出。很让人不舒服。

对GPT-4o的英文理解能力的独立测试第3张

好工具推荐

ChatGPT

标签：ChatGPT

喜欢（0）
不喜欢（0）

本文链接：https://www.awyerwu.com/13708.html

上一篇惊天逆转？TikTok能否翻盘美国禁令？
下一篇亚马逊成本篇：亚马逊索赔的介绍及申请技巧

猜你喜欢

如何通过gpt-4o官方测评图表，寻找最适合自己的模型
本月，openai发布了最新的gpt-4o，并给出了文本评测的结果。通过这些统计数据，可以帮助我们选择最优的模型选择最优模型多任务语言理解上，建议选择 gpt-4o研究生水平、复杂任务上，最好哪个都别...
ChatGPT2024-05-23
手把手教你如何使用ChatGPT进行电商内容撰写
随着电商独立站的发展，越来越多的品牌理解到内容营销的重要性。虽然产品力十分关键，但仅仅依靠产品本身来吸引消费者的注意在如今远远不够。创建有价值的内容，解决不同群体特定的痛点，教育潜在客户、种草用户，并...
ChatGPT2024-05-23
AI（人工智能）写作的6个缺点
本文介绍了AI写作的6个缺点。总结这些缺点的目的是：了解AI的边界，从而达到更好利用AI工具的目的。并不是说有了缺点就不去用它了。个人的体验是：AI对于一些普通的问题、帮助学习新领域的知识方面，非常...
ChatGPT2024-05-04
ChatGPT 4.0如何使用多少钱！！！
ChatGPT 是 OpenAI 的一个语言模型，它是基于 transformer 架构训练的。它可以生成文本，回答问题，进行对话，以及执行其他语言任务。它是一种强大的 AI 技术...
ChatGPT2024-04-30
ChatGPT全教程(2024教程)：如何安装使用ChatGPT
ChatGPT是OpenAI研发的一款大型语言模型，凭借智能对话、文本生成、翻译等强大功能风靡全球。如何注册ChatGPT?本文将为读者提供详细的教程，带你顺利踏入ChatGPT的世界。ChatGPT...
ChatGPT2024-04-21
最佳AI工具：国外最新人工智能工具一览（2024）
在当今的科技世界中，人工智能(AI)已经成为了我们生活中不可或缺的一部分。它不仅改变了我们的生活方式，也正在逐步改变我们的工作方式。最近，ChatGPT等人工智能工具引起了广泛的关注和讨论，这无疑证明...
ChatGPT2024-04-21
探索OpenAI的革命性视频创作工具：Sora文生视频模型
随着人工智能技术的飞速发展，OpenAI再次引领了一场创新浪潮，推出了名为Sora的文生视频模型。这款工具不仅为视频内容创作者提供了前所未有的便利，也为AI专家开辟了新的天地。本文将深入探讨Sora是...
ChatGPT2024-04-18
GPT-4时代终结者 - Claude 3账号注册保姆级教程，一定要注意这5点，否则容易封！
近期，Anthropic发布了最新的Claude 3系列模型，一句话评价：真正全面碾压GPT-4!多模态和语言能力指标上，Claude 3都赢麻了。用Anthropic的话说，Claude 3系列模型...
ChatGPT2024-03-07
让中美差距拉大的Sora是什么？好莱坞和AI视觉创业公司会挂掉吗？
2月16日凌晨，OpenAI发布了自己的首个AI视频生成模型—Sora。这是一个历史性的里程碑，扩散模型结合OpenAI大获成功的transformer，在视觉领域实现了与大语言模型类似的突破。毫无疑...
ChatGPT2024-02-18
2023全球使用人数Top10的AI工具大盘点
2022年11月，AI聊天机器人ChatGPT横空出世，以其惊人的智能水平和人性化的交流风格，引发了科技界的轰动，也让AI聊天机器人成为了公众关注的焦点。众多创业者纷纷效仿，推出了各式各样的类似产品，...
ChatGPT2024-01-27

最新网址

最新文章

热门文章

随机文章

投放广告联系

QQ:1213848725 VX:pq041688

在线时间
13:00 ~ 2:00