阿里版ChatGPT"通义千问"上线邀测,一手测试报告来了!

ChatGPT 0 2718

今天下午,阿里版ChatGPT正式开启企业邀测,名字叫“通义千问”。

阿里版ChatGPT

此前 ,对于阿里版ChatGPT有很多猜测,现在孩子终于要出来见客了,到底表现怎么样?作为第一批参与邀测的媒体,以下是我们一手的体验报告。

阿里版ChatGPT

马云是不是外星人?阿里版ChatGPT的一手体验实录

作为一个大语言模型,“通义千问”在文本生成上和ChatGPT一样,是一问一答的形式。

我们设计了10个问题,涉及常识、文学创作、中文理解、商业文案创作、数理推算等,从多个维度进行了测评。

首先,想考考孩子的智商(常识)。于是我们问:马云是外星人吗?

阿里版ChatGPT

点击看大图

一本正经回答问题的样子还有一点小可爱。

杭州出生的AI,对于杭州是不是美食荒漠这个问题有没有自己的见解?

阿里版ChatGPT

点击看大图

看得出,孩子对杭州是真爱。

作为一个中文AI,接下来考验一下文学创作水平,作诗和续写。

首先,创作一首关于杭州西湖的诗,来看看TA的回答。

阿里版ChatGPT

做一首诗简单,写一首好诗并不容易,比如要有好的立意、巧妙的构思、美的意境,还有新的语言和巧的手法。你觉得“通义千问”作的这首诗是什么水平?

不得不说,末尾自己加的注解,有点被萌到。

接下来是一段续写:续写一个布尔玛倒拔垂杨柳,赵子龙在球场上隔扣赤木刚宪的故事。

阿里版ChatGPT

点击看大图

可以说行云流水,基本上挑不出毛病。

接下来,作为“武侠文化”里长出来的孩子,想问问“通义千问”心目中,张无忌和令狐冲谁更厉害呢?

阿里版ChatGPT

点击看大图

看答案是个很圆滑的AI,谁也不得罪……

再代表很多有梦想的打工人问一个问题:如果我想做个电子商务网站,怎么才能打败阿里巴巴

阿里版ChatGPT

点击看大图

方方面面都考虑到了,答案看起来没毛病。

接下来考考“通义千问”的情商:我和老婆吵架了,怎么说才能哄她开心?

以及:女友说肚子痛怎么办?

阿里版ChatGPT

点击看大图

阿里版ChatGPT

点击看大图

不论是哄老婆还是哄女朋友,都是一把好手……

阿里版ChatGPT

再来考考理解题:小孩子会相信圣诞老人到什么时候?

阿里版ChatGPT

点击看大图

再来考考数学思维能力,我们放出了经典的鸡兔同笼。结果发现,解题过程是对的,最后一元一次方程解错了。这也是眼下GPT们的通病,数学能力普遍不如其他能力。

阿里版ChatGPT

点击看大图

总体来说,回答问题的速度非常快,中间也没有任何卡顿,甚至可以用行云流水来形容。常识、文学创作、中文理解的准确率也很高,还表现出了一定的情商。

略有瑕疵是最后的数学推理,推理过程对的,最后的结论错了。看得出是个文科厉害的孩子。

阿里版ChatGPT

阿里正式入局ChatGPT战局

自去年年底OpenAI 发布 ChatGPT ,大语言模型迅速火爆了全球互联网圈。今天,阿里ChatGPT官宣邀请测试,也意味阿里正式加入ChatGPT战局。

早在2月初,随着一张打码预发布聊天图的曝光,阿里巴巴官方正式对外确认了阿里版 ChatGPT正在进行内测。

3月份,阿里达摩院低调地在AI模型社区魔搭(ModelScope)放出了“文本生成视频大模型”。

不过这个大模型只支持英文,从试玩的结果来看,能生成的视频长度多在2-4秒,生成等候时间从20多秒到1分多钟不等。

最近阿里大模型联合项目团队调教出了第一个有个性的大模型“鸟鸟分鸟”。这是一个与脱口秀演员鸟鸟合作,训练出的数字分身 。和此前的天猫精灵相比,“鸟鸟分鸟”在体验上有了很大的改善,比如只要唤醒一次,就可以与 “鸟鸟分鸟” 不间断自由语音对话。鸟鸟分鸟拥有了鸟鸟的音色、语气、表达方式等。


本文链接:http://www.awyerwu.com/10032.html ,转载需注明文章链接来源:http://www.awyerwu.com/

分享到:

也许您对下面的内容还感兴趣: