体验阿里巴巴版ChatGPT,更智能还是更“智障”?

阿里近期大动作不断...阿里版ChatGPT来了!4月7日,阿里云宣布,大模型“通义千问”开始邀请测试,现阶段该模型主要定向邀请企业用户进行体验测试,这是继百度、360后,国内互联网大厂的又一玩家首秀。

  • 通义千问

通义千问是使用类似于 ChatGPT 的机器学习模型进行训练的。它可以回答复杂的问题,创建详细的文章,甚至编程。使用条款显示,该聊天机器人由阿里巴巴内部科研团队达摩院开发。今年 2 月,这家中国商业巨头证实其研究所正在构建一个 AI 聊天机器人。

体验阿里巴巴版ChatGPT,更智能还是更“智障”?

“通义千问”这个名字表达了这款人工智能语言模型的强大功能和广泛适用性。“通义千问”这个名字来源于两个方面,“通义”意味着该模型具有广泛的知识和普适性,可以理解和回答各种领域的问题。“千问”代表了模型可以回答各种问题。

  • 用户体验

收到了邀请码的网友进行了体验。

例如,有人针对“为什么爸妈结婚没有叫我参加婚礼?”这个问题,分别测试了通义千问、ChatGPT、文心一言的不同回答。值得一提的是,这是一个经常被网友用来“挑战”机器人的老问题。

体验阿里巴巴版ChatGPT,更智能还是更“智障”?

在过去的测试中,ChatGPT 和百度的文心一言基本都是把问题引申为“父母是离婚后的二婚 ”这么理解才算答对。而通义千问在这个问题上给出了比较符合日常逻辑的答案:父母结婚前你还没出生呢。网友一致表示,这种回答更符合中国人的生活场景与思考逻辑,也更有人情味。

网友搜寻了唐太宗和赵匡胤打仗的问题,“通义千问”明确了历史时序,没有像其它平台那样一本正经地胡说八道。

体验阿里巴巴版ChatGPT,更智能还是更“智障”?

在鸡兔同笼、青蛙爬井这样的数学应用题上,“通义千问”并没有比其它人工智能更智能,同样回答错误,这块恐怕还需要语义理解和CoT思维链技术的改进。

体验阿里巴巴版ChatGPT,更智能还是更“智障”?

用夹杂错误的提问,让它解读“乔治巴顿拿着苹果iPhone指挥部队”的情况,它编出了一个故事,显然,“通义千问”把iPhone当作当年摩托罗拉生产的SCR无线电话,放了进去。

体验阿里巴巴版ChatGPT,更智能还是更“智障”?

网友问了一个土味情话,它显然还看不懂“谐音梗”的意义。看来人工智能还不能在这方面替代人。

体验阿里巴巴版ChatGPT,更智能还是更“智障”?

值得一提的是,此前有博主测试了天猫精灵,阿里版ChatGPT语音助手,那位博主一共测试了15个问题,有10个的回答表现都优于竞品。而相比天猫精灵版本只是一个压缩定制的简单应用版本,而本次升级后邀请企业用户内测的通义千问,或许功能更加完整,体验更加智能。

可以预见的是,此番开放给阿里云的企业级客户,通义千问也将进入新一轮的迭代周期。

  • 体验感受

有网友认为通义千问”有优于其它文生文AI模型的地方,对可能的错误已经有所改进,有“智能”的进化,但在数学应用题解读、财报数据爬取等方面,还和其它平台一样,有改进的空间

体验阿里巴巴版ChatGPT,更智能还是更“智障”?

还有网友认为,阿里的通义千问和国外产品有差距,但这差距并非不可逾越。打个比方,如果OpenAI是90分,谷歌80分,那阿里的通义千问至少在及格线以上。

阿里云一直被作为阿里巴巴寻求未来发展的另一条增长曲线,加上其目前依然处于高速增长期,因此也被阿里巴巴寄予厚望。

而阿里巴巴全力构建自己的AI预训练大模型,显然是在其市场份额、AI中文语言大模型技术积淀等方面优势的基础上,进一步完善阿里云服务生态的重要举措。

体验阿里巴巴版ChatGPT,更智能还是更“智障”?

所有的互联网大厂、平台型科技企业在布局新型业务时,都有一个共同特点,那就是大开大合,首先考量的便是其生态延展性、平台开放性。

阿里云显然也不例外,而在通义千问的基础功能、数据、体验等逐渐完善后,其行业适配性、功能通用性也将被越来越多企业所应用,由此也势必会为其原本就数量庞大的企业用户,带来更大的商业价值。

虽然目前尚无官方数据表明,有多少企业客户加入了“通义千问”体验用户的行列。但是可以预见的是,阿里云通义千问正式发布后,将会迎来大语言模型产品应用的新一轮热潮。

作为国内头部的智能科技企业,阿里云是国内少有的既有头部市场份额规模,又能实现正向盈利的云计算企业之一。而在国际、国内语言大模型产品应用的商业模式尚且等待验证之时,阿里云已经借助其现有的企业客户资源,将其推向了市场,未来的发展,无疑也会快人一步。

你们对此有什么看法呢?

参考链接:https://zhuanlan.zhihu.com/p/620224083

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧