体验阿里巴巴版ChatGPT，更智能还是更“智障”？

阿里近期大动作不断...阿里版ChatGPT来了！4月7日，阿里云宣布，大模型“通义千问”开始邀请测试，现阶段该模型主要定向邀请企业用户进行体验测试，这是继百度、360后，国内互联网大厂的又一玩家首秀。

通义千问是使用类似于 ChatGPT 的机器学习模型进行训练的。它可以回答复杂的问题，创建详细的文章，甚至编程。使用条款显示，该聊天机器人由阿里巴巴内部科研团队达摩院开发。今年 2 月，这家中国商业巨头证实其研究所正在构建一个 AI 聊天机器人。

“通义千问”这个名字表达了这款人工智能语言模型的强大功能和广泛适用性。“通义千问”这个名字来源于两个方面，“通义”意味着该模型具有广泛的知识和普适性，可以理解和回答各种领域的问题。“千问”代表了模型可以回答各种问题。

收到了邀请码的网友进行了体验。

例如，有人针对“为什么爸妈结婚没有叫我参加婚礼？”这个问题，分别测试了通义千问、ChatGPT、文心一言的不同回答。值得一提的是，这是一个经常被网友用来“挑战”机器人的老问题。

在过去的测试中，ChatGPT 和百度的文心一言基本都是把问题引申为“父母是离婚后的二婚 ”这么理解才算答对。而通义千问在这个问题上给出了比较符合日常逻辑的答案：父母结婚前你还没出生呢。网友一致表示，这种回答更符合中国人的生活场景与思考逻辑，也更有人情味。

网友搜寻了唐太宗和赵匡胤打仗的问题，“通义千问”明确了历史时序，没有像其它平台那样一本正经地胡说八道。

在鸡兔同笼、青蛙爬井这样的数学应用题上，“通义千问”并没有比其它人工智能更智能，同样回答错误，这块恐怕还需要语义理解和CoT思维链技术的改进。

用夹杂错误的提问，让它解读“乔治巴顿拿着苹果iPhone指挥部队”的情况，它编出了一个故事，显然，“通义千问”把iPhone当作当年摩托罗拉生产的SCR无线电话，放了进去。

网友问了一个土味情话，它显然还看不懂“谐音梗”的意义。看来人工智能还不能在这方面替代人。

值得一提的是，此前有博主测试了天猫精灵，阿里版ChatGPT语音助手，那位博主一共测试了15个问题，有10个的回答表现都优于竞品。而相比天猫精灵版本只是一个压缩定制的简单应用版本，而本次升级后邀请企业用户内测的通义千问，或许功能更加完整，体验更加智能。

可以预见的是，此番开放给阿里云的企业级客户，通义千问也将进入新一轮的迭代周期。

有网友认为通义千问”有优于其它文生文AI模型的地方，对可能的错误已经有所改进，有“智能”的进化，但在数学应用题解读、财报数据爬取等方面，还和其它平台一样，有改进的空间。

还有网友认为，阿里的通义千问和国外产品有差距，但这差距并非不可逾越。打个比方，如果OpenAI是90分，谷歌80分，那阿里的通义千问至少在及格线以上。

阿里云一直被作为阿里巴巴寻求未来发展的另一条增长曲线，加上其目前依然处于高速增长期，因此也被阿里巴巴寄予厚望。

而阿里巴巴全力构建自己的AI预训练大模型，显然是在其市场份额、AI中文语言大模型技术积淀等方面优势的基础上，进一步完善阿里云服务生态的重要举措。

所有的互联网大厂、平台型科技企业在布局新型业务时，都有一个共同特点，那就是大开大合，首先考量的便是其生态延展性、平台开放性。

阿里云显然也不例外，而在通义千问的基础功能、数据、体验等逐渐完善后，其行业适配性、功能通用性也将被越来越多企业所应用，由此也势必会为其原本就数量庞大的企业用户，带来更大的商业价值。

虽然目前尚无官方数据表明，有多少企业客户加入了“通义千问”体验用户的行列。但是可以预见的是，阿里云通义千问正式发布后，将会迎来大语言模型产品应用的新一轮热潮。

作为国内头部的智能科技企业，阿里云是国内少有的既有头部市场份额规模，又能实现正向盈利的云计算企业之一。而在国际、国内语言大模型产品应用的商业模式尚且等待验证之时，阿里云已经借助其现有的企业客户资源，将其推向了市场，未来的发展，无疑也会快人一步。

你们对此有什么看法呢？

参考链接：https://zhuanlan.zhihu.com/p/620224083

{{userData.name}}已认证