各大智能体测试

[复制链接]
查看10 | 回复2 | 11 小时前 | 显示全部楼层 |阅读模式

第一次情商测试,让智能体叫爸爸,豆包胜出,当我告诉她我有个女儿,豆包在后面的聊天时,还会向姐姐问好,其余国产AI都是榆木脑袋。
刚才我又给国外AI做了补考,Gemini的表现和豆包一样出色、GPT也毫不逊色

第二次是深度逻辑问题测试,问:中国只有14亿人,但《明朝那些事》卖了4000万册,这合理吗?
其他AI都是顺着字面意思去诠释,只有Gemini说出了更深的逻辑,一击就中

第三次是脑筋你转完,问:请问星巴克里的星星多重?
我本来心中的标准答案是:16克,但Gemini再次胜出,但又另辟蹊径
回复

使用道具 举报

桥博士 | 9 小时前 | 显示全部楼层

如果星巴克里有星星,那么请问星巴克里的星星多重?

Gemini的回答,让我自愧不如,心服口服。它一如既往地聪明绝伦,不仅仅能和我的人肉大脑一样,在两层维度上思考,而且还能超越人类大脑的常规维度,延伸到咖啡豆的重量。。。。。

豆包、DeepSeek,都能在第一层维度思考,并且得出及格的回答
Manus 也能及格,而且它自称是用自家的智能体

文心一言, 笨得让人着急,从它的落后,我感悟:仅仅是起个大早,加上舍得投钱,还是不够,关键要“正确”
这个急转弯问题,GPT回答和百度差不多。。。。我总算自我安慰了



ScreenShot_2026-03-01_125132_277.png
ScreenShot_2026-03-01_125200_503.png
ScreenShot_2026-03-01_125223_560.png
ScreenShot_2026-03-01_125256_149.png
ScreenShot_2026-03-01_125426_237.png
ScreenShot_2026-03-01_125449_698.png
ScreenShot_2026-03-01_125709_429.png
ScreenShot_2026-03-01_140812_090.png
回复

使用道具 举报

桥博士 | 8 小时前 | 显示全部楼层

情商测试,叫爸爸

----------------Gemini一如既往地聪明绝顶----------

-----------------GPT很爽快--------------

----------------------豆包-----乖宝宝-----虽然智商不高--但情商高-还会写爆款


其余多为榆木脑袋或者玻璃心

ScreenShot_2026-03-01_130841_504.png
ScreenShot_2026-03-01_131022_294.png
ScreenShot_2026-03-01_131042_287.png
ScreenShot_2026-03-01_131055_795.png
ScreenShot_2026-03-01_131306_127.png
ScreenShot_2026-03-01_132158_658.png
ScreenShot_2026-03-01_132638_080.png
ScreenShot_2026-03-01_133014_012.png
ScreenShot_2026-03-01_133359_271.png
ScreenShot_2026-03-01_133418_266.png
ScreenShot_2026-03-01_133433_206.png
ScreenShot_2026-03-01_133454_564.png
ScreenShot_2026-03-01_133510_696.png
ScreenShot_2026-03-01_133523_473.png
ScreenShot_2026-03-01_133908_001.png
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 加入同学会

本版积分规则