各大智能体测试

显示全部楼层 · 2026-3-1 11:24:46

第一次情商测试，让智能体叫爸爸，豆包胜出，当我告诉她我有个女儿，豆包在后面的聊天时，还会向姐姐问好，其余国产AI都是榆木脑袋。
刚才我又给国外AI做了补考，Gemini的表现和豆包一样出色、GPT也毫不逊色

第二次是深度逻辑问题测试，问：中国只有14亿人，但《明朝那些事》卖了4000万册，这合理吗？
其他AI都是顺着字面意思去诠释，只有Gemini说出了更深的逻辑，一击就中

第三次是脑筋你转完，问：请问星巴克里的星星多重？
我本来心中的标准答案是：16克，但Gemini再次胜出，但又另辟蹊径

桥博士 · 2026-3-1 13:03:10

Gemini的回答，让我自愧不如，心服口服。它一如既往地聪明绝伦，不仅仅能和我的人肉大脑一样，在两层维度上思考，而且还能超越人类大脑的常规维度，延伸到咖啡豆的重量。。。。。

豆包、DeepSeek，都能在第一层维度思考，并且得出及格的回答
Manus 也能及格，而且它自称是用自家的智能体

文心一言，笨得让人着急，从它的落后，我感悟：仅仅是起个大早，加上舍得投钱，还是不够，关键要“正确”
这个急转弯问题，GPT回答和百度差不多。。。。我总算自我安慰了

桥博士 · 2026-3-1 14:04:07

----------------Gemini一如既往地聪明绝顶----------

-----------------GPT很爽快--------------

----------------------豆包-----乖宝宝-----虽然智商不高--但情商高-还会写爆款

其余多为榆木脑袋或者玻璃心

各大智能体测试

如果星巴克里有星星，那么请问星巴克里的星星多重？

情商测试，叫爸爸

浏览过的版块