原因:
私企今天不放假,摸個魚平衡一下心理。
材料:
Google Gemini,Microsoft Copilot,IQ Test Made by Mensa Norway - Mensa Norway
方法:
截圖丟給AI,AI給哪個選項就哪個。Gemini支持ctrl+v,Copilot只能先存圖檔再上傳。
調整:
Gemini一開始加了一個prompt “Return answer only. Do not show explanation.” 出現選項E的次數高達八成。重新開始後不加prompt,只給截圖,結果比較正常,可能說明推導過程對AI有幫助?
Copilot不給prompt的話會說這是一個IQ test但是讓你自己想……加了一個"Solve the following IQ test puzzles."
觀察:
Gemini一開始用英文推理,玩著玩著忽然變成了簡體中文。
推理過程都亂七八糟,甚至有推導結果和答案字母不一致的情況,Gemini尤甚。以最終答案字母為準,學校考試計算對了但選錯選項也不給分吧。
正確答案先不說,選項B肯定沒有圓形:
Gemini達不到人類平均水平的IQ100:
Copilot也不行:
結論:
人工智障。
樓主的得分:
關你屁事。
3 个赞
258
2024 年10 月 14 日 17:40
4
gpt o1呢
很怀疑一段输入里的cot能不能真的起到cot的作用
just did it… 133
我感觉任何一个接受理工科大学教育的都能有这个数… 真很简单啊
时间限制还挺多的,我没注意看时间限制,去teams回了几个消息才发现已经开始了,最后也有几道题没想明白,只有128
jxm
2024 年10 月 14 日 18:20
10
真正的门萨测试题四分之一是单词找近义词四分之一是阅读逻辑推理,跟考公务员和征兵测试差不多 这些题目ai应该是乱杀的
小年轻还没看清他的智商税(pun intended lol)本质的时候考过一次
那對母語使用者不是比較有利。感覺還是單純圖形比較公平。
jxm:
征兵测试
當年生詞部分九成靠猜……
ASVAB有語文部分是正常的,畢竟不能讓說明書都讀不懂的人去修重要的東西。但Mensa標榜只看IQ就不應該測語文了。
jxm
2024 年10 月 14 日 18:31
14
当初要是ASVAB分再高点我现在大概就是MAVNI美国大兵了,就不用等傻逼perm了
我理解他想要全面的考逻辑能力不能只是图形推理吧
然而ASVAB生詞猜完後我還是AIT的distinguish grad,學科測驗時只要會ctrl+c ctrl+f ctrl+p就好
jxm:
智商税(pun intended lol)本质
不把free ver弄简单一点,怎么吸引你付钱去考std ver呢
要是費用能便宜一點我倒是想體驗一次,畢竟Mensa名聲在外。
TBS
2024 年10 月 14 日 19:20
18
otonoco:
任何一个接受理工科大学教育
这预设就很难达到了。你让滴滴司机或者商k小妹来做可能也就80
1 个赞