两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
{dede:pagebreak/}
为什么说微软 Win11,有苹果 macOS 的感觉?
如何查看网站的SSL证书?
如何评价书籍《国家意志》?
为什么tokio能成为rust异步标准?
在excel中,如何利用VBA将这段数据转成json格式?
H264和H265谁画质好,求回谢谢!?
铁路12306是谁研发的?
如何评价字节跳动开源的 Netpoll?
作为一个服务器,node.js 是性能最高的吗?
太极是什么?为什么叫太极?
个人做量化,买不起专业数据库,如何获取 L2数据?
有一个***约你出去,你会去吗?
有没有pdf截图转文字的软件?
一台迷你主机的寿命是几年?
如何评价腾讯元宝桌面端使用 Rust 的 Tauri 框架?
评价一下Proxmox VE与ESXi的优劣?