两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
{dede:pagebreak/}
有哪些值得推荐的小型 C 语言开源项目?
如何评价前端框架 Solid?
以色列为什么突然敢打伊朗了?不怕被报复?
如何评价B站UP主「酒酿lily王」、「唐卡七」等穿搭类UP主被封禁?
2025 年 6 月,Rust 在 GUI 方面有何大的进展? 你最看好哪个框架?
中国大陆的苹果手机被阉割了哪些部分?
如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
中央多份重磅文件出台,密集释放「涨工资」「提高居民收入」的信号,这背后有何深意?
超级喜欢穿短裙正常吗?
你的低成本爱好是什么?
北京日报点名批评“苏超”过度娱乐化的动机是什么?
各位前端大触们,一般怎么定颜色的?
如何评价“寡姐”斯嘉丽·约翰逊的身材?
女生真正的完美身材是什么样子?
超级喜欢穿短裙正常吗?
Node.js是谁发明的?