核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
{dede:pagebreak/}
中国外交部及有关使领馆正迅速组织撤离在以、伊的中国公民,目前当地情况如何?
如何寻找到相对完整的真正的游戏的源码用来学习?
以色列为什么突然敢打伊朗了?不怕被报复?
有一个乌克兰的朋友问我,中国人凭什么能享受和平,我该怎么说?
慈禧为什么要反对戊戌变法?
为什么windows的arm版没有被广泛使用?
小米YU7从7月提前至6月底发布,是什么原因导致提前发布?
伊朗是个怎么样的国家?
***如发生战争,14 亿中国人每人捐款 1000 元,可以打几天?
如何看待 Mac mini M4 支持可更换 SSD?
你身边身材最好的女生是什么样?
Rust 使用 Result 的错误处理方式与 Golang 使用 error 的方式有什么本质区别?
Vue性能优于React,那为什么还不用Vue?
《西西里美丽传说》女主角,在当时打扮这么高调,不觉得带给自己很多不便吗?如何理解她的心态?
为什么人类喝地球的水需要过滤,而其他任何一种地球的生物可以直接喝地球的水?
微软宣布 5 月 28 日开始下架「Microsoft 远程桌面」应用,背后原因有哪些?