核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
{dede:pagebreak/}
编程问题哪里解决?
为什么是 9 月 3 日阅兵而不是 10 月 1 日国庆阅兵?
为什么软件公司很少用python开发web?
你们听过领导最没水平的一句话是什么?
什么是防抖和节流?有什么区别?如何实现?
LCD党真的只是少部分人吗?
为何中文互联网相对英文互联网的内容质量较低?
26日下午北京密云第一小学门口发生一起大型****** 请问你怎么看?
手机的运行内存真的有必要上16GB吗?
如何评价小米 6 月 26 日发布的小米 YU7、MIX Flip2、REDMI K80 至尊版?
超小团队选择Django还是Flask?
用JAVA实现一个IM的服务端,用什么框架比较好?数据库用什么比较好?
世界上存在动漫少女般完美的「身体」吗?
5 月 28 日 DeepSeek R1 模型完成小版本试升级并开源,具体有哪些提升?使用体验如何?
为什么微信不向telegram学习?
女子被闺蜜按水中后续如何?