核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
{dede:pagebreak/}
目前最具性价比的全栈路线是啥?
请问有没有什么工具能够生成局域网的网络拓扑结构图?
如何评价“寡姐”斯嘉丽·约翰逊的身材?
美国真会下场对伊朗开战吗?
为什么《歌手》不请周杰伦、陈奕迅、王菲、张学友、孙燕姿、梁静茹、王力宏、林俊杰当节目嘉宾?
为什么微信不向telegram学习?
我国的军工能力可以实现一天5000枚火箭弹连着炸三个月吗?
俗话说“女人三十如狼四十如虎”,到底是不是真的??
Node.js是谁发明的?
请问一下图中***的名字,谢啦?
龙芯在.NET上帮微软做CPU指令集适配,为什么到国内.NET开发者这里成了维护龙芯.NET版本?
微软宣布 5 月 28 日开始下架「Microsoft 远程桌面」应用,背后原因有哪些?
以色列是如何从三天前的不可一世要灭了伊朗到今天的哭哭啼啼要“为生存而战”的?
为什么现在离婚率如此之高?
胸大的女孩会自卑 吗?
Electron 和当下其他的桌面开发方法相比如何?