当前位置：首页 > news >正文

第二弹 llama.cpp控制参数

news 2025/7/7 9:45:50

llama.cpp控制参数有哪些？有什么作用？

二、控制参数解析

以下对 llama_cli的控制参数进行解析。

参数	取值	含义	备注



--temp N	浮点型 0～N	调整生成文本的随机性（默认值：0.8）	温度是一个超参数，用于控制生成文本的随机性。它影响模型输出令牌的概率分布。较高的温度（例如1.5）使输出更具随机性和创造性，而较低的温度（如0.5）使输出更有针对性、确定性和保守性。默认值为0.8，它在随机性和确定性之间提供了平衡。在极端情况下，0的温度总是会选择最有可能的下一个令牌，从而在每次运行中产生相同的输出。
--repeat-penalty	1.0～N	控制生成的文本中令牌序列的重复（默认值：1.0，1.0=禁用）。	默认是1.0，禁用重复输出。“重复惩罚”选项有助于防止模型生成重复或单调的文本。较高的值（例如1.5）将更严厉地惩罚重复，而较低的值（如0.9）将更宽容。默认值为1。
--repeat-last-n N	整形 -1 0～N	最后n个用于惩罚重复的令牌（默认值：64，0=禁用，-1=ctx大小）。	“repeat-last-n”选项控制历史中要考虑惩罚重复的令牌数量。较大的值将在生成的文本中向后看，以防止重复，而较小的值将只考虑最近的令牌。值0禁用惩罚，值-1设置被认为等于上下文大小的令牌数量（“ctx大小”）
--penalize-nl	无	在应用重复惩罚时允许对换行符的惩罚。默认是false：禁用。	默认的取值是false。将换行符视为可重复的标记。设置此参数则为true。
--top-k N	整形 0～N	将下一个令牌选择限制为K个最可能的令牌（默认值：40）。	Top-k采样是一种文本生成方法，仅从模型预测的前k个最可能的令牌中选择下一个令牌。它有助于降低生成低概率或无意义代币的风险，但也可能限制输出的多样性。top-k的较高值（例如100）将考虑更多的标记，并导致更多样化的文本，而较低的值（例如10）将关注最可能的标记并生成更保守的文本。默认值为40。
--top-p N	浮点型 0～1.0f	将下一个令牌选择限制为累积概率高于阈值P（默认值：0.9）的令牌子集。	Top-p采样，也称为核采样，是另一种文本生成方法，它从累积概率至少为p的令牌子集中选择下一个令牌。这种方法通过考虑令牌的概率和要采样的令牌数量，在多样性和质量之间实现了平衡。top-p的值越高（例如0.95）将导致文本更加多样化，而值越低（例如0.5）将产生更集中和保守的文本。默认值为0.9。

http://www.mrgr.cn/news/52925.html

相关文章：

innovus：设置长tree用的delay corner

工业相机选型（自用笔记）

张三并发编程实践：掌握多线程技巧，打造高性能应用！

从0到1训练大模型之探索混合专家模型：动态门控机制与高效计算

Yoga C740-14IML(81TC)恢复预装OEM原厂Win10系统镜像下载

Palo Alto Networks Expedition 远程命令执行漏洞复现(CVE-2024-9463)

Stereo-seq 中， CID 和 MID 之间的区别

睿港国际移民携手iHouse，推出“买房送日本经营签证”计划，畅享大阪生活

repo 命令大全详解（第十一篇 repo init）

Digicert SSL证书

自动化工具：Ansible

论文阅读（十六）：Deep Residual Learning for Image Recognition

k8s部署Kafka集群超详细讲解

软考中级考试入门学习，超详细知识点总结

富格林：可信措施杜绝虚假伎俩

Redis——事务

【2023工业图像异常检测文献】DiffusionAD: 基于规范引导单步去噪的扩散模型异常检测方法

（11）(2.1.5) Currawong Velocity CAN ESCs（二）

MySQL数字函数详细学习要点

VCLP使用指南-3.阅读和构建设计（3）