3.参数说明
3.1.输入参数
数据类型列中各字段的含义如下所示:
- string表示字符串类型;
- array在Python中表示列表,在Java中表示ArrayList;
- integer表示整数型;
- float表示浮点型;
- boolean表示布尔型;
- object表示哈希表。
参数 | 数据类型 | 默认值 | 说明 |
---|---|---|---|
model(必选) | string | 无 | 指定用于对话的通义千问模型名。如 : qwen-max, qwen-plus, qwen-turbo |
messages | array | 无 | messages :用户与模型的对话历史。 |
prompt | string | 无(与messages不可同时为空) | |
seed(可选) | integer | 生成时使用的随机数种子,用于控制模型生成内容的随机性。seed支持无符号64位整数。 | |
max_tokens(可选) | integer | 1500或2000 | Java SDK中为 maxTokens 。指定模型可生成的最大token个数。 qwen-turbo 最大值和默认值为1500 tokens。qwen-max 、qwen-max-1201 、qwen-max-longcontext 和qwen-plus 模型,最大值和默认值均为2000 tokens。 |
top_p(可选) | float | Java SDK中为topP 生成过程中的核采样方法概率阈值,例如,取值为0.8时,仅保留概率加起来大于等于0.8的最可能token的最小集合作为候选集。取值范围为(0,1.0),取值越大,生成的随机性越高;取值越低,生成的确定性越高。 |
|
top_k(可选) | integer | Java SDK中为 topK 生成时,采样候选集的大小。例如,取值为50时,仅将单次生成中得分最高的50个token组成随机采样的候选集。取值越大,生成的随机性越高;取值越小,生成的确定性越高。取值为None或当top_k大于100时,表示不启用top_k策略,此时,仅有top_p策略生效。 |
|
repetition_penalty(可选) | float | Java SDK中为repetitionPenalty 用于控制模型生成时连续序列中的重复度。提高repetition_penalty时可以降低模型生成的重复度,1.0表示不做惩罚。没有严格的取值范围。 |
|
presence_penalty(可选) | float | Java SDK中暂不支持该参数 用户控制模型生成时整个序列中的重复度。提高presence_penalty时可以降低模型生成的重复度,取值范围[-2.0, 2.0]。 | </