public class CreateModelServiceRequest extends AbstractModel
header, skipSign| Constructor and Description | 
|---|
| CreateModelServiceRequest() | 
| CreateModelServiceRequest(CreateModelServiceRequest source)NOTE: Any ambiguous key set via .set("AnyKey", "value") will be a shallow copy,
       and any explicit key, i.e Foo, set via .setFoo("value") will be a deep copy. | 
| Modifier and Type | Method and Description | 
|---|---|
| Boolean | getAuthorizationEnable()Get 是否开启接口鉴权,开启后自动生成token信息,访问需要token鉴权 | 
| String | getCallbackUrl()Get 回调地址,用于回调创建服务状态信息,回调格式&内容详情见:[TI-ONE 接口回调说明](https://cloud.tencent.com/document/product/851/84292) | 
| String | getChargeType()Get 付费模式,有 PREPAID (包年包月)和 POSTPAID_BY_HOUR(按量付费) | 
| String | getCommand()Get 服务的启动命令,如遇特殊字符导致配置失败,可使用CommandBase64参数 | 
| String | getCommandBase64()Get 服务的启动命令,以base64格式进行输入,与Command同时配置时,仅当前参数生效 | 
| String | getCreateSource()Get [AUTO_ML 自动学习,自动学习正式发布 AUTO_ML_FORMAL, DEFAULT 默认] | 
| CronScaleJob[] | getCronScaleJobs()Get 定时任务配置,使用定时策略时填写 | 
| String | getDeployType()Get 服务的部署类型 [STANDARD 标准部署,DIST 分布式多机部署] 默认STANDARD | 
| EnvVar[] | getEnv()Get 环境变量,可选参数,用于配置容器中的环境变量 | 
| Boolean | getGrpcEnable()Get 是否启用 grpc 端口 | 
| HealthProbe | getHealthProbe()Get 健康探针 | 
| HorizontalPodAutoscaler | getHorizontalPodAutoscaler()Get 自动伸缩信息 | 
| Long | getHybridBillingPrepaidReplicas()Get 计费模式[HYBRID_PAID]时生效, 用于标识混合计费模式下的预付费实例数 | 
| ImageInfo | getImageInfo()Get 镜像信息,配置服务运行所需的镜像地址等信息 | 
| Long | getInstancePerReplicas()Get 单副本下的实例数,仅在部署类型为DIST时生效,默认1 | 
| String | getInstanceType()Get 使用DescribeBillingSpecs接口返回的规格列表中的值,或者参考实例列表:
TI.S.MEDIUM.POST        2C4G
TI.S.LARGE.POST 4C8G
TI.S.2XLARGE16.POST     8C16G
TI.S.2XLARGE32.POST     8C32G
TI.S.4XLARGE32.POST     16C32G
TI.S.4XLARGE64.POST     16C64G
TI.S.6XLARGE48.POST     24C48G
TI.S.6XLARGE96.POST     24C96G
TI.S.8XLARGE64.POST     32C64G
TI.S.8XLARGE128.POST 32C128G
TI.GN7.LARGE20.POST     4C20G T4*1/4
TI.GN7.2XLARGE40.POST   10C40G T4*1/2
TI.GN7.2XLARGE32.POST   8C32G T4*1
TI.GN7.5XLARGE80.POST   20C80G T4*1
TI.GN7.8XLARGE128.POST  32C128G T4*1
TI.GN7.10XLARGE160.POST 40C160G T4*2
TI.GN7.20XLARGE320.POST 80C320G T4*4 | 
| LogConfig | getLogConfig()Get 日志配置,需要投递服务日志到指定cls时填写 | 
| Boolean | getLogEnable()Get 是否开启日志投递,开启后需填写配置投递到指定cls | 
| Boolean | getModelHotUpdateEnable()Get 是否开启模型的热更新。默认不开启 | 
| ModelInfo | getModelInfo()Get 模型信息,需要挂载模型时填写 | 
| Boolean | getModelTurboEnable()Get 是否开启模型的加速, 仅对StableDiffusion(动态加速)格式的模型有效。 | 
| Boolean | getNewVersion()Get 是否新增版本 | 
| String[] | getPreStopCommand()Get 服务实例停止前执行的命令,执行完毕或执行时间超过优雅退出时限后实例结束 | 
| Long | getReplicas()Get 实例数量, 不同计费模式和调节模式下对应关系如下
PREPAID 和 POSTPAID_BY_HOUR:
手动调节模式下对应 实例数量
自动调节模式下对应 基于时间的默认策略的实例数量
HYBRID_PAID:
后付费实例手动调节模式下对应 实例数量
后付费实例自动调节模式下对应 时间策略的默认策略的实例数量 | 
| String | getResourceGroupId()Get 预付费模式下所属的资源组id,同服务组下唯一 | 
| ResourceInfo | getResources()Get 资源描述,指定包年包月模式下的cpu,mem,gpu等信息,后付费无需填写 | 
| RollingUpdate | getRollingUpdate()Get 滚动更新策略 | 
| String | getScaleMode()Get 扩缩容类型 支持:自动 - "AUTO", 手动 - "MANUAL",默认为MANUAL | 
| String | getScaleStrategy()Get 自动伸缩策略配置 HPA : 通过HPA进行弹性伸缩 CRON 通过定时任务进行伸缩 | 
| ScheduledAction | getScheduledAction()Get 定时停止配置 | 
| String | getServiceCategory()Get 服务分类 | 
| String | getServiceDescription()Get 模型服务的描述 | 
| ServiceEIP | getServiceEIP()Get 是否开启TIONE内网访问外部,此功能仅支持后付费机型与从TIONE平台购买的预付费机型;使用从CVM选择资源组时此配置不生效。 | 
| String | getServiceGroupId()Get 新增版本时需要填写 | 
| String | getServiceGroupName()Get 不超过60个字,仅支持英文、数字、下划线"_"、短横"-",只能以英文、数字开头 | 
| ServiceLimit | getServiceLimit()Get 服务限速限流相关配置 | 
| Long | getServicePort()Get 服务端口,仅在非内置镜像时生效,默认8501。不支持输入8501-8510,6006,9092 | 
| SidecarSpec | getSidecar()Get sidecar配置 | 
| Tag[] | getTags()Get 腾讯云标签 | 
| Long | getTerminationGracePeriodSeconds()Get 服务的优雅退出时限。单位为秒,默认值为30,最小为1 | 
| VolumeMount | getVolumeMount()Get 挂载配置,目前只支持CFS | 
| VolumeMount[] | getVolumeMounts()Get 数据盘批量挂载配置,当前仅支持CFS,仅针对“模型来源-资源组缓存”。 | 
| void | setAuthorizationEnable(Boolean AuthorizationEnable)Set 是否开启接口鉴权,开启后自动生成token信息,访问需要token鉴权 | 
| void | setCallbackUrl(String CallbackUrl)Set 回调地址,用于回调创建服务状态信息,回调格式&内容详情见:[TI-ONE 接口回调说明](https://cloud.tencent.com/document/product/851/84292) | 
| void | setChargeType(String ChargeType)Set 付费模式,有 PREPAID (包年包月)和 POSTPAID_BY_HOUR(按量付费) | 
| void | setCommand(String Command)Set 服务的启动命令,如遇特殊字符导致配置失败,可使用CommandBase64参数 | 
| void | setCommandBase64(String CommandBase64)Set 服务的启动命令,以base64格式进行输入,与Command同时配置时,仅当前参数生效 | 
| void | setCreateSource(String CreateSource)Set [AUTO_ML 自动学习,自动学习正式发布 AUTO_ML_FORMAL, DEFAULT 默认] | 
| void | setCronScaleJobs(CronScaleJob[] CronScaleJobs)Set 定时任务配置,使用定时策略时填写 | 
| void | setDeployType(String DeployType)Set 服务的部署类型 [STANDARD 标准部署,DIST 分布式多机部署] 默认STANDARD | 
| void | setEnv(EnvVar[] Env)Set 环境变量,可选参数,用于配置容器中的环境变量 | 
| void | setGrpcEnable(Boolean GrpcEnable)Set 是否启用 grpc 端口 | 
| void | setHealthProbe(HealthProbe HealthProbe)Set 健康探针 | 
| void | setHorizontalPodAutoscaler(HorizontalPodAutoscaler HorizontalPodAutoscaler)Set 自动伸缩信息 | 
| void | setHybridBillingPrepaidReplicas(Long HybridBillingPrepaidReplicas)Set 计费模式[HYBRID_PAID]时生效, 用于标识混合计费模式下的预付费实例数 | 
| void | setImageInfo(ImageInfo ImageInfo)Set 镜像信息,配置服务运行所需的镜像地址等信息 | 
| void | setInstancePerReplicas(Long InstancePerReplicas)Set 单副本下的实例数,仅在部署类型为DIST时生效,默认1 | 
| void | setInstanceType(String InstanceType)Set 使用DescribeBillingSpecs接口返回的规格列表中的值,或者参考实例列表:
TI.S.MEDIUM.POST        2C4G
TI.S.LARGE.POST 4C8G
TI.S.2XLARGE16.POST     8C16G
TI.S.2XLARGE32.POST     8C32G
TI.S.4XLARGE32.POST     16C32G
TI.S.4XLARGE64.POST     16C64G
TI.S.6XLARGE48.POST     24C48G
TI.S.6XLARGE96.POST     24C96G
TI.S.8XLARGE64.POST     32C64G
TI.S.8XLARGE128.POST 32C128G
TI.GN7.LARGE20.POST     4C20G T4*1/4
TI.GN7.2XLARGE40.POST   10C40G T4*1/2
TI.GN7.2XLARGE32.POST   8C32G T4*1
TI.GN7.5XLARGE80.POST   20C80G T4*1
TI.GN7.8XLARGE128.POST  32C128G T4*1
TI.GN7.10XLARGE160.POST 40C160G T4*2
TI.GN7.20XLARGE320.POST 80C320G T4*4 | 
| void | setLogConfig(LogConfig LogConfig)Set 日志配置,需要投递服务日志到指定cls时填写 | 
| void | setLogEnable(Boolean LogEnable)Set 是否开启日志投递,开启后需填写配置投递到指定cls | 
| void | setModelHotUpdateEnable(Boolean ModelHotUpdateEnable)Set 是否开启模型的热更新。默认不开启 | 
| void | setModelInfo(ModelInfo ModelInfo)Set 模型信息,需要挂载模型时填写 | 
| void | setModelTurboEnable(Boolean ModelTurboEnable)Set 是否开启模型的加速, 仅对StableDiffusion(动态加速)格式的模型有效。 | 
| void | setNewVersion(Boolean NewVersion)Set 是否新增版本 | 
| void | setPreStopCommand(String[] PreStopCommand)Set 服务实例停止前执行的命令,执行完毕或执行时间超过优雅退出时限后实例结束 | 
| void | setReplicas(Long Replicas)Set 实例数量, 不同计费模式和调节模式下对应关系如下
PREPAID 和 POSTPAID_BY_HOUR:
手动调节模式下对应 实例数量
自动调节模式下对应 基于时间的默认策略的实例数量
HYBRID_PAID:
后付费实例手动调节模式下对应 实例数量
后付费实例自动调节模式下对应 时间策略的默认策略的实例数量 | 
| void | setResourceGroupId(String ResourceGroupId)Set 预付费模式下所属的资源组id,同服务组下唯一 | 
| void | setResources(ResourceInfo Resources)Set 资源描述,指定包年包月模式下的cpu,mem,gpu等信息,后付费无需填写 | 
| void | setRollingUpdate(RollingUpdate RollingUpdate)Set 滚动更新策略 | 
| void | setScaleMode(String ScaleMode)Set 扩缩容类型 支持:自动 - "AUTO", 手动 - "MANUAL",默认为MANUAL | 
| void | setScaleStrategy(String ScaleStrategy)Set 自动伸缩策略配置 HPA : 通过HPA进行弹性伸缩 CRON 通过定时任务进行伸缩 | 
| void | setScheduledAction(ScheduledAction ScheduledAction)Set 定时停止配置 | 
| void | setServiceCategory(String ServiceCategory)Set 服务分类 | 
| void | setServiceDescription(String ServiceDescription)Set 模型服务的描述 | 
| void | setServiceEIP(ServiceEIP ServiceEIP)Set 是否开启TIONE内网访问外部,此功能仅支持后付费机型与从TIONE平台购买的预付费机型;使用从CVM选择资源组时此配置不生效。 | 
| void | setServiceGroupId(String ServiceGroupId)Set 新增版本时需要填写 | 
| void | setServiceGroupName(String ServiceGroupName)Set 不超过60个字,仅支持英文、数字、下划线"_"、短横"-",只能以英文、数字开头 | 
| void | setServiceLimit(ServiceLimit ServiceLimit)Set 服务限速限流相关配置 | 
| void | setServicePort(Long ServicePort)Set 服务端口,仅在非内置镜像时生效,默认8501。不支持输入8501-8510,6006,9092 | 
| void | setSidecar(SidecarSpec Sidecar)Set sidecar配置 | 
| void | setTags(Tag[] Tags)Set 腾讯云标签 | 
| void | setTerminationGracePeriodSeconds(Long TerminationGracePeriodSeconds)Set 服务的优雅退出时限。单位为秒,默认值为30,最小为1 | 
| void | setVolumeMount(VolumeMount VolumeMount)Set 挂载配置,目前只支持CFS | 
| void | setVolumeMounts(VolumeMount[] VolumeMounts)Set 数据盘批量挂载配置,当前仅支持CFS,仅针对“模型来源-资源组缓存”。 | 
| void | toMap(HashMap<String,String> map,
     String prefix)Internal implementation, normal users should not use it. | 
any, fromJsonString, getBinaryParams, GetHeader, getMultipartRequestParams, getSkipSign, isStream, set, SetHeader, setParamArrayObj, setParamArraySimple, setParamObj, setParamSimple, setSkipSign, toJsonStringpublic CreateModelServiceRequest()
public CreateModelServiceRequest(CreateModelServiceRequest source)
public String getServiceGroupId()
public void setServiceGroupId(String ServiceGroupId)
ServiceGroupId - 新增版本时需要填写public String getServiceGroupName()
public void setServiceGroupName(String ServiceGroupName)
ServiceGroupName - 不超过60个字,仅支持英文、数字、下划线"_"、短横"-",只能以英文、数字开头public String getServiceDescription()
public void setServiceDescription(String ServiceDescription)
ServiceDescription - 模型服务的描述public String getChargeType()
public void setChargeType(String ChargeType)
ChargeType - 付费模式,有 PREPAID (包年包月)和 POSTPAID_BY_HOUR(按量付费)public String getResourceGroupId()
public void setResourceGroupId(String ResourceGroupId)
ResourceGroupId - 预付费模式下所属的资源组id,同服务组下唯一public ModelInfo getModelInfo()
public void setModelInfo(ModelInfo ModelInfo)
ModelInfo - 模型信息,需要挂载模型时填写public ImageInfo getImageInfo()
public void setImageInfo(ImageInfo ImageInfo)
ImageInfo - 镜像信息,配置服务运行所需的镜像地址等信息public EnvVar[] getEnv()
public void setEnv(EnvVar[] Env)
Env - 环境变量,可选参数,用于配置容器中的环境变量public ResourceInfo getResources()
public void setResources(ResourceInfo Resources)
Resources - 资源描述,指定包年包月模式下的cpu,mem,gpu等信息,后付费无需填写public String getInstanceType()
public void setInstanceType(String InstanceType)
InstanceType - 使用DescribeBillingSpecs接口返回的规格列表中的值,或者参考实例列表:
TI.S.MEDIUM.POST        2C4G
TI.S.LARGE.POST 4C8G
TI.S.2XLARGE16.POST     8C16G
TI.S.2XLARGE32.POST     8C32G
TI.S.4XLARGE32.POST     16C32G
TI.S.4XLARGE64.POST     16C64G
TI.S.6XLARGE48.POST     24C48G
TI.S.6XLARGE96.POST     24C96G
TI.S.8XLARGE64.POST     32C64G
TI.S.8XLARGE128.POST 32C128G
TI.GN7.LARGE20.POST     4C20G T4*1/4
TI.GN7.2XLARGE40.POST   10C40G T4*1/2
TI.GN7.2XLARGE32.POST   8C32G T4*1
TI.GN7.5XLARGE80.POST   20C80G T4*1
TI.GN7.8XLARGE128.POST  32C128G T4*1
TI.GN7.10XLARGE160.POST 40C160G T4*2
TI.GN7.20XLARGE320.POST 80C320G T4*4public String getScaleMode()
public void setScaleMode(String ScaleMode)
ScaleMode - 扩缩容类型 支持:自动 - "AUTO", 手动 - "MANUAL",默认为MANUALpublic Long getReplicas()
public void setReplicas(Long Replicas)
Replicas - 实例数量, 不同计费模式和调节模式下对应关系如下
PREPAID 和 POSTPAID_BY_HOUR:
手动调节模式下对应 实例数量
自动调节模式下对应 基于时间的默认策略的实例数量
HYBRID_PAID:
后付费实例手动调节模式下对应 实例数量
后付费实例自动调节模式下对应 时间策略的默认策略的实例数量public HorizontalPodAutoscaler getHorizontalPodAutoscaler()
public void setHorizontalPodAutoscaler(HorizontalPodAutoscaler HorizontalPodAutoscaler)
HorizontalPodAutoscaler - 自动伸缩信息public Boolean getLogEnable()
public void setLogEnable(Boolean LogEnable)
LogEnable - 是否开启日志投递,开启后需填写配置投递到指定clspublic LogConfig getLogConfig()
public void setLogConfig(LogConfig LogConfig)
LogConfig - 日志配置,需要投递服务日志到指定cls时填写public Boolean getAuthorizationEnable()
public void setAuthorizationEnable(Boolean AuthorizationEnable)
AuthorizationEnable - 是否开启接口鉴权,开启后自动生成token信息,访问需要token鉴权public Tag[] getTags()
public void setTags(Tag[] Tags)
Tags - 腾讯云标签public Boolean getNewVersion()
public void setNewVersion(Boolean NewVersion)
NewVersion - 是否新增版本public CronScaleJob[] getCronScaleJobs()
public void setCronScaleJobs(CronScaleJob[] CronScaleJobs)
CronScaleJobs - 定时任务配置,使用定时策略时填写public String getScaleStrategy()
public void setScaleStrategy(String ScaleStrategy)
ScaleStrategy - 自动伸缩策略配置 HPA : 通过HPA进行弹性伸缩 CRON 通过定时任务进行伸缩public Long getHybridBillingPrepaidReplicas()
public void setHybridBillingPrepaidReplicas(Long HybridBillingPrepaidReplicas)
HybridBillingPrepaidReplicas - 计费模式[HYBRID_PAID]时生效, 用于标识混合计费模式下的预付费实例数public String getCreateSource()
public void setCreateSource(String CreateSource)
CreateSource - [AUTO_ML 自动学习,自动学习正式发布 AUTO_ML_FORMAL, DEFAULT 默认]public Boolean getModelHotUpdateEnable()
public void setModelHotUpdateEnable(Boolean ModelHotUpdateEnable)
ModelHotUpdateEnable - 是否开启模型的热更新。默认不开启public ScheduledAction getScheduledAction()
public void setScheduledAction(ScheduledAction ScheduledAction)
ScheduledAction - 定时停止配置public VolumeMount getVolumeMount()
public void setVolumeMount(VolumeMount VolumeMount)
VolumeMount - 挂载配置,目前只支持CFSpublic ServiceLimit getServiceLimit()
public void setServiceLimit(ServiceLimit ServiceLimit)
ServiceLimit - 服务限速限流相关配置public String getCallbackUrl()
public void setCallbackUrl(String CallbackUrl)
CallbackUrl - 回调地址,用于回调创建服务状态信息,回调格式&内容详情见:[TI-ONE 接口回调说明](https://cloud.tencent.com/document/product/851/84292)public Boolean getModelTurboEnable()
public void setModelTurboEnable(Boolean ModelTurboEnable)
ModelTurboEnable - 是否开启模型的加速, 仅对StableDiffusion(动态加速)格式的模型有效。public String getServiceCategory()
public void setServiceCategory(String ServiceCategory)
ServiceCategory - 服务分类public String getCommand()
public void setCommand(String Command)
Command - 服务的启动命令,如遇特殊字符导致配置失败,可使用CommandBase64参数public ServiceEIP getServiceEIP()
public void setServiceEIP(ServiceEIP ServiceEIP)
ServiceEIP - 是否开启TIONE内网访问外部,此功能仅支持后付费机型与从TIONE平台购买的预付费机型;使用从CVM选择资源组时此配置不生效。public String getCommandBase64()
public void setCommandBase64(String CommandBase64)
CommandBase64 - 服务的启动命令,以base64格式进行输入,与Command同时配置时,仅当前参数生效public Long getServicePort()
public void setServicePort(Long ServicePort)
ServicePort - 服务端口,仅在非内置镜像时生效,默认8501。不支持输入8501-8510,6006,9092public String getDeployType()
public void setDeployType(String DeployType)
DeployType - 服务的部署类型 [STANDARD 标准部署,DIST 分布式多机部署] 默认STANDARDpublic Long getInstancePerReplicas()
public void setInstancePerReplicas(Long InstancePerReplicas)
InstancePerReplicas - 单副本下的实例数,仅在部署类型为DIST时生效,默认1public Long getTerminationGracePeriodSeconds()
public void setTerminationGracePeriodSeconds(Long TerminationGracePeriodSeconds)
TerminationGracePeriodSeconds - 服务的优雅退出时限。单位为秒,默认值为30,最小为1public String[] getPreStopCommand()
public void setPreStopCommand(String[] PreStopCommand)
PreStopCommand - 服务实例停止前执行的命令,执行完毕或执行时间超过优雅退出时限后实例结束public Boolean getGrpcEnable()
public void setGrpcEnable(Boolean GrpcEnable)
GrpcEnable - 是否启用 grpc 端口public HealthProbe getHealthProbe()
public void setHealthProbe(HealthProbe HealthProbe)
HealthProbe - 健康探针public RollingUpdate getRollingUpdate()
public void setRollingUpdate(RollingUpdate RollingUpdate)
RollingUpdate - 滚动更新策略public SidecarSpec getSidecar()
public void setSidecar(SidecarSpec Sidecar)
Sidecar - sidecar配置public VolumeMount[] getVolumeMounts()
public void setVolumeMounts(VolumeMount[] VolumeMounts)
VolumeMounts - 数据盘批量挂载配置,当前仅支持CFS,仅针对“模型来源-资源组缓存”。Copyright © 2025. All rights reserved.