alibaba.dtdataops.task.diagnostic.result.get (查询实例诊断结果)

图治离线运维查询实例诊断结果

公共参数

请求参数

名称 类型 是否必须 示例值 更多限制 描述
param0 Number 必须 772504 创建诊断反馈的id
param1 String 必须 xxx 秘钥,请先找客行申请

响应参数

名称 类型 示例值 描述
trace_id String 21048d5a17423906420772844d2c2b 唯一码,用于定位问题
data BaseDiagnosticResult 返回的结果体
  • └ is_error
  • Boolean
  • false
  • 是否出错
  • performance_risk_list
  • PerformanceRiskList []
  • 性能风险列表
  • └ influence_duration
  • Number
  • 315
  • 影响时长
  • └ is_rerun
  • Boolean
  • false
  • 是否可重跑通过
  • └ suggestion
  • String
  • 偶发问题建议保持观察,持续出现,建议联系值班同学确认rerun原因:ODPS-0010000:System internal error - kTimeout: Connection to worker machine bd-odps011014145170.na63 lost, the machine may be problematic or have restarted.,进行优化。 [联系值班](dingtalk://dingtalkclient/page/link?url=https://links.alipay.com/app/room/60010d58695654059768264e/&pc_slide=true)
  • 风险建议
  • └ name
  • String
  • Rerun导致instance耗时过长
  • 风险名称
  • └ is_auto
  • Boolean
  • false
  • 是否可自动治理
  • └ rerun_task_id
  • Number
  • 80534937282
  • 重跑的实例id
  • └ object_id
  • String
  • 20250318155913918g2he5nh0pam6
  • 对象id: logview类型对应 instanceIdTASK类型对应 taskId
  • └ object_type
  • String
  • LOGVIEW
  • 对象类型:LOGVIEW 、TASK
  • └ desc
  • String
  • Odps/data_stability_20250318155913918g2he5nh0pam6_SQL_0_0_0_job_0/M2#2636_0阶段因rerun多耗时: 315秒
  • 风险描述
  • └ id
  • Number
  • 776951
  • 诊断唯一id
  • node_risk_list
  • NodeRiskList []
  • 节点风险列表
  • └ is_rerun
  • Boolean
  • false
  • 是否可重跑通过
  • └ suggestion
  • String
  • 代码中删除参数: set odps.sql.mapper.memory=4096 或调整为稍大于实际使用内存的648数值
  • 风险建议
  • └ name
  • String
  • 用户设置的参数过大导致资源浪费
  • 风险名称
  • └ is_auto
  • Boolean
  • true
  • 是否可自动治理
  • └ object_id
  • String
  • 78798791434.0
  • 对象id: logview类型对应 instanceIdTASK类型对应 taskId
  • └ object_type
  • String
  • TASK
  • 对象类型:LOGVIEW 、TASK
  • └ desc
  • String
  • 1个Mapper节点使用最多的内存:648.0小于申请的内存:4096.0,导致因申请内存过大而变慢,请剔除或修改参数!
  • 风险描述
  • └ url
  • String
  • https://pre-tuzhi.alibaba-inc.com/data-daemon/govern/diagnosticTool/taskDiagnosis/detail?taskId=776951
  • 诊断详情链接
  • error_risk_list
  • ErrorRiskList []
  • 出错风险列表
  • └ influence_duration
  • Number
  • 0
  • 影响时长
  • └ is_rerun
  • Boolean
  • false
  • 是否可重跑通过
  • └ suggestion
  • String
  • 原因:在odps作业的运行过程当中,任务的某个worker实际使用的资源超过了申请资源导致被kill。 建议如下: 1. 可[参考文档](https://aliyuque.antfin.com/wufang.wq/vp0u4m/qnv85fmxdhcc384p?singleDoc# )定位OOM的worker及解决办法。
  • 风险建议
  • └ name
  • String
  • 运行出错
  • 风险名称
  • └ is_auto
  • Boolean
  • false
  • 是否可自动治理
  • └ rerun_task_id
  • Number
  • 79578257865
  • 重跑的实例id
  • └ object_id
  • String
  • 20250216195027297gaz80w4vjo7
  • 对象id: logview类型对应 instanceIdTASK类型对应 taskId
  • └ object_type
  • String
  • LOGVIEW
  • 对象类型:LOGVIEW 、TASK
  • └ desc
  • String
  • 出现模块:common模块的错误,错误码:ODPS-0010000, 部分错误信息:System internal error - fuxi job failed, caused by: kWorkerOutOfMemory(errCode:256) at Odps/sec_aeapp_20250216195027297gaz80w4vjo7_SQL_0_1_0_job_0/R6_5@bd-odps033056071142.sg113#205. Detail error msg: KILL_NAKILL_NA: plan
  • 风险描述
  • └ status
  • String
  • SUCCESS
  • 状态

请求示例

  • JAVA
  • .NET
  • PHP
  • CURL
  • Python
  • C/C++
  • NodeJS
TaobaoClient client = new DefaultTaobaoClient(url, appkey, secret);
AlibabaDtdataopsTaskDiagnosticResultGetRequest req = new AlibabaDtdataopsTaskDiagnosticResultGetRequest();
req.setParam0(772504L);
req.setParam1("xxx");
AlibabaDtdataopsTaskDiagnosticResultGetResponse rsp = client.execute(req);
System.out.println(rsp.getBody());

响应示例

  • XML示例
  • JSON示例
<alibaba_dtdataops_task_diagnostic_result_get_response>
    <trace_id>21048d5a17423906420772844d2c2b</trace_id>
    <data>
        <is_error>false</is_error>
        <performance_risk_list>
            <performance_risk_list>
                <influence_duration>315</influence_duration>
                <is_rerun>false</is_rerun>
                <suggestion>偶发问题建议保持观察,持续出现,建议联系值班同学确认rerun原因:ODPS-0010000:System internal error - kTimeout: Connection to worker machine bd-odps011014145170.na63 lost, the machine may be problematic or have restarted.,进行优化。 [联系值班](dingtalk://dingtalkclient/page/link?url=https://links.alipay.com/app/room/60010d58695654059768264e/&amp;pc_slide=true)</suggestion>
                <name>Rerun导致instance耗时过长</name>
                <is_auto>false</is_auto>
                <rerun_task_id>80534937282</rerun_task_id>
                <object_id>20250318155913918g2he5nh0pam6</object_id>
                <object_type>LOGVIEW</object_type>
                <desc>Odps/data_stability_20250318155913918g2he5nh0pam6_SQL_0_0_0_job_0/M2#2636_0阶段因rerun多耗时: 315秒</desc>
            </performance_risk_list>
        </performance_risk_list>
        <id>776951</id>
        <node_risk_list>
            <node_risk_list>
                <is_rerun>false</is_rerun>
                <suggestion>代码中删除参数: set odps.sql.mapper.memory=4096 或调整为稍大于实际使用内存的648数值</suggestion>
                <name>用户设置的参数过大导致资源浪费</name>
                <is_auto>true</is_auto>
                <object_id>78798791434.0</object_id>
                <object_type>TASK</object_type>
                <desc>1个Mapper节点使用最多的内存:648.0小于申请的内存:4096.0,导致因申请内存过大而变慢,请剔除或修改参数!</desc>
            </node_risk_list>
        </node_risk_list>
        <url>https://pre-tuzhi.alibaba-inc.com/data-daemon/govern/diagnosticTool/taskDiagnosis/detail?taskId=776951</url>
        <error_risk_list>
            <error_risk_list>
                <influence_duration>0</influence_duration>
                <is_rerun>false</is_rerun>
                <suggestion>原因:在odps作业的运行过程当中,任务的某个worker实际使用的资源超过了申请资源导致被kill。 建议如下: 1. 可[参考文档](https://aliyuque.antfin.com/wufang.wq/vp0u4m/qnv85fmxdhcc384p?singleDoc# )定位OOM的worker及解决办法。</suggestion>
                <name>运行出错</name>
                <is_auto>false</is_auto>
                <rerun_task_id>79578257865</rerun_task_id>
                <object_id>20250216195027297gaz80w4vjo7</object_id>
                <object_type>LOGVIEW</object_type>
                <desc>出现模块:common模块的错误,错误码:ODPS-0010000, 部分错误信息:System internal error - fuxi job failed, caused by: kWorkerOutOfMemory(errCode:256) at Odps/sec_aeapp_20250216195027297gaz80w4vjo7_SQL_0_1_0_job_0/R6_5@bd-odps033056071142.sg113#205. Detail error msg: KILL_NAKILL_NA: plan</desc>
            </error_risk_list>
        </error_risk_list>
        <status>SUCCESS</status>
    </data>
</alibaba_dtdataops_task_diagnostic_result_get_response>

异常示例

  • XML示例
  • JSON示例
<error_response>
    <code>50</code>
    <msg>Remote service error</msg>
    <sub_code>isv.invalid-parameter</sub_code>
    <sub_msg>非法参数</sub_msg>
</error_response>

错误码解释

错误码 错误描述 解决方案

API工具

如何获得此API

FAQ

返回
顶部