#P3552. 第3题-云存储设备故障预测

第3题-云存储设备故障预测

题目内容

在云存储系统中,需要预测存储设备故障以提前迁移数据。每条设备日志包含:

设备 IDID ,写入次数,读取次数,平均写入延迟 (ms)(ms) ,平均读取延迟 (ms)(ms) ,设备使用年限(年),设备状态(00正常/11故障)

你需要实现一个设备故障预测系统。包含以下功能:

1、数据清洗:

  • 缺失值标记为"NaNNaN",用该字段有效值的均值填充

  • 异常值范围:

    写入/读取次数:<0<0

    平均写入/读取延迟:<0<0>1000>1000

    使用年限:<0<0>20>20

    异常值用该字段有效值的中位数替换

2、逻辑回归模型:

  • 使用批量梯度下降法 (Batch(Batch GD)GD) 训练,每次迭代使用全部样本

  • 特征:[写入次数,读取次数,平均写入延迟,平均读取延迟,设备使用年限]

  • 标签:设备状态

  • 参数:迭代 100100 次,学习率 α=0.01α=0.01,初始权重全 00

3、预测输出:

预测结果: 00 (正常)或 11 (故障)

输入描述

第一行为训练总个数 N(2<=N<=100)N,(2<=N <= 100)

第二行起连续 NN 行训练数据,每个训练数据包含:设备IDID,写入次数,读取次数,平均写入延迟,平均读取延迟,设备使用年限,状态

N+2N+2 行为预测数据总个数 M(1<=M<=10)M,(1<=M<=10)

N+3N+3 行起连续 MM 行预测数据,每个预测数据包含:设备 IDID ,写入次数,读取次数,平均写入延迟,平均读取延迟,设备使用年限,状态

输出描述

MM 行预测结果

样例1

输入

5
dev1,NaN,-50,NaN,-2.0,25,0
dev2,180,90,18.0,9.0,4,0
dev3,NaN,80,1500.0,800.0,NaN,0
dev4,-100,-50,-5.0,-2.0,-1,0
dev5,200,NaN,20.0,NaN,5,1
2
dev_predict1,80,40,NaN,2.0,2,0
dev_predict2,210,105,18.0,9.8,4,0

输出

0
0

说明

1、预测数据包含缺失值"NaNNaN",需要数据清洗

2、MM 值为 22 ,输出分为 22 行,第一行表示“dev_predict1"设备的预测结果为 00 ,第二行表示 “dev_predict2” 设备的预期结果为 00

样例2

输入

3
dev1,100,50,20.1,10.2,2,0
dev2,150,80,25.3,NaN,3,1
dev3,120,60,22.4,15.0,1,0
1
dev_predict1,130,70,21.0,12.0,2,0

输出

1

说明

输出"dev_predict1“设备的预测结果为 11

提示

线性组合 zz

z=w0+i=15wixiz=w_0+\sum^5_{i=1}w_ix_i

概率函数 P(y=1)P(y=1)

P(y=1)=11+ezP(y=1)=\frac{1}{1+e^{-z}}

预测规则:

image