#P3552. 第3题-云存储设备故障预测
第3题-云存储设备故障预测
题目内容
在云存储系统中,需要预测存储设备故障以提前迁移数据。每条设备日志包含:
设备 ,写入次数,读取次数,平均写入延迟 ,平均读取延迟 ,设备使用年限(年),设备状态(正常/故障)
你需要实现一个设备故障预测系统。包含以下功能:
1、数据清洗:
-
缺失值标记为"",用该字段有效值的均值填充
-
异常值范围:
写入/读取次数:
平均写入/读取延迟:或
使用年限:或
异常值用该字段有效值的中位数替换
2、逻辑回归模型:
-
使用批量梯度下降法 训练,每次迭代使用全部样本
-
特征:[写入次数,读取次数,平均写入延迟,平均读取延迟,设备使用年限]
-
标签:设备状态
-
参数:迭代 次,学习率 ,初始权重全
3、预测输出:
预测结果: (正常)或 (故障)
输入描述
第一行为训练总个数
第二行起连续 行训练数据,每个训练数据包含:设备,写入次数,读取次数,平均写入延迟,平均读取延迟,设备使用年限,状态
第 行为预测数据总个数
第 行起连续 行预测数据,每个预测数据包含:设备 ,写入次数,读取次数,平均写入延迟,平均读取延迟,设备使用年限,状态
输出描述
行预测结果
样例1
输入
5
dev1,NaN,-50,NaN,-2.0,25,0
dev2,180,90,18.0,9.0,4,0
dev3,NaN,80,1500.0,800.0,NaN,0
dev4,-100,-50,-5.0,-2.0,-1,0
dev5,200,NaN,20.0,NaN,5,1
2
dev_predict1,80,40,NaN,2.0,2,0
dev_predict2,210,105,18.0,9.8,4,0
输出
0
0
说明
1、预测数据包含缺失值"",需要数据清洗
2、 值为 ,输出分为 行,第一行表示“dev_predict1"设备的预测结果为 ,第二行表示 “dev_predict2” 设备的预期结果为
样例2
输入
3
dev1,100,50,20.1,10.2,2,0
dev2,150,80,25.3,NaN,3,1
dev3,120,60,22.4,15.0,1,0
1
dev_predict1,130,70,21.0,12.0,2,0
输出
1
说明
输出"dev_predict1“设备的预测结果为
提示
线性组合 :
概率函数 :
预测规则:
