《样本随机对训练结果的影响.docx》由会员分享,可在线阅读,更多相关《样本随机对训练结果的影响.docx(2页珍藏版)》请在第壹文秘上搜索。
1、上周对模型训练时采取了固定的训练集与测试集,不符合规范;在此,改进算法选取方式:1 .规定训练集占总数据集比例为:40%可随时调整numAB=dataSet(l).Count;numNB=dataSet(2).Count;trainNum=floor(0.4*(numAB+numNB);即40%用于训练,60%用于测试2 .引入随机函数ranperm生成固定阈值范围的随机整数colAB=randperm(numAB);colNB=randperm(numNB);CiigitTrainAB=colAB(1:floor(trainNum*rateAB);digitTrainNB=colNB(1:f
2、loor(trainNum*rateNB);即每次训练模型时,选取的训练集图片内容、顺序都会随机改变。结果分析:结果L测试集总数421;其中AB306,NBII5个预测AB302;出错4个(即将AB中的4个错认为NB)预测NB105;出错10个(即将NB中的10个错认为AB)准确度:95%结果2:测试集总数421;其中AB306,NBlI5个预测AB302;出错4个(即将AB中的4个错认为NB)预测NB113;出错2个(即将NB中的2个错认为AB)准确度:98.48%结果3:测试集总数421;其中AB306,NBlI5个预测AB304;出错2个(即将AB中的2个错认为NB)预测NB114;出错
3、1个(即将NB中的1个错认为AB)准确度:99.24%结果4:测试集总数421;其中AB306,NBlI5个预测AB305;出错1个(即将AB中的1个错认为NB)预测NB103;出错12个(即将NB中的12个错认为AB)准确度:94.62%结果5:测试集总数421;其中AB306,NBII5个预测AB301;出错5个(即将AB中的5个错认为NB)预测NB108;出错7个(即将NB中的7个错认为AB)准确度:96.14%结果6:测试集总数421;其中AB306,NBlI5个预测AB305;出错1个(即将AB中的5个错认为NB)预测NB113;出错2个(即将NB中的7个错认为AB)准确度:98.9
4、7%Emmmm忽然发现可以存好所有样本feature值.然后随机整数作为索引调用省去了每次获取特征的大幅运算时间40%训练量280个训练样本时,50次准确度如下:0.99,0.983,0.979z0.986,0.994z0.973,0.989,0.97,0.973,0.958,0.982,0.986z0.981,0.987,0.962,0.98,0.976,0.917,0.982,0.99,0.947,0.985,0.992,0.986,0.978,0.984z0.985,0.977z0.959,0.947,0.992,0.969,0.982,0.988,0.993,0.962,0.989,0.98,0.976,0.983,0.982,0.981,0979,0.969,0.966,0.967,0.968,0.983,0.986,0.985平均准确度:97.72%