《spss课件26.ppt》由会员分享,可在线阅读,更多相关《spss课件26.ppt(41页珍藏版)》请在第壹文秘上搜索。
1、IBM-SPSS第第26章章 神经网络模型神经网络模型神经网络是一种灵活的自适应学习系统,可以根据观测数据自动地发现数据中的模式,并开发非线性系统模型,从而进行可靠的预测,它为解决许多现实世界的问题提供了一种很有前途的方法。神经网络是一个非线性的数据建模工具集合,它包括输入层和输出层、一个或者多个隐藏层。神经元之间的连接赋予相关的权重,训练算法在迭代过程中不断调整这些权重,从而使得预测误差最小化并给出预测精度。实例详解实例详解 使用多层感知器评估信用风险,银行信贷员需要能够找到预示有可能拖欠贷款的人的特征,然后使用这些特征来识别信用风险的高低。假设 850 名以往客户和潜在客户的信息包含在 b
2、ankloan.sav中。前 700个个案是以前曾获得贷款的客户。请使用这 700 名客户的随机样本创建多层感知器,而留出其余客户用于验证分析。然后使用该模型将 150 名潜在客户按高或低信用风险分类。模块解读模块解读1创建多层感知器网络创建多层感知器网络从菜单中选择:单击“分析”|“神经网络”|“多层感知器.”命令,弹出多层感知器对话框,如图26-2所示。(1)“变量”选择至少一个因变量。至少选择一个因子或协变量。根据需要,在变量选项卡上您可以更改重标度协变量的方法,参照上述“归一化”。(2)“分区”:单击“分区”选项卡,如图26-3所示。(3)“体系结构”:单击“体系结构”选项卡,如图26
3、-4所示。(4)“培训”单击“培训”选项卡,如图26-5所示。(5)“输出”:单击“输出”选项卡,如图26-6所示。(6)“保存”单击“保存”选项卡,如图26-7所示。(1)导出:单击“导出”选项卡,如图26-8所示。导出选项卡用于将每个因变量的键结值估算保存到XML(PMML)文件中。可以使用该模型文件以应用模型信息到其他数据文件用于评分目的。如果已经指定拆分文件,此选项不可用。(2)选项:单击“选项”选项卡,如图26-9所示。操作步骤操作步骤1准备数据以进行分析准备数据以进行分析设置随机数种子,请从菜单中选择:单击“转换”|“随机数字生成器.”命令,弹出随机数字生成器对话框,如图26-10
4、所示。选择“设置起点”。选择“固定值”并键入9191972 作为值(用户也可以自行设定其他值)。单击“确定”按钮。大约 70% 以往客户被分配至训练样本,30% 被分配至坚持样本。将需要分区变量精确地重新创建用于那些分析的样本。要创建分区变量,请从菜单中选择:单击“转换”|“计算变量.”命令,弹出计算变量对话框,如图26-11所示。2运行分析运行分析 要运行“多层感知器”分析,请从菜单中选择:单击“分析”|“神经网络”|“多层感知器.”命令,弹出多层感知器对话框,如图26-12所示。单击“分区”选项卡,如图26-13所示。单击“输出”选项卡,如图26-14所示。3个案处理摘要个案处理摘要4网络
5、信息网络信息5模型摘要模型摘要6Classification7结论结论在用于创建模型的个案中,以前拖欠贷款的124人中有74人分类正确。375名未欠贷者中有347人分类正确。整体上,84.4%训练个案分类正确,与模型摘要表中15.6%显示不正确项相对应。更好的模型应正确识别出更高百分比的个案。基于创建模型所用个案的分类从其分类率有所夸大的意义上来说,倾向于过度“乐观”。保持样本帮助验证模型;这些个案中,有74.6% 是由模型正确分类的。这意味着,总体来说,您的模型实际上有七五成是正确的。实例详解实例详解使用径向基函数分类电信客户使用径向基函数分类电信客户电信提供商按照服务用途模式划分客户群,将
6、客户分类成四组。如果人口统计学数据可用于预测组成员资格,则可以为各个潜在客户定制服务。假设当前客户的信息包含在 telco.sav 中。使用径向基函数过程分类客户。模块解读模块解读创建一个径向基函数网络,从菜单中选择:单击“分析”|“神经网络”|“径向基函数.”命令,弹出图26-19所示的“径向基函数”对话框。2“分区分区”单击“分区”按钮,如图26-20所示。3“体系结构体系结构”单击“体系结构”按钮,如图26-21所示。4“输出输出”单击“输出”按钮,如图26-22所示。5“保存保存”单击“保存”按钮,如图26-23所示。6“导出导出”单击“导出”按钮,如图26-24所示。7“选项选项”单
7、击“选项”按钮,如图26-25所示。用户缺失值:要在分析中包含个案,因子必须具有有效值。通过这些控制可以决定是否将用户缺失值在因子变量和分类因变量中视为有效值。实例详解实例详解1使用径向基函数分类电信客户使用径向基函数分类电信客户电信提供商按照服务用途模式划分客户群,将客户分类成四组。如果人口统计学数据可用于预测组成员资格,则可以为各个潜在客户定制服务。假设当前客户的信息包含在 telco.sav 中。使用径向基函数过程分类客户。2准备数据以进行分析准备数据以进行分析设置随机数种子,请从菜单中选择:单击“转换”|“随机数字生成器.”命令,弹出随机数字生成器对话框,如图26-26所示。选择“设置起点”。选择“固定值”并键入9191972 作为值,单击“确定”按钮。3主要结果解读主要结果解读(1)个案处理摘要个案处理摘要显示,有665个个案被分配到培训样本、224个被分配到测试样本以及111个被分配到了保持样本。没有个案从分析中排除。(3)模型摘要(4)Classification(5)观察预测图(6)ROC 曲线曲线范围,如图26-37所示。(7)累积增益和增益图THE END