基于EM算法的学生成绩因素分析

基于EM算法的学生成绩因素分析

一、基于EM算法学生成绩的因子分析(论文文献综述)

周国琼,蒋文江[1](2020)在《因子服从指数分布的因子分析模型的参数估计研究》文中进行了进一步梳理在假定因子服从指数分布的基础上,构建了一类因子模型,并用基于EM算法的极大似然估计给出模型中的参数估计,其中的E步借助M-H算法来完成,采用的模拟研究方法为MCECM算法,对参数估计的效果进行了模拟分析,结果表明用MCECM算法来确定新因子模型中的参数是合理的.

郭章[2](2020)在《面向智能教学系统的学习者建模研究》文中研究表明随着互联网时代向人工智能时代的过渡,现代化的教育也越发趋于智能化,人工智能+教育的方式成为未来教育的发展趋势。大数据环境下的人工智能教育具有个性化、精准化以及全面化等特点,在减轻教师教学负担的同时,极大地提高了学生的学习收益,促进了教育技术的变革。知识追踪作为一种对学习者知识水平进行建模的方法,在智能教学系统中起着关键作用,对其研究是促进教育发展的重要手段之一,具有重要的研究意义和社会价值。现有的基于知识追踪的学习者建模方法仍存在许多不足,主要体现在:个性化能力不足、模型结构简单,未考虑学习者的差异以及知识点结构之间的关系,最终导致模型预测性能有限和可解释性较差等问题。本文为了提升学习者模型的性能,考虑了不同的因素,从传统的概率图模型到深度学习的模型,在多个方面对其进行了改进。主要有如下三方面的工作:(1)针对传统贝叶斯知识追踪模型个性化能力不足和预测精度有限等问题,本文创新性地将演化聚类引入到了知识追踪模型中。模型将学习者在智能教学系统中的交互数据按照时间推移进行动态聚类,得到不同知识水平的学生群体,构造出一种包含多个知识追踪模型的集成学习模型,并且使用一种改进的算法进行预测。针对模型训练算法易陷入局部最优的问题,提出了一种优化策略。模型充分考虑了学习者的个体差异以及学习者知识水平变化的时间平滑特性,能有效缓解异常数据的干扰,具有更好的可解释性,能有效地服务于学习者和教学系统。(2)针对传统贝叶斯知识追踪模型结构简单,难以利用更多的特征进行建模的问题,设计了一种基于问题综合难度与输入输出隐马尔可夫模型的知识追踪模型,从结构上对模型进行了改进。使得建模时不再只利用考生的答题正误情况,而是根据实际的问题难度来构建不同的模型参数。并且设计了一种结合响应时间的问题综合难度计算方法。实验结果表明,该模型在预测表现上优于传统模型,并且具有较好的可扩展性。(3)针对基于深度学习的知识追踪模型预测准确度有限,波动性较大以及数据稀疏性等问题,从知识点的结构方面改进了深度知识追踪模型。考虑到不同的知识点之间有复杂的内部联系,首先构造出知识点之间的层级结构关系和对等关系,存在联系的知识点之间必然会有相似的掌握程度,然后将其作为约束条件加入模型的损失函数中。实验表明改进的方法能进一步提升深度知识追踪模型的预测精度,能构建出更好的知识结构关系。

孔亚鑫[3](2020)在《基于EM算法的IRT模型参数估计及应用研究》文中研究指明项目反应理论(Item Response Theory,IRT)的发展为完善测评数据的分析提供了新的思路。IRT的显着特点是以概率模型的形式表达被试的作答反应结果是如何受被试潜在能力水平与项目参数共同影响的,当项目的难度与被试的潜在能力水平相匹配时,测验的效率将大幅提升。如何准确快速的估计IRT模型的参数是有效应用IRT的关键内容,尤其是在大数据的背景下,研究高效的参数估计算法以及明确有效的特征数据对提高参数估计的准确性具有非常重要的意义,在一定程度上推动着IRT的理论发展与实际应用。期望最大化算法(Expectation Maxization Algorithm,EM)作为一种迭代优化策略,由于其思想简单成为了近年来处理不完全数据问题的有效方法,基于EM算法可以利用被试的作答反应数据有效的解决IRT模型的参数估计问题。本文基于EM算法对IRT模型的参数估计问题进行了研究。主要研究内容如下:首先,在连续潜变量离散化的形式下,根据EM算法的原理推导了项目参数和潜在能力分布参数的估计过程,分析了影响参数估计准确性的因素并通过三个模拟实验确定了影响因素的最优参数设置,并将估计结果与模拟真值、基于Gauss-Hermite积分的MML/EM算法以及MCMC算法的估计结果进行了对比,说明了本文实现的EM算法参数估计的准确性。其次,针对EM算法在大数据量下需要较长的执行时间才能得出最终结果的问题,本文提出了一种基于并行思想的改进算法PE-PM算法,利用Python中的dask并行计算库通过自定义的方式实现了EM算法的E步内并行和M步内并行的运算,有效的提高了算法的执行速度,减少了内存的占用,为EM算法处理大规模测评数据的分析提供了条件。然后,在EM算法的基础上,针对不同特征数据对参数估计的影响,本文主要研究了两方面的内容,其一研究了区域数据与整体数据对参数估计的影响,通过模拟实验分析的方式得出了被试能力分布的均值和方差与项目参数中的难度和区分度参数估计结果之间的关系;其二研究了出现被试答对率与项目难度不一致现象的异常数据时对参数估计结果的影响,通过模拟实验分析的方式得出了异常数据对参数估计的影响关系,并通过异常数据检测统计量证明了在异常数据量较小的情况下项目反应模型参数估计的稳定性。最后,将基于EM算法的IRT模型应用于考试数据的分析中,收集和整理了某校数学科目测评的被试作答反应数据,对原始数据进行预处理后,通过本文研究的EM算法估计出了IRT模型中的项目参数以及被试能力水平参数,并分析了项目参数设置的合理性以及被试能力水平与难度参数的匹配性,为更好的测量被试的能力水平提出了合理化的建议。本文的创新之处在于:1、通过模拟实验的方式分析了实现EM算法参数估计过程中的影响因素,并给出了最优的参数设置。2、提出了一种基于并行思想的改进算法PE-PM算法,实现了EM算法的E步内并行和M步内并行的运算,有效的提高了算法的执行速度。3、基于EM算法研究了不同特征数据对IRT模型参数估计结果的影响,为获得精确的参数估计结果的数据处理过程提供了参考。

周国琼[4](2020)在《因子服从Gamma分布的因子分析模型的模拟研究及其应用》文中研究表明因子分析法作为多元统计分析的一种重要的分析技术,在数据降维方面占据着重要地位,但传统的因子分析模型假设因子服从正态分布,这在一些数据为非负的应用研究领域中并不恰当。本文特别针对这类问题,在假定因子服从Gamma分布的基础上,构建了一类实用性更强的因子模型,然后用基于EM算法的极大似然估计法对模型的参数估计问题开展研究,其中E步用MCMC方法中的Metropolis-Hastings算法来实现。在做实证分析的时候,为了方便解释分析结果,本文定义真载荷矩阵用于解释模型的分析结果。在分析结果的时候,本文用本文所构建的因子服从伽马分布的因子分析模型对真实的学生成绩数据做实证分析。为了突出本文所提出的新的因子分析模型的独特优势,本文对新模型和原模型做了比较。首先,作者通过使用模拟数据对两个模型做比较,以此来说明:当因子真的服从伽马分布的时候,用传统的因子分析模型来做因子分析是不合理的;然后,用新模型和原模型分别对真实的学生成绩数据做因子分析,其结果显示,在因子个数相同的前提下,用新模型对原始数据做因子分析比用原模型有更好的信息提取能力,新模型能更加充分的提取原始数据中的信息。故研究结果表明,本文所研究的因子模型的选题及研究结果是有理论和实用价值的。

蔡巍[5](2019)在《网络数据的判别分析和因子模型》文中认为随着信息技术的高速发展,人类社会逐渐步入复杂网络时代.随之而来,我们生产生活中涌现出大量的网络型数据.对于这种新型数据的分析,是摆在如今科研工作者面前的一大难题.在统计学中,关于网络型数据的分析一直是围绕着两大问题展开的,即探究网络中信息的传播方式以及揭示网络结构的生成机制.本文的工作同样围绕这两个问题展开.首先,关于第一个问题,我们建立了一个利用网络结构进行分类的统计模型,称为网络线性判别分析(NLDA).NLDA模型同时考虑到了协变量信息和网络信息,对于一个类未知的节点能够利用两部分信息进行分类.理论上,我们研究了该分类模型的理论误分类率并且在相当温和的条件下给出了理论误分类率的上界.此外,对于常见的稀疏网络结构,我们在不同的稀疏性假设条件下,研究了NLDA模型的相应的渐近行为.为了研究新提出的分类方法在有限样本上的表现,我们设计了一系列的模拟实验,并用一个收集自新浪微博的真实数据集来展示该模型的效果.其次,关于第二个问题的研究,我们基于高维因子分析模型,构建了一个关于连续型网络数据的生成模型.该模型假定网络的生成受到潜在的因子结构所影响,其中主要包括潜在的节点发出者和接收者效应以及节点间更高阶的依赖关系.理论上,在一定的假设下我们得到了模型中参数的可识别性.并进一步证明了参数极大似然估计的相合性和渐近正态性.此外,我们也设计了一系列模拟实验评估该模型在有限样本上的表现.

孙念[6](2019)在《基于多特征I-Vector的短语音说话人识别方法研究》文中研究指明近年来,说话人识别作为人机交互领域的一个主要研究方向之一,已经在现实生活中得到了广泛的应用。然而在实际应用中,能够提取到的说话人语音较短,导致系统识别效果较差。因此,本文研究的主要内容为短语音说话人识别系统。首先,本文概述了说话人识别系统的总体框架,并分别描述了各模块的性能以及处理过程,明确地把特征提取和匹配模型部分作为本文的主要研究方向。其次,在说话人特征提取部分,针对短语音条件下,单一特征的MFCC特征参数无法充分表征说话人特性的问题,利用不同特征可以从不同的角度对说话人特征分布进行描述的优点,确定了3种常用特征参数作为说话人特征,分别是:MFCC、GFCC和LPCC。考虑到直接拼接的特征无法获得很好的识别性能,提出了基于Fisher比的MFCC、GFCC和LPCC的多特征融合算法,并把新特征命名为LPMGFCC。该种算法有效地利用了不同特征分量在识别系统中的贡献率不同的特点,通过选取系统贡献率较高的特征分量,进而提升了系统的识别效果。接着,由于融合的LPMGFCC特征分量之间存在一定的相关和冗余信息,为了进一步提升短语音说话人识别性能,提出了基于PCA和LDA的LPMGFCC特征补偿算法,得到了正交且说话人区分性较强的特征,同时,小了计算复杂度。再者,匹配模型的选择对短语音说话人识别系统的性能也会产生影响。本文对GMM-UBM模型进行深入研究,并通过实验确定了模型的混合度为1024时,系统的性能最优。同时,介绍了目前主流的I-Vector模型,并分析了I-Vector模型相比于GMM-UBM模型的优势,并在本文测试语音较短的情况下,对两种模型进行了实验对比,结果表明I-Vector模型相比于GMM-UBM模型具有更好的识别性能。最后,本文对基于多特征I-Vector的短语音说话人识别系统进行了仿真实验。在测试语音为8s时,验证了不同特征在基线I-Vector说话人识别系统中的性能,结果表明本文提出的多特征算法具有更好的识别性能。同时,在不同的测试短语音下,验证了本文提出算法的EER相对于基线系统的EER有约50%的提升,且本文提出算法的minDCF相对于基线系统的minDCF也有约50%的提升。

胡玲[7](2016)在《Point-Adjusted Gaussian混合模型及其在结构方程模型中的应用》文中研究表明结构方程模型是一种重要的新一代统计分析方法,且在社会科学研究中被广泛地应用,而点膨胀现象在实际数据中也是普遍存在的。本文主要研究对点膨胀非正态数据进行验证性因子分析时的数据处理问题,由于某固定点频数过大,直接将膨胀点剔除或者对原始数据不作任何处理,往往使模型结果与实际产生偏差。为了解决这个问题,本文构建了Point-Adjusted Gaussian混合模型,将该类数据看作来自固定点y0多元高斯分布混合的整体,估计出用于结构方程模型的协方差矩阵。具体研究内容如下:1)构建Point-Adjusted Gaussian混合模型,阐述了模型原理及参数极大似然估计的EM算法,并基于大样本下极大似然估计的渐近正态性与模型的观测信息矩阵,给出了参数估计的渐近方差和渐近置信区间,其次,讨论了PAG混合模型中EM算法的收敛性。通过随机模拟验证了当数据中存在点膨胀时,PAG混合模型对提高SEM的拟合优度是有效的。2)将本文提出的PAG混合模型应用到课堂教学结构的验证性因子分析中,用PAG混合模型来拟合四季青中学学生课堂体验数据,然后用估计出的协方差矩阵拟合结构方程模型,并比较该模型与原始数据拟合的结构方程模型的拟合效果。分析结果表明,PAG混合模型对应的结构方程模型的Log-likelihood更大,AIC值、BIC值更小,说明PAG混合模型在验证性因子分析中处理点膨胀数据有很好的效果。

王灼龙[8](2016)在《基于隐结构的贝叶斯网络的建立及其在中医辨证中的应用》文中研究指明随着机器学习的快速发展,贝叶斯网络已经被应用到很多领域中,贝叶斯网络一直是机器学习研究热点。在贝叶斯网络学习中一个重要的问题是当网络中含有隐变量时,网络的学习问题,这些潜在或者隐藏的变量能够汇聚显变量之间复杂的依赖关系,简化网络模型,能对网络的学习,推理产生重要的影响。因此对含有隐变量的贝叶斯网络的学习是一个很有意义的研究内容。同时在中医辨证中作为辨证最基本的要素—证素不能被直接观测到,却包含了病位与病性等重要信息,是中医辨证的主要依据。所以隐变量在中医辨证中也有很重要的作用。基于隐变量的重要性,本文首先通过对贝叶斯网络的学习得到含有隐变量的贝叶斯网络,然后将其应用到中医辨证之中,实现中医辨证的客观化。本文所做的主要工作有以下两点。1.提出了一种基于特征组选择的特征选择方法,区别于其它特征选择方法对单个特征的取舍,该特征选择方法首先通过特征聚类对原始特征聚类,并结合分类器的分类准确率对特征组进行选择。与此同时在特征聚类的基础上提出了一种含有隐变量的贝叶斯网络学习算法。为了验证算法的有效性将这两种算法应用到了慢性胃炎中医辨证中,对慢性胃炎中医证型的主症进行了挑选并且建立中医辨证分类模型。对模型的定性与定量的分析可知,通过这两种算法建立的模型在特征的挑选与模型的定量讨论上与中医辨证理论均较为吻合。同时将所建立模型应用到慢性胃炎中医数据多标记学习之中取得了较好的分类效果。2.受到深度学习思想的启发,提出了一种基于多维聚类的含有隐变量的贝叶斯网络分类算法—CBMC算法,将适用于多维聚类的算法应用到了分类领域中。该算法主要分为无监督的多维聚类与有监督的模型调整两个部分。通过无监督的多维聚类向模型中引入隐变量,通过有监督的调整对模型进行进一步的优化。为了验证算法的有效性将算法应用到了慢性胃炎中医辨证中,构建了慢性胃炎中医辨证模型。通过与常用的经典分类算法(如NB,C4.5等)相比发现在慢性胃炎中医辨证中CBMC算法有较高的分类准确率,通过对模型进行多标记学习发现其平均准确率能达到82.6%,分类性能优于多数现有的多标记分类器。

解素雯[9](2016)在《基于主成分分析与因子分析数学模型的应用研究》文中进行了进一步梳理主成分分析和因子分析是两种重要且实用的多元统计方法,本文从理论和应用两方面对主成分分析与因子分析展开了研究。对主成分分析原理进行了相关数学推导和性质证明,讨论了主成分分析的机理以及改进方法。对因子分析中因子载荷矩阵和特殊因子方差的估计方法作了进一步的研究,为更加客观准确地进行综合评价做了理论准备。从概念、基本思想、数学模型、计算过程等方面比较了两种方法的异同点。在对比研究了两者异同的基础上,通过实际应用发现了两种方法在应用过程中存在的问题,应该注意的问题,尤其是在SPSS统计软件的实现过程中应注意的问题。通过与传统加权平均法的对比,验证了两种方法在综合评价应用中的科学性和可行性。本文根据两种方法的特性,总结出不同情况下选用何种方法更为合适。本文利用SPSS统计软件分别用主成分分析法和因子分析法对33名同学的15门成绩进行分析,通过结果证明了这两种方法相对传统加权平均法的优越性,得到了令人满意的结果。

单晓成[10](2012)在《高校学生参加科技竞赛需求和受益的多元统计实例研究》文中指出本文以经典的统计分析软件SPSS软件为工具,以多元统计分析中的逐步回归与Logistic回归为主要研究方法,以2008—2010年的3年校级全国级数学建模竞赛参赛学生数据为研究对象通过数据收集缺失值分析(EM算法)变量筛选(因子分析逐步回归)数据分析统计建模(logistic回归模型)模型检验(拟合优度检验Wald显着性检验)等步骤来分析研究学生参加数学建模竞赛需求和受益模型本文通过分析学生在参加该项赛事上各项需求对学生受益的实际影响,得到哪些需求是起关键作用的,哪些是作用不显着的;在实现扩大该项赛事受益规模上,应当重点提高哪些需求指标,即我们应当为学生提供的主要保障是什么,可以适当减少的投入又是什么通过本文分析,建模培训因素团队专业因素个人综合能力和个人学习能力因素和导师指导因素对于提高数学建模参赛者的受益率占主导地位学校应该加大对学生的数学建模竞赛的培训力度,为学生配备优秀导师的进行指导以及学生应该更注重综合能力和个人学习能力的提高鼓励组队时,应尽量满足专业多元化,加强团队协作,从而更加有益于受益,诸如数学建模竞赛获奖和自身发展

二、基于EM算法学生成绩的因子分析(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、基于EM算法学生成绩的因子分析(论文提纲范文)

(1)因子服从指数分布的因子分析模型的参数估计研究(论文提纲范文)

1 模型及待估参数
2 参数估计研究
    2.1 模型参数极大似然估计的方法与原理
        2.1.1 模型的似然函数
        2.1.2 EM算法估计参数
    2.2 EM算法的收敛准则
    2.3 模拟研究
3 结语

(2)面向智能教学系统的学习者建模研究(论文提纲范文)

摘要
Abstract
第一章 绪论
    §1.1 课题的研究背景与意义
    §1.2 国内外研究现状
        §1.2.1 现有的一些智能教学系统及其应用
        §1.2.2 学习者建模研究现状
    §1.3 主要研究内容
    §1.4 论文组织结构
第二章 相关理论概述
    §2.1 贝叶斯知识追踪模型原理
        §2.1.1 模型的结构
        §2.1.2 模型的拟合与评估
        §2.1.3 交叉验证与模型的预测
    §2.2 EM算法
        §2.2.1 EM算法的推导过程
        §2.2.2 EM算法的局限性
    §2.3 ITS中的聚类算法
    §2.4 本章小结
第三章 基于演化聚类的知识追踪模型
    §3.1 问题描述
    §3.2 演化聚类知识追踪模型
        §3.2.1 模型框架
        §3.2.2基于K-Means的演化知识追踪模型
        §3.2.3 基于层次聚类的演化知识追踪模型
        §3.2.4 参数优化策略
        §3.2.5 集成策略
    §3.3 实验结果与分析
        §3.3.1 实验环境与数据集
        §3.3.2 预测与评价指标
        §3.3.3 参数优化分析
        §3.3.4 集成策略分析
        §3.3.5 预测结果分析
    §3.4 本章小结
第四章 基于问题综合难度和输入输出隐马尔可夫模型的知识追踪模型
    §4.1 问题描述
    §4.2 传统问题难度模型
    §4.3 Difficulty-BKT模型
    §4.4 综合难系数算法
        §4.4.1 理论分析
        §4.4.2 算法实现过程
    §4.5 模型训练
        §4.5.1 问题定义
        §4.5.2 训练过程
    §4.6 模型预测
    §4.7 实验结果与分析
        §4.7.1 实验环境与数据集
        §4.7.2 响应时间分析
        §4.7.3 基于难度系数的模型预测结果
    §4.8 本章小结
第五章 一种改进的深度知识追踪模型
    §5.1 问题描述
    §5.2 理论分析
        §5.2.1 深度知识追踪模型
        §5.2.2 知识点的结构关系
    §5.3 改进方法
    §5.4 实验结果与分析
    §5.5 本章小结
第六章 总结与展望
    §6.1 本文总结
    §6.2 工作展望
参考文献
致谢
作者在攻读硕士期间的主要研究成果

(3)基于EM算法的IRT模型参数估计及应用研究(论文提纲范文)

摘要
Abstract
第1章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
    1.3 主要研究内容及创新点
        1.3.1 主要研究内容
        1.3.2 本文的创新点
    1.4 论文结构安排
第2章 相关理论和技术
    2.1 项目反应理论
        2.1.1 项目反应理论概述
        2.1.2 项目反应模型
        2.1.3 项目反应模型参数估计算法
    2.2 EM算法
        2.2.1 EM算法背景
        2.2.2 算法基本原理
        2.2.3 EM算法的优劣势
    2.3 本章小结
第3章 基于EM算法的IRT模型参数估计的实现
    3.1 EM算法估计IRT模型的过程
        3.1.1 算法中的符号表示
        3.1.2 EM算法估计IRT的推导过程
    3.2 EM算法估计IRT模型的实现
        3.2.1 算法实现的影响因素分析
        3.2.2模拟实验
        3.2.3 EM算法参数估计的准确性
    3.3 基于EM算法改进的PE-PM算法
        3.3.1 EM算法并行的可行性分析
        3.3.2 PE-PM算法的技术支持
        3.3.3 实验结果
    3.4 潜变量的估计
        3.4.1 EAPE法估计潜变量
        3.4.2 潜变量估计结果
    3.5 本章小结
第4章 不同特征数据对IRT模型参数估计的影响
    4.1 区域数据与整体数据对项目参数估计的影响
        4.1.1模拟实验
        4.1.2 实验结果分析
        4.1.3 实验意义
    4.2 异常数据对参数估计的影响
        4.2.1 实验设计
        4.2.2 实验结果分析
        4.2.3 异常数据检测
    4.3 本章小结
第5章 基于EM算法的IRT模型在考试数据分析中的应用
    5.1 数据预处理
        5.1.1 数据标准化转换
        5.1.2 异常数据检测
    5.2 基于EM算法的IRT模型参数估计分析
    5.3 试卷与被试水平匹配分析
    5.4 本章小结
第6章 总结与展望
    6.1 论文总结
    6.2 研究展望
参考文献
攻读学位期间的论文发表情况
致谢

(4)因子服从Gamma分布的因子分析模型的模拟研究及其应用(论文提纲范文)

摘要
Abstract
第1章 引言
    1.1 因子分析模型的研究现状
    1.2 本文的研究内容及方法
第2章 理论预备知识简介
    2.1 极大似然估计
        2.1.1 极大似然估计的定义
        2.1.2 极大似然估计的解释
    2.2 EM算法
        2.2.1 EM算法的原理简介
        2.2.2 EM算法的收敛性
    2.3 MCMC(Markov Chain Monte Carlo)方法
        2.3.1 马尔科夫链的定义
        2.3.2 马尔科夫链的转移理论
        2.3.3 马尔科夫链的收敛性
        2.3.4 Gibbs抽样方法
        2.3.5 Metropolis-Hastings方法
        2.3.6 建议密度的选择方法
第3章 模拟计算
    3.1 参数的极大似然估计的方法与原理
        3.1.1 模型的似然函数
        3.1.2 EM算法估计参数
        3.1.3 EM算法的收敛准则
    3.2 模拟研究
第4章 实证分析
    4.1 实例的参数估计
        4.1.1 整理及标准化原始数据
        4.1.2 计算样本的相关系数矩阵
        4.1.3 用学生成绩数据估计模型中的参数
    4.2 结果分析
        4.2.1 理论结果分析
        4.2.2 实证结果分析
    4.3 原模型与新模型的比较
        4.3.1 基于模拟数据的模型比较
        4.3.2 基于学生成绩数据的模型比较
第5章 结论
    5.1 总结
    5.2 展望
附录
参考文献
攻读学位期间发表的学术论文和研究成果
致谢

(5)网络数据的判别分析和因子模型(论文提纲范文)

摘要
英文摘要
第一章 绪论
    1.1 研究背景
    1.2 网络的表示和特征
    1.3 网络数据建模的发展及现状
        1.3.1 离散型网络数据建模
        1.3.2 连续型网络数据建模
    1.4 本文研究的问题及主要结果
第二章 网络线性判别分析
    2.1 引言
    2.2 预备知识
    2.3 网络线性判别分析
        2.3.1 模型和记号
        2.3.2 网络线性判别分析
        2.3.3 稀疏NLDA
    2.4 数值研究
        2.4.1 模拟实验
        2.4.2 评价测度和模拟结果
        2.4.3 新浪微博数据集
    2.5 理论证明
        2.5.1 NLDA模型MLEs的推导
        2.5.2 定理2.3.1的证明
        2.5.3 定理2.3.2的证明
        2.5.4 定理2.3.3的证明
第三章 基于带交互项对称双向因子模型的连续网络建模
    3.1 引言
    3.2 预备知识
    3.3 带交互项对称双向因子模型
    3.4 极大似然估计及其理论性质
    3.5 数值研究
        3.5.1 模拟实验
        3.5.2 评价测度和模拟结果
    3.6 理论证明
        3.6.1 定理3.3.1的证明
        3.6.2 定理3.4.1的证明
        3.6.3 定理3.4.2的证明
        3.6.4 EM算法推导
总结
参考文献
致谢
在学期间(待)公开发表论文及着作情况

(6)基于多特征I-Vector的短语音说话人识别方法研究(论文提纲范文)

摘要
Abstract
第1章 引言
    1.1 课题研究背景和意义
    1.2 说话人识别的研究现状
    1.3 本课题的主要研究内容
        1.3.1 课题来源
        1.3.2 本课题的主要研究内容
    1.4 本章小结
第2章 说话人识别系统的总体框架设计
    2.1 说话人识别的系统框架
    2.2 说话人语音的预处理
        2.2.1 语音采样
        2.2.2 预加重
        2.2.3 分帧与加窗
        2.2.4 端点检测
    2.3 说话人特征提取
    2.4 说话人识别模型
    2.5 说话人识别性能评价标准
        2.5.1 错误接受和错误拒绝
        2.5.2 等错误率和最小检测代价
    2.6 本章小结
第3章 短语音说话人识别中的多特征融合
    3.1 语音信号的特征参数提取
        3.1.1 MFCC特征
        3.1.2 GFCC特征
        3.1.3 LPCC特征
    3.2 基于Fisher准则的多特征选择方法
        3.2.1 Fisher准则
        3.2.2 基于Fisher比的MFCC、GFCC和 LPCC特征融合算法
    3.3 基于LP_MGFCC特征的改进算法
        3.3.1 主成分分析(PCA)
        3.3.2 线性判别分析(LDA)
        3.3.3 基于PCA和 LDA的 LP_MGFCC特征补偿算法
    3.4 本章小结
第4章 基于GMM-UBM和 I-Vector的说话人模型选择
    4.1 基于GMM的说话人识别模型
        4.1.1 高斯混合模型(GMM)
        4.1.2 基于GMM的说话人识别系统
    4.2 基于GMM-UBM的说话人识别模型
        4.2.1 GMM-UBM模型
        4.2.2 MAP自适应算法
    4.3 身份认证矢量
        4.3.1 均值超矢量
        4.3.2 全局差异空间矩阵估计
        4.3.3 I-Vector提取
        4.3.4 余弦评分
    4.4 实验结果及分析
        4.4.1 实验参数设置
        4.4.2 GMM-UBM的混合度选择
        4.4.3 说话人识别模型性能比较
    4.5 本章小结
第5章 短语音说话人识别方案的验证与分析
    5.1 短语音说话人识别实验平台
        5.1.1 实验的软硬件环境
        5.1.2 实验所用语料库
    5.2 实验仿真平台设计
    5.3 实验结果及分析
    5.4 本章小结
第6章 总结与展望
    6.1 总结
    6.2 展望
参考文献
致谢
攻读硕士学位期间从事的科研工作及取得的成果

(7)Point-Adjusted Gaussian混合模型及其在结构方程模型中的应用(论文提纲范文)

摘要
Abstract
第一章 引言
第二章 EM算法与结构方程模型
    2.1 EM算法
        2.1.1 EM算法原理及步骤
        2.1.2 EM算法的性质
    2.2 结构方程模型
        2.2.1 SEM的结构
        2.2.2 SEM的拟合指数
        2.2.3 SEM建模步骤
第三章 Point-Adiusted Gaussian混合模型
    3.1 Point-Adjusted Gaussian混合模型
    3.2 模型参数的估计
    3.3 参数估计的渐近方差和渐近置信区间
第四章 模型的评价指标
第五章 随机模拟
第六章 实证研究——课堂教学结构
    6.1 数据来源及预处理
    6.2 各维度PAG混合模型参数估计
    6.3 模型结果分析
第七章 结论与展望
附录
参考文献
致谢

(8)基于隐结构的贝叶斯网络的建立及其在中医辨证中的应用(论文提纲范文)

摘要
abstract
第1章 引言
    1.1 课题背景及来源
    1.2 课题研究意义与应用前景
    1.3 国内外研究现状
        1.3.1 贝叶斯网络学习的研究
        1.3.2 含有隐结构的贝叶斯网络的研究现状
        1.3.3 贝叶斯网络在中医辨证中的具体应用
    1.4 本文所用实验数据
    1.5 本文工作与章节安排
第2章 贝叶斯网络学习
    2.1 贝叶斯网络基本概念
    2.2 基本概率公式
    2.3 完备参数下的贝叶斯网络学习
        2.3.1 参数学习
        2.3.2 结构学习
    2.4 含有隐变量的贝叶斯网络
        2.4.1 含有隐变量的贝叶斯网络的参数学习
        2.4.2 含有隐变量的贝叶斯网络的结构学习
    2.5 贝叶斯网络的推理
    2.6 本章小结
第3章 基于特征组的慢性胃炎中医证型的主症挑选及分类模型的建立
    3.1 特征选择方法简介
        3.1.1 特征选择搜索策略
        3.1.2 评价准则
        3.1.3 停止准则
        3.1.4 结果验证
    3.2 基于特征组的特征选择算法
        3.2.1 基于特征组特的征选择算法的基本思想
        3.2.2 基于特征组的特征选择算法的过程描述
    3.3 基于特征组的特征选择在慢性胃炎中医辨证中的应用
        3.3.1 基于特征组的慢性胃炎中医症状的特征选择
        3.3.2 APCC算法在中医慢性胃炎中的应用
        3.3.3 慢性胃炎中医辨证模型的定量内容研究
    3.4 本章小结
第4章 基于多维聚类的含有隐变量的中医辨证模型的建立
    4.1 算法的基本思想
        4.1.1 深度学习
    4.2 CBMC算法的过程描述
        4.2.1 多维聚类
        4.2.2 模型调整(Model Refine)
        4.2.3 参数平滑
        4.2.4 CBMC算法伪代码
    4.3 CBMC算法在慢性胃炎中医辨证中的应用
    4.4 本章小结
第5章 总结与展望
    5.1 本文工作总结
    5.2 研究前景
参考文献
致谢
攻读硕士期间成果

(9)基于主成分分析与因子分析数学模型的应用研究(论文提纲范文)

摘要
Abstract
第一章 绪论
    1.1 研究背景与意义
    1.2 发展与现状
    1.3 本文结构安排
    1.4 本文研究的主要创新点
第二章 主成分分析
    2.1 基本原理
        2.1.1 客观背景和统计思想
        2.1.2 数学模型
        2.1.3 从标准化变量得到主成分
        2.1.4 样本主成分
    2.2 机理探讨
        2.2.1 数据无量纲化
        2.2.2 数据阵的计算
        2.2.3 特征向量的确定
    2.3 本章小结
第三章 因子分析
    3.1 基本原理
        3.1.1 统计思想
        3.1.2 数学模型
    3.2 机理探讨
        3.2.1 因子载荷阵和特殊方差矩阵参数估计方法
        3.2.2 因子旋转
        3.2.3 因子得分
    3.3 本章小结
第四章 主成分分析与因子分析比较
    4.1 两者相同之处
        4.1.1 基本思想大致相同
        4.1.2 解决问题的出发点相同,步骤相似
        4.1.3 两种方法都是从信息量角度确定权数且是客观权
        4.1.4 主成分析与因子分析结果形式相似
    4.2 两者不同之处
        4.2.1 系数的意义不同
        4.2.2 系数阵的确定方式不同
        4.2.3 分析形式不同
        4.2.4 方差不同
    4.3 本章小结
第五章 主成分分析与因子分析的应用
    5.1 主成分分析法的应用
        5.1.1 SPSS软件实现过程
        5.1.2 统计分析结果和讨论
    5.2 因子分析法的应用
        5.2.1 SPSS软件实现过程
        5.2.2 统计分析结果和讨论
    5.3 评价结果综合分析
    5.4 本章小结
第六章 总结与展望
    6.1 总结
    6.2 展望
参考文献
在读期间公开发表的论文
致谢

(10)高校学生参加科技竞赛需求和受益的多元统计实例研究(论文提纲范文)

摘要
Abstract
1 绪论
    1.1 研究背景
        1.1.1 国内研究现状
        1.1.2 国外研究现状
    1.2 研究目的与意义
    1.3 创新点
    1.4 研究方案
    1.5 论文结构
2 问题分析
    2.1 数据来源
    2.2 变量的选择
        2.2.1 因变量的选择
        2.2.2 自变量的选择
    2.3 数据整理
    2.4 问题解决方案
3 实例研究
    3.1 数学建模竞赛获奖成功率影响因素的描述性分析
        3.1.1 数学建模竞赛获奖成功率关于年级的描述性分析
    3.2 缺失值处理
        3.2.1 EM 算法
        3.2.2 基于 EM 算法的填补法
    3.3 因子分析
        3.3.1 KMO 和巴特利特球形检验(Bartlett s Test)
        3.3.2 确定公因子个数
        3.3.3 特征值碎石图
        3.3.4 旋转因子成份矩阵
        3.3.5 因子成分得分系数矩阵(Component Score Coefficient Matrix)18
    3.4 模型的选择
        3.4.1 Logistic 回归模型
    3.5 模型求解
        3.5.1 基于公因子的 Logistic 逐步回归
        3.5.2 公因子的经验回归方程
        3.5.3 基于原始变量的 logistic 逐步回归
        3.5.4 原始变量的经验回归方程
    3.6 模型检验
        3.6.1 复共线性检验
        3.6.2 Wald 检验
        3.6.3 拟合优度检验
    3.7 针对第一个因变量的结论
    3.8 针对其它 4 个因变量的结论
        3.8.1 第二因变量(是否有益于提高科研水平)
        3.8.2 第三因变量(是否有益于出国留学)
        3.8.3 第四因变量(是否有益于读研)
        3.8.4 第五因变量(是否有益于就业创业)
结论
参考文献
攻读硕士学位期间所发表的学术论文
致谢

四、基于EM算法学生成绩的因子分析(论文参考文献)

  • [1]因子服从指数分布的因子分析模型的参数估计研究[J]. 周国琼,蒋文江. 云南师范大学学报(自然科学版), 2020(06)
  • [2]面向智能教学系统的学习者建模研究[D]. 郭章. 桂林电子科技大学, 2020(02)
  • [3]基于EM算法的IRT模型参数估计及应用研究[D]. 孔亚鑫. 山东师范大学, 2020(09)
  • [4]因子服从Gamma分布的因子分析模型的模拟研究及其应用[D]. 周国琼. 云南师范大学, 2020(01)
  • [5]网络数据的判别分析和因子模型[D]. 蔡巍. 东北师范大学, 2019(04)
  • [6]基于多特征I-Vector的短语音说话人识别方法研究[D]. 孙念. 重庆邮电大学, 2019(01)
  • [7]Point-Adjusted Gaussian混合模型及其在结构方程模型中的应用[D]. 胡玲. 浙江大学, 2016(08)
  • [8]基于隐结构的贝叶斯网络的建立及其在中医辨证中的应用[D]. 王灼龙. 华东理工大学, 2016(05)
  • [9]基于主成分分析与因子分析数学模型的应用研究[D]. 解素雯. 山东理工大学, 2016(02)
  • [10]高校学生参加科技竞赛需求和受益的多元统计实例研究[D]. 单晓成. 北京工业大学, 2012(01)

标签:;  ;  ;  ;  ;  

基于EM算法的学生成绩因素分析
下载Doc文档

猜你喜欢