一、SCORM学习资源的语义相似度度量(论文文献综述)
余思雨[1](2021)在《基于复杂网络的科研关系研究》文中研究指明当前,研究者在科学探索中不断产生科研成果并向社会发表,进而产生了大量的科研数据。数据的发展导致科研数据的检索、管理和分析变得越来越具有挑战性。因此,如何在庞大的科研数据中准确地检索出所需的数据,并从数据中提取有效信息进行分析已经成为研究者密切关注的问题。本文针对科研数据中同名作者和论文的对应关系以及作者间的合作关系进行探索研究。第一,本文针对论文的作者署名与现实生活中的作者实体对应关系中存在的同名歧义问题,提出了一种基于异质网络和聚类的同名消歧算法。首先,本文将科研数据背景下的同名消歧研究转化为同名论文的聚类研究,设计了论文间的语义相似度和离散特征相似度,并将其作为论文聚类的依据。随后,为了表征论文间离散特征的关系,本文采用了在异质网络中基于元路径进行随机游走的网络表示学习方法。进一步地,本文通过实验确定了语义相似度和离散特征相似度对最终论文相似度的贡献比例以及构建异质网络使用的连边类型组合。最后,实验结果证明了本文提出的同名消歧算法中各个步骤的有效性以及整体算法的有效性。第二,本文通过改进社区发现中的标签传播算法来获得关系紧密的圈子,挖掘作者间的潜在合作关系。首先,为了设计有效的属性,本文对一个特定的科研合作网络进行了特征分析。接下来,针对传统标签传播算法中存在的问题进行了分析,并就节点更新顺序和标签选择规则进行了改进。继而,本文提出了结合多层邻域重叠率和历史标签相似性的标签传播算法(Label Propagation Joint Multi-Layer Neighborhood Overlap and Historic Label Similarity,NOHLPA)。进一步地,本文通过实验确定了 NOHLPA中使用的参数值。最后,实验结果证明了 NOHLPA中各个步骤的有效性以及整体算法的有效性,继而使用NOHLPA对特定的科研合作网络进行划分,证明了 NOHLPA可以获得关系紧密且较为准确的合作圈子。
卢家伟[2](2021)在《传感器本体匹配结果的集成方法研究》文中进行了进一步梳理电力物联网中各系统设备数据具有多源、高度异构的特征,导致其间交互与共享受阻。传感器本体是语义技术的核心,为传感器数据间的协作提供有效的数据和知识的表示、管理和共享技术手段。想要解决多源异构问题,就需要将各系统设备数据转换成传感器本体并集成不同传感器本体中的异构数据实体。但由于目前没有任何一个相似度度量方法能够确保在所有的情况下都能有效识别出异构的传感器数据实体,因此需要综合考虑多种相似度度量方法才能确保匹配结果的质量。如何有效地集成不同相似度度量方法确定的传感器本体匹配结果,以确保最终匹配结果的质量是电力物联网本体领域的研究热点。围绕这一科学问题,近年来国内外学者开展了大量的研究,相关工作可大体分为以下两类:(1)求解传感器本体匹配结果的抽取问题,即如何从不同相似度度量方法确定的匹配结果中直接抽取出高质量匹配的目标;(2)求解传感器本体的元匹配问题,即如何为不同相似度度量方法确定的匹配结果赋予最优的集成权重,以提高集成的匹配结果的质量。本文分别针对以上两个问题,开展了以下的研究工作:(1)针对传感器本体匹配结果的抽取问题,面对传感器概念语义丰富且概念间关系复杂的特点,在传统的串行和并行集成方式的基础上,提出了一种基于混合相似度度量方法的传感器本体匹配结果抽取方法。该方法首先将抽取问题视为二分类问题,然后采用相似度度量方法的“并-串”混合行集成方式来抽取高质量的匹配结果。(2)针对传感器本体的元匹配问题,面对候选的集成权重规模庞大的特点,在构建三类本体异构性度量指标的基础上,提出了一种基于本体异构性度量指标的传感器本体元匹配方法。该方法首先将元匹配问题视为“本体异构值-集成权重”的回归问题,其次通过提取代表性的实体集合来拟合“本体异构值-集成权重”的回归函数,以自适应地确定相似度度量方法的集成权重。本文采用的测试数据集是国际本体匹配竞赛(Ontology Alignment Evaluation Initiative,OAEI)所提供的数据集以及两对真实的传感器本体。首先,本文将基于混合相似度度量方法的传感器本体匹配结果抽取方法与OAEI参与者和基于启发式的匹配方法进行了比较,实验结果表明该方法能够有效提高传感器本体匹配结果的质量。然后,本文将基于本体异构性度量指标的传感器本体元匹配方法同OAEI参与者进行了比较,实验结果表明该方法能够依据待匹配的传感器本体的异构特性,自适应地确定有效的匹配结果的集成权重,从而确保传感器本体匹配结果的质量。本文的研究工作能够为设计传感器本体匹配结果的集成方法提供新的研究方向和研究思路,相关研究成果能够用于集成各类异构的传感器本体,推动实现电力物联网中个系统设备数据间的交互与共享,为电力设备的展示服务、高级数据服务、智能应用服务等奠定基础。
赵云鹏[3](2021)在《多源矢量数据语义一致性处理关键技术研究》文中认为国民经济的飞速发展以及国防建设的需要,加快了地理信息数据库建设的进程。地理信息数据的应用范围不断扩大,应用层次不断深入,各领域各行业对于现势性好、语义一致的地理信息数据集的需求十分迫切。与此同时,由于应用需求不同,地理信息数据相关生产部门工作相对独立,多源矢量数据语义不一致性问题开始日益凸显,严重影响了地理信息的共享与使用。消除多源矢量数据的语义异质性既是建立统一地理信息数据集时面临的主要任务,也是提供地理信息数据服务的基本前提。因此,亟需一套理论、方法和技术来消除多源矢量数据的语义异质现象,支持生产出语义一致的矢量数据集,满足用户对于高质量地理信息数据的迫切需求。本文围绕多源矢量数据语义一致性处理关键技术展开深入研究,旨在消除多源矢量数据中存在的语义不一致性问题,为建立语义一致、精度更高的地理信息数据集提供理论和技术支撑,完成的主要工作和取得的成果如下:1.结合实际应用需求分析了本文的研究背景和意义,围绕多源矢量数据语义一致性处理涉及到的问题,对空间数据一致性、地理要素分类语义、同名地理实体匹配等国内外研究现状进行了综述,总结了当前研究中存在的不足,并提出了本文的研究目标和内容。2.明确了多源矢量数据语义一致性的定义,分析了多源矢量数据语义不一致的产生原因和具体表现,并结合地理本体关于哲学本体和信息本体上的双重阐述,从矢量数据表达的语义层次出发,探讨了矢量数据的语义结构,在此基础上提出了多源矢量数据语义一致性处理的策略和技术流程。3.研究了地理要素分类语义一致性处理问题。总结了地理要素分类的基本方法和编码原则,分析了地理要素分类语义关系,从不同的分类语义理解角度探讨了分类映射方法。阐述了基于描述性知识的分类语义理解机制,提出了顾及描述知识的地理要素分类映射方法,利用综合语义相似性建立地理要素类别的对应关系;归纳了地理要素类别的本体属性特征,建立了本体属性特征抽取和向量化表达的一般方法,提出了基于本体属性特征学习的地理要素分类映射方法,实现地理要素分类的映射。4.研究了同名地理实体匹配处理问题。阐述了同名地理实体匹配的基本思想,针对基于语义特征的地理实体匹配问题,设计了不同属性特征项的相似性度量算法和属性特征权重确定方法,提出了多语义特征约束的同名地理实体匹配方法,实现同名道路实体的语义匹配;针对基于几何特征的地理实体匹配中,传统Fréchet距离在度量同名线状要素距离时易受到曲线顶点分布及采样精度影响的问题,利用正对投影方法进行改进,并提出了结合改进Fréchet距离的同名地理实体匹配方法,改善线状地理实体的匹配效果。5.研究了地理要素属性特征一致性处理问题。分析了多源矢量数据属性特征映射转换的基本内容,设计了基于产生式结构的属性转换规则,利用XML和XML Schema对产生式属性转换规则进行分类、描述、存储和管理,实现相应的规则模板化表达,最后建立了基于规则文件控制的属性特征一致性处理方法,并进行了实例分析。6.研制了多源矢量数据语义一致性处理原型系统,介绍了系统的主要功能和实验数据概况,并对论文提出的关键技术和方法进一步进行了实验验证。
徐流畅[4](2020)在《预训练深度学习架构下的语义地址匹配与语义空间融合模型研究》文中进行了进一步梳理随着我国数字城市与智慧城市建设的不断开展,地址信息作为战略性的基础地理信息及空间数据资源,在人们日常生活中的作用愈发重要,而且在国家的经济建设、文化发展和社会管理等多方面也起到相当关键的作用。在各行各业的基于位置服务的大数据应用需求驱动下,我国各相关部门采集和积累了海量异构的地址数据。然而由于我国地址规范标准不统一以及人工采集与管理秩序的混乱,导致地址信息的解析和理解成为一大难题,也极大地限制了其在各个领域内的应用。因此,有必要从认知地址文本信息和理解地址语义知识的角度出发以形成地址语义模型,让其深入挖掘地址信息的语义特征内涵并适用于计算机的高性能运算。此外,地址特有的寻址属性使得理解和融合其语义与空间信息具有重要的理论价值和实践意义,也是当前的学术热点。针对现有的地址模型研究中所存在的语义信息表达不完善、信息智能化应用不充分以及相关任务场景泛化性弱的困境,本文利用了深度神经网络中的注意力机制及“预训练-微调”模式,将地址语义理解、语义地址匹配和空间语义融合等关联度较大的任务转为可计算的深度神经网络模型的搭建和优化问题。针对地址文本语料的特性,采用自监督学习构建深度学习架构以形成地址语义模型来支持各地址相关任务。在此基础上,通过生成有监督的匹配数据集对模型进行微调,让模型针对性地识别地址间的语义相似性并实现高精度的地址匹配任务。同时考虑到地址特有的空间属性,设计了一套遵循空间相似度规则的数据集并通过对地址语义模型的微调将空间距离与地址语义进行深度关联融合。本研究系统性地构建了语义认知理解-地址高效精确匹配-空间语义深度融合-下游应用任务验证评价的中文地址理论体系和方法架构,以百万量级的位于浙江省杭州市上城区的地址语料库为实验数据对设计的方法架构进行测试、验证和应用。本文的研究内容概况如下:(1)构建了一套以广义的自回归预训练方法为核心的深度神经网络结构下的地址语义模型来实现地址语义信息的自动获取,并将“预训练-微调”模式引入地址研究中。考虑到地址中每个字符间的相互影响和双向上下文语序关系,提出了一套以排列组合式未知字符预测为目标的地址语义模型,并利用目标位置感知的双轨自注意力结构解决建模中的目标位置信息缺失问题,最终设计了具有自学习能力并且能够提供各相关应用迁移学习能力的新型深度神经网络。实验结果表明其实现了海量多源异构地址数据集的语义信息理解和表征,为基于该模型的后续应用任务研究的优秀表现夯实了基础。(2)设计并实现了基于地址语义模型微调后的语义地址匹配建模方法。受文本蕴含及文本复述理论启发,以空间位置信息为推理条件构建带标签的有监督地址对数据集,建立了一种用于有效地址匹配任务的深度神经网络架构和训练框架。以构建的语义地址匹配数据集为对象开展实验,其结果证明了该工作能有效地解决地址匹配中存在的冗余,不完整或异常表达等情况,具有“高精度轻流程”的表现。证明了所设计模型可在弱监督训练数据下维持高水准表现。论证了“先自监督预训练-后有监督微调”的两阶段范式能极大地提高任务的准确率和有效性。(3)提出了新颖的地址语义-空间深度融合理论设计,对地址的语义-空间特征研究实现了从过去的“物理结合”到本研究中的“深度融合”的转变。构建了将空间位置信息与地址语义信息相融合的训练数据集,并在地址语义模型的基础上,通过对回归任务的微调训练搭建了语义-空间融合模型。实现了可被计算机理解的包含地址特有的寻址属性的地址表征,并设置了地址空间位置预测的下游任务以评价深度融合效果。该实验数据为地址语料及其对应的空间坐标,实验结果表明本研究设计的模型在该下游任务中相比前人的模型总有最佳表现,极大地提高了空间位置预测任务的精度。证明了所设计模型能够深度融合地址的语义和空间信息,并支持地址数据空间关联的应用任务。本研究在地址信息智能化、结构化和数值化方面,实现了其理论与建模方法上的创新及突破,解决了由大数据驱动下的地址数据质量低下及数量泛滥问题,提高了地址信息解析和挖掘的操作效率以及迁移学习能力,以推动关于城市地址模型的研究,促进智慧城市空间信息建设和大众化服务体系方法的研究与发展。
张元禛[5](2020)在《基于视觉与语义的网页识别技术研究》文中指出随着互联网技术的蓬勃发展,越来越多的用户都参与到其中。但互联网在丰富人们生活的同时也出现了令人堪忧的问题,比如大量的不良网页充斥在网络上,对人们的身心健康、财产安全都产生了巨大威胁。而如何识别这些不良网页,一直以来都是网络安全从业者的首要任务。目前存在的网页识别技术对于一些简单的非法网站有一定的检测效果,但是对于大肆传播的、隐蔽性强的不良网页尚不能完全、及时、有效地检测。从人类角度来看,我们是可以轻松的识别出哪些网页是相似的,哪些是不相似的,这归因于我们对网页的语义信息与视觉信息的理解。本论文主要基于人类理解网页的方式,尝试去提取网页内容语义特征与视觉特征,从而进行网页的相似度识别。对于网页语义相似度识别方面,本文提出基于word2vec词向量的技术方案。具体的,对于每个网页,在经过预处理后,对其进行基于TF-IDF的关键词提取作为网页摘要信息,之后利用word2vec将这些摘要信息映射到词向量空间中生成网页特征向量,最终我们利用余弦相似度来比较两个网页特征向量的相似程度。本文设计了网页聚类实验来证明本文提出语义相似度计算方案的有效性,本文采集到了wiki百科中文语料库来训练词向量,同时采集到了搜狗新闻语料库并提取了其中8类数据作为聚类数据,最终成功的通过本文的语义相似度计算方法将数据聚为了8类,且类内纯度较高。对于网页视觉相似度识别方面,本文采用了网页分块技术对网页进行视觉块的划分,之后对于每个视觉块都进行基于感知哈希的视觉特征提取,然后进行视觉树重构,将网页视觉块集合重构成为一棵视觉树,每个树节点存储该视觉块的视觉特征,最终对于每个网页生成的视觉树,本文提出了基于汉明距离与树的编辑距离的视觉相似度计算方法对其进行计算。本文设计了三个实验来验证本文视觉相似度计算方法的有效性,分别为网页分组实验、网页聚类实验、网页识别实验。网页分组实验采集了8个真实网页与其对应的钓鱼网站,共计12组网页;网页聚类实验采集了多个网站的首页的多年的变化情况作为聚类数据集,共计71个网页,12个类别;网页识别实验中,采集了1051个网页,其中51个为目标网页,1000个其他网页。最终三个实验取得了较好的效果,证明了本文提出视觉相似度识别方案的有效性。
杨清清[6](2020)在《面向公共安全监测的跨模态检索技术》文中指出多模态时空数据是具有时空信息、语义丰富、模态多样的空间数据。随着城市化进程加快,城市公共安全监管越来越重要和复杂,伴随着互联网的广泛应用和传感器及信息技术的高速发展,城市公共安全监测设施和技术手段更加普遍和多样;与此同时,城市公共安全监测过程会产生大量的多模态时空数据,如何实现多模态时空数据的跨模态检索,从而为城市公共安全事件的快速诊断、发现和预警提供有力的数据支持成为亟需解决的问题和研究重点。目前,跨模态检索技术的研究主要面向计算机领域的文本、视频和图像数据,没有考虑空间数据特有的时空特性,难以支持顾及时间、空间和语义信息的多模态时空数据跨模态检索,因此本文面向城市公共安全监测的跨模态检索需求,重点研究顾及多模态时空数据时间、空间和语义关联的跨模态检索技术。论文的主要研究内容包括:(1)基于语义的多模态时空数据关联模型。针对多模态时空数据具有的低层特征异构、高层语义相关的特点,本文提出了基于语义的多模态时空数据关联模型。该模型基于时空数据特征-语义映射机制,运用本体理论构建了多模态时空数据语义表达模型,实现了多模态时空数据的规范化语义表达;在此基础上,本文提出多模态时空数据的时间关联性、空间关联性和语义关联性计算方法,实现了多模态时空数据的关联构建和关联性度量,为面向公共安全监测的跨模态检索提供了模型支持;(2)时空语义一体化索引方法。本文针对多模态时空数据的时间、空间和语义一体化查询需求,基于Geohash编码和倒排索引结构,提出了时空语义一体化索引方法。该索引基于Geohash网格划分与编码作为空间参考,按照多模态时空数据的时间粒度进行粗粒度和细粒度的二次划分,对划分后的每个节点按层次建立时间关联状态倒排结构、空间关联状态倒排结构、语义倒排结构以及二重倒排结构,该索引充分考虑了多模态时空数据的空间分布、时间粒度和语义关联,为面向公共安全监测的跨模态检索提供了顾及时间、空间和语义的时空语义一体化索引方法支持;(3)跨模态时空数据检索方法。本文面向公共安全监测中多模态时空数据的跨模态检索需求,定义了多模态时空数据的时空关联检索模式,提出了时空变化对象的跨模态检索方法和时空变化过程的跨模态检索方法,在此基础上,基于本文提出的时空语义一体化索引,实现了时空变化对象的时空关系查询和语义相似度查询以及时空变化过程的行为过程检索和事件变化过程检索,为面向公共安全监测的跨模态检索提供了有效的检索方法。最后,本文以轨迹数据、地理视频、POI数据、矢量数据和图片等5种典型时空数据作为实验数据,实例化构建了多模态时空数据语义表达模型,基于本文给出的时间关联性、空间关联性和语义关联性计算方法,实现了多模态时空数据的关联构建和关联性分析,验证了基于语义的多模态时空数据关联模型的有效性;在此基础上,本文构建了时空语义一体化索引,并对比传统组合式索引开展了不同查询条件下的时空变化对象的跨模态检索和时空变化过程的跨模态检索的相关实验与分析,实验结果验证了本文提出的时空语义一体化索引方法和跨模态时空数据检索方法的有效性。
张云帆[7](2020)在《基于上下文信息的API使用模式和参数推荐方法研究》文中研究表明开发人员在进行编程任务时往往会面临不熟悉的问题和困难,而应用程序编程接口对于开发人员解决这些困难提供了良好的帮助。但如何正确地选择API并正确地使用API参数,对于开发人员来说仍是一大挑战。因此,针对开发人员在编程现场遇到的问题,精准且有效的推荐API使用模式及其参数具有较高的现实意义。针对上下文中的API使用模式推荐问题,本文提出了一种基于语义相似度的API使用模式推荐方法SSAPIR,该方法能够针对编程现场上下文信息,对开发人员输入的自然语言查询推荐精准的API使用模式。SSAPIR首先对高质量的大型开源Java项目进行分析,通过构建抽象语法树提取方法的上下文信息,包括API调用序列、方法描述信息和方法签名作为元数据结构;其次,使用层次聚类算法对元数据结构进行聚类,挖掘API使用模式;然后,对开发人员输入的自然语言查询进行语义信息提取,并通过语义相似度匹配算法将其和API使用模式中的描述信息进行匹配,最终推荐相似度最高的API使用模式。当开发人员获得了精准的API使用模式后,他们仍然面临着复杂的API参数选择问题。因此针对上下文信息中的API参数选择问题,本文提出了一种基于上下文信息的API参数推荐方法,该方法能够通过获取编程现场上下文信息,为开发人员使用的API进行参数推荐。首先,该方法通过对第三方API库的源代码进行分析,通过抽象语法树解析项目中各方法的调用关系,获取含参数的方法调用节点(SEED);然后,通过程序切片技术对SEED进行前向切片获得该SEED的上下文信息;最后,执行数据预处理过程,构建训练集,并将其输入到基于循环神经网络的编码-解码模型中进行训练。利用训练好的模型,结合编程现场的上下文信息即可实现API参数推荐。
张骏骁[8](2019)在《语义约束的滑坡灾情评估优势信息智能选取方法》文中进行了进一步梳理滑坡是我国危害最严重的自然灾害之一,对人民生命财产造成巨大损失,严重影响城市安全与可持续发展。滑坡灾情评估是防灾减灾工作中重要一环,评估范围包括人口伤亡数量、房屋损毁数量等不同类别数百个统计指标。全面准确的灾前灾后数据是全面客观评估灾害损失的重要支撑,损失评估需要多专业、多平台、多传感器、多源数据融合分析。随着天空地一体化对地观测技术以及评估方法的快速发展,灾情评估相关数据信息总量和数据种类大幅增加,为灾情评估带来大量高价值的多模态数据,同时也带来了冗余、过时、低相关甚至不相关的无效数据,对灾情数据分析、整合、处理提出了更高的要求,如何从多模态灾害大数据中自动、高效的筛选优势数据集,满足评估指标提取需求,辅助提升减灾应急决策能力,是当前灾害大数据管理中所面临的挑战。传统灾情数据检索主要依靠关键字匹配,受限于自然语言语义模糊问题,匹配精度差。现有的语义检索方法仅考虑数据间时空范围等简单的底层数据特征,缺乏领域知识语义显式表达与形式化建模,多源异构数据发现与共享能力差,难以应对复杂的信息检索需求;数据排序过程中缺乏数据间冗余-互补关系的探讨,难以解决冗余信息带来的信息超载问题。本文面向滑坡等重大地质灾害灾情评估数据准备需求,提出知识语义约束的灾情评估优势信息选取方法,借助知识图谱技术研究评估指标、评估模型、评估数据等灾情评估要素间知识关联建模与推理方法;进一步提出基于知识图谱的时空数据推荐方法,突破灾情评估数据准备阶段多模态数据精确检索、模型-数据协同选择等瓶颈问题,实现高相关低冗余的数据优选。具体研究内容如下:(1)滑坡灾情评估要素关联模型。系统分析灾情评估过程中评估指标、评估方法以及评估数据间的逻辑关系,构建了“任务-处理-数据”三域表达模型,描述了不同评估要素间的层次关联,建立了基于本体的评估要素统一描述模型,形成了滑坡灾情评估知识图谱逻辑结构;面向数据优选需求,总结了数据间多维多层次语义关联,形成了数据语义统一建模表达,实现从数据特征的相似性关联向语义增强的知识关联跃迁。(2)知识图谱语义关联构建与知识推理。针对时空、主题、尺度等不同特征,构建关联强度计算方法;研究基于相似度的评估要素实体匹配方法,在此基础上构建数据驱动的评估要素图谱自动生成方法,实现指标提取任务、评估模型、模型参数、数据等实体间的关联,形成完整的知识图谱;面向同质、互补、因果等高层语义关联,设计了相应元路径规则,实现基于元路径的关联推理方法。(3)基于知识图谱的灾情评估优势信息自动选取方法。借鉴特征选择理论,研究面向任务的数据集整体评价方法,定义数据相关性、冗余性与完整性评价指标;在此基础上研究最大相关最小冗余的时空数据智能选择方法,实现同构数据优选;研究融合同质关联的多模态数据关联检索方法,实现异构数据关联发现;研究耦合工作流的优势信息智能评价与选择策略,实现面向复杂任务的多要素数据优选。(4)基于以上研究成果,构建原型系统,以茂县滑坡灾害房屋损毁数量评估为例进行实验分析,验证本文理论方法的有效性。实验结果表明,本文提出的方法能有效利用评估要素间的关联关系,提高灾情评估数据选择的自动化智能化水平;其中最大相关最小冗余算法与基于相关性的数据选择方法相比,在准确率、召回率、冗余度、完整度上具有优势。本文语义约束的灾情评估优势信息智能选取方法,在理论层面上构建了滑坡灾情评估知识图谱逻辑模型与构建方法,在灾害知识工程建设领域展开了探索;方法上提出了基于图谱关联约束的数据检索推荐方法,有效提高了数据关联的广度与数据筛选的精度,提高了地质灾害灾情评估中应急响应和信息处理能力。
姜丽[9](2019)在《融合本体语义与用户属性的协同过滤推荐算法研究》文中研究指明大数据背景下,海量信息带来的信息过载问题日益严峻,如何高效快速地为用户寻找到满足需求的资源,已成为当前亟待解决的问题。推荐系统作为解决上述问题的重要工具,得到了学术界和工业界的广泛研究和应用。目前如何为用户提供更加个性化的建议是推荐算法的主要研究目标,协同过滤算法作为推荐领域中最经典的算法之一,通过具有相似喜好的用户群组为目标用户进行个性化推荐。然而伴随着数据量的不断增大,传统的协同过滤算法存在数据稀疏性、长尾现象导致的推荐精度降低等问题。针对上述问题,提出一种融合本体语义与用户属性的协同过滤推荐算法。首先,根据本体中项目的属性信息,利用本体语义相似度方法计算项目之间的相似度,构建项目相似度矩阵;其次,根据用户-项目评分矩阵提取用户属性信息,即用户兴趣度和差异度,构建用户相似度矩阵,进而融合本体语义与用户属性形成用户偏好矩阵;最后,对用户偏好矩阵的预测评分进行加权处理,完成TOP-N推荐。实验采用Movielens数据集,结果表明融合本体语义与用户属性的协同过滤推荐算法与当前流行的推荐算法相比,MAE值最低,准确率达到71%,在整体性以及新颖度上都优于其他推荐算法。该论文有图20幅,表16个,参考文献68篇。
段佳平[10](2019)在《基于FAQ的中文问答系统的研究与实现》文中研究指明中文问答系统作为一种新型答疑模式,依托于自然语言处理和人工智能相关技术,使用自然语言提问,充分理解用户意图并实时反馈答案,具有高效、准确、快速的特征,基于FAQ的中文问答系统是一种检索效率较高的实现模式,适用于专业性较强的限定领域。“互联网+教育”理念的提出推动了网络教育的进一步发展,和传统教育模式相比,网络教育有着不可比拟的优势、有其存在的价值和意义,但是,网络教育的师生问答环节存在实时性差、教育资源浪费等问题,使得学生的学习积极性和网络教育的教学质量受到影响。本文将FAQ中文问答系统应用于网络教育的师生问答环节,针对专业课程知识进行解答,具体研究工作包括以下几个方面:首先,研究基于改进TextRank的类别关键词提取算法。为了减小算法的计算复杂度,先使用基于改进ECE的候选关键词确定算法过滤常见词和类别区分度较低的词,得到候选关键词集;然后在候选关键词集上使用改进的TextRank进行文档关键词提取,求文档关键词集的并集得到类别关键词集。对TextRank的改进包括边的构建方式、边的权重确定、顶点的初始权重赋值和随机跳转概率确定四个角度;其次,研究基于类别相似度和词序列相似度的问句定位方法。首先根据类别关键词构造类别语义空间,通过计算类别向量和问句向量的相似度得到问句的类别相似度,定位相似度最高的三个类别,得到候选问题集;接着在候选问题集上采用融合词形和语义的相似度计算方法得到问句的词序列相似度;最后根据类别相似度和词序列相似度得到问句相似度,在FAQ中定位问句相似度最高的三个问句对应的问答对;最后,通过实验验证算法的有效性,并在网院学习平台中完成FAQ中文问答系统的设计与实现,在实际应用场景中验证算法的实用性。通过实验验证,在候选关键词集上进行关键词提取,不仅能够减少算法的平均耗时,而且能够在一定程度上提高关键词提取的准确率;使用改进的TextRank进行关键词提取时,算法的精确率和召回率都明显提升,但是,由于要计算基于Word2vec的词向量相似度、信息熵和期望交叉熵,改进算法的平均耗时有所增加;类别相似度计算算法的p@k值和问句定位算法的平均倒数排名都有良好表现。根据系统测试结果,本文设计的用于专业课程知识问答的FAQ中文问答系统拥有良好的准确性和系统响应时间。
二、SCORM学习资源的语义相似度度量(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、SCORM学习资源的语义相似度度量(论文提纲范文)
(1)基于复杂网络的科研关系研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 研究内容 |
1.4 组织结构 |
第二章 相关技术 |
2.1 异质信息网络 |
2.2 文本相似度度量 |
2.3 聚类算法 |
2.4 标签传播算法 |
2.5 本章小结 |
第三章 同名作者和论文的对应关系研究 |
3.1 引言 |
3.2 基于异质网络和聚类的同名消歧算法 |
3.2.1 算法描述 |
3.2.2 论文相似度度量设计 |
3.2.3 基于异质网络的随机游走 |
3.2.4 DBSCAN聚类 |
3.3 实验与分析 |
3.3.1 数据源 |
3.3.2 评价指标 |
3.3.3 实验及结果分析 |
3.4 本章小结 |
第四章 作者间的合作关系研究 |
4.1 引言 |
4.2 科研合作关系网分析 |
4.3 结合多层邻域重叠率和历史标签相似性的标签传播算法 |
4.3.1 算法描述 |
4.3.2 节点更新顺序设计 |
4.3.3 标签选择的属性设计 |
4.3.4 节点偏好计算 |
4.4 实验与分析 |
4.4.1 数据源 |
4.4.2 评价指标 |
4.4.3 实验及结果分析 |
4.5 科研合作关系发现 |
4.6 本章小结 |
第五章 总结与展望 |
5.1 论文工作总结 |
5.2 研究展望 |
参考文献 |
致谢 |
作者攻读学位期间发表的学术论文目录 |
(2)传感器本体匹配结果的集成方法研究(论文提纲范文)
摘要 |
Abstract |
主要符号表 |
第一章 绪论 |
1.1 课题的背景与意义 |
1.2 国内外研究现状 |
1.2.1 启发式的本体匹配结果集成方法 |
1.2.2 基于权重的本体匹配结果集成方法 |
1.3 研究内容及创新 |
1.3.1 本文研究内容与章节安排 |
1.3.2 本文工作的特色与创新 |
1.4 本章小结 |
第二章 传感器本体异构问题和相似度度量方法 |
2.1 传感器本体和传感器本体异构问题 |
2.2 相似度度量方法 |
2.2.1 基于术语的相似度度量方法 |
2.2.2 基于语义的相似度度量方法 |
2.2.3 基于结构的相似度度量方法 |
2.3 相似度度量方法的集成方式 |
2.4 传感器本体匹配结果的质量评估指标 |
2.5 本章小结 |
第三章 基于混合相似度度量方法的传感器本体匹配结果抽取方法 |
3.1 传感器本体匹配结果的抽取问题 |
3.2 传感器本体匹配结果的抽取框架 |
3.3 传感器本体匹配结果的抽取方法 |
3.4 实验 |
3.4.1 测试数据集与实验配置 |
3.4.2 实验结果与分析 |
3.5 本章小结 |
第四章 基于本体异构性度量指标的传感器本体元匹配方法 |
4.1 传感器本体元匹配问题 |
4.2 基于本体异构性度量指标的传感器本体元匹配方法的框架 |
4.3 传感器本体异构性度量指标 |
4.4 回归函数的拟合方法 |
4.5 实验 |
4.5.1 测试数据集与实验配置 |
4.5.2 实验结果与分析 |
4.6 本章小结 |
第五章 总结与展望 |
5.1 论文主要研究工作 |
5.2 未来展望 |
参考文献 |
致谢 |
个人简介、在学期间研究成果及发表学术论文 |
(3)多源矢量数据语义一致性处理关键技术研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景与意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外研究现状与问题分析 |
1.2.1 空间数据一致性研究 |
1.2.2 地理要素分类语义研究 |
1.2.3 同名地理实体匹配研究 |
1.2.4 现有研究存在的不足 |
1.3 选题来源 |
1.4 论文研究的目标与内容 |
1.4.1 研究目标 |
1.4.2 主要研究内容 |
1.5 论文的组织结构 |
第二章 多源矢量数据语义一致性处理基础理论 |
2.1 多源矢量数据语义一致性的定义 |
2.2 多源矢量数据语义不一致的原因及表现 |
2.2.1 语义不一致的原因 |
2.2.2 语义不一致的表现 |
2.3 矢量数据的语义结构分析与描述 |
2.3.1 本体与地理本体 |
2.3.2 矢量数据的语义层次 |
2.3.3 矢量数据的语义模型 |
2.4 矢量数据语义一致性处理的策略与流程 |
2.4.1 矢量数据语义一致性处理的策略 |
2.4.2 矢量数据语义一致性处理的基本流程 |
2.5 本章小结 |
第三章 地理要素分类语义一致性处理技术 |
3.1 地理要素的分类与编码 |
3.1.1 地理要素分类的基本方法 |
3.1.2 地理要素类别的编码原则 |
3.2 地理要素分类语义理解与映射 |
3.2.1 地理要素分类的语义关系 |
3.2.2 地理要素分类的语义理解 |
3.2.3 地理要素分类的语义映射 |
3.3 顾及描述知识的地理要素分类映射方法 |
3.3.1 地理类别概念的描述性知识 |
3.3.2 语义相似度度量与地理要素分类映射 |
3.3.3 实验验证与分析 |
3.4 基于本体属性特征学习的地理要素分类映射方法 |
3.4.1 地理类别概念的本体属性特征 |
3.4.2 地理要素分类语义关系的描述与学习 |
3.4.3 实验验证与分析 |
3.5 本章小结 |
第四章 同名地理实体匹配处理技术 |
4.1 同名地理实体匹配的基本思想 |
4.1.1 同名地理实体的相似性 |
4.1.2 同名地理实体的匹配特征 |
4.1.3 同名地理实体的匹配策略 |
4.2 多语义特征约束的同名地理实体匹配方法 |
4.2.1 地理实体的语义结构模型 |
4.2.2 多特征约束的语义相似性度量模型 |
4.2.3 实验验证与分析 |
4.3 结合改进Fréchet距离的同名地理实体匹配方法 |
4.3.1 Fréchet距离及其存在的问题 |
4.3.2 结合改进Fréchet距离的几何相似性度量模型 |
4.3.3 实验验证与分析 |
4.4 本章小结 |
第五章 地理要素属性特征一致性处理技术 |
5.1 地理要素属性特征的映射转换 |
5.1.1 分类编码的约束 |
5.1.2 属性特征的转换 |
5.2 属性转换规则的定义、描述与实现 |
5.2.1 产生式属性转换规则的定义 |
5.2.2 属性转换规则的描述与管理 |
5.2.3 属性转换规则的模板化实现 |
5.3 基于规则文件控制的属性特征一致性处理 |
5.3.1 属性特征一致性处理流程 |
5.3.2 属性特征转换效果评估 |
5.3.3 实例分析 |
5.4 本章小结 |
第六章 语义一致性处理原型系统与功能实现 |
6.1 实验介绍 |
6.1.1 实验系统概述 |
6.1.2 系统的主要功能 |
6.1.3 实验数据与内容 |
6.2 矢量数据语义一致性处理功能实现 |
6.2.1 地理要素分类语义一致性处理实验 |
6.2.2 同名地理实体匹配处理实验 |
6.2.3 地理要素属性特征一致性处理实验 |
6.3 本章小结 |
第七章 总结与展望 |
7.1 研究总结 |
7.1.1 主要工作 |
7.1.2 主要创新点 |
7.2 研究展望 |
致谢 |
参考文献 |
作者简历 攻读博士学位期间完成的主要工作 |
(4)预训练深度学习架构下的语义地址匹配与语义空间融合模型研究(论文提纲范文)
致谢 |
摘要 |
Abstract |
术语缩写表 |
1 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 地名地址匹配方法研究 |
1.2.2 自然语言建模方法研究 |
1.2.3 自然语言模型方法下的位置语义融合研究 |
1.2.4 存在问题与不足 |
1.3 研究目的 |
1.4 研究内容 |
1.5 章节安排 |
2 自监督预训练式的地址语义建模研究 |
2.1 中文地址数据结构及预处理 |
2.1.1 中文地址数据现状及特点 |
2.1.2 自监督语义表征学习的优势 |
2.1.3 实验数据及地址清洗预处理 |
2.2 深度学习架构下的语义表征方法 |
2.2.1 深度学习架构相关理论 |
2.2.2 自然语言自注意力机制理论 |
2.2.3 神经网络语言模型通用结构 |
2.2.4 自监督预训练语言模型理论 |
2.3 地址语义模型设计 |
2.3.1 基于多头自注意力的语义特征提取 |
2.3.2 克服地址长距离依赖的循环机制 |
2.3.3 排列组合式未知字符预测的目标 |
2.3.4 目标位置感知的双轨自注意力结构 |
2.3.5 局部预测优化设计 |
2.3.6 整体模型结构 |
2.4 地址语义模型训练框架 |
2.4.1 模型输入与超参数 |
2.4.2 目标函数 |
2.4.3 神经网络优化器设计 |
2.5 实验设计与模型验证 |
2.5.1 实验设计 |
2.5.2 实验结果分析 |
2.6 本章小结 |
3 基于地址语义模型微调的地址匹配研究 |
3.1 地址匹配相关理论 |
3.1.1 地址匹配相关概念 |
3.1.2 地址匹配原理 |
3.1.3 语义地址匹配定义 |
3.2 基于空间推理的等价地址语义数据集构建 |
3.2.1 文本蕴含及文本复述理论 |
3.2.2 带标签的地址匹配数据集重构设计 |
3.2.3 语义地址匹配数据集增强 |
3.3 语义地址匹配任务建模 |
3.3.1 深度神经网络模型微调理论 |
3.3.2 基于地址匹配分类任务的模型微调与训练 |
3.4 实验设计与分析 |
3.4.1 实验设计 |
3.4.2 实验结果分析 |
3.5 本章小结 |
4 地址语义-空间信息融合研究 |
4.1 地址语义-空间信息融合设计 |
4.1.1 文本语义相似度理论 |
4.1.2 地址间空间相似度设计 |
4.1.3 地址文本空间相似融合数据集构建 |
4.2 地址语义-空间信息融合任务建模 |
4.2.1 基于地址语义空间相似融合回归任务的模型微调与训练 |
4.3 空间坐标预测的下游验证评价任务 |
4.4 实验设计与分析 |
4.4.1 实验设计 |
4.4.2 实验结果分析 |
4.5 本章小结 |
5 总结与展望 |
5.1 研究总结 |
5.2 研究特色与创新 |
5.3 研究展望 |
参考文献 |
作者简历 |
(5)基于视觉与语义的网页识别技术研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题研究的背景 |
1.2 课题研究的意义 |
1.3 国内外研究现状和分析 |
1.3.1 基于文本和URL的网页识别 |
1.3.2 基于结构相似度的网页识别 |
1.3.3 基于视觉相似度的网页识别 |
1.3.4 国内外文献综述解析 |
1.4 课题的主要研究内容和贡献 |
1.5 内容安排 |
第2章 系统理论与技术基础 |
2.1 DOM树 |
2.2 VIPS算法 |
2.3 词向量模型 |
2.3.1 向量空间模型 |
2.3.2 词的分布式表达—词向量 |
2.4 关键词提取技术—词频与逆文档频率 |
2.5 相似度比较技术 |
2.5.1 余弦相似度 |
2.5.2 汉明距离 |
2.5.3 树的最小编辑距离 |
2.6 本章小结 |
第3章 基于词向量的网页语义相似度计算 |
3.1 引言 |
3.2 网页文本提取与数据预处理 |
3.3 词向量训练 |
3.4 特征向量构建 |
3.5 语义相似度计算 |
3.6 本章小结 |
第4章 基于VIPS算法的网页视觉相似度计算 |
4.1 引言 |
4.2 网页视觉块提取 |
4.2.1 可视块提取 |
4.2.2 分隔符检测 |
4.2.3 视觉块重构 |
4.3 视觉特征提取 |
4.3.1 基于视觉块位置与内容的视觉特征提取 |
4.3.2 基于视觉块图像的视觉特征提取 |
4.4 视觉树重构 |
4.5 视觉相似度计算 |
4.5.1 视觉块关系映射 |
4.5.2 视觉相似度计算 |
4.6 本章小结 |
第5章 实验结果与分析 |
5.1 网页语义相似度验证实验 |
5.1.1 词向量的训练与质量验证 |
5.1.2 网页特征向量构建方法有效性验证 |
5.2 网页视觉相似度验证实验 |
5.2.1 相似度匹配实验 |
5.2.2 聚类实验 |
5.2.3 网页识别实验 |
5.3 本章小结 |
结论 |
参考文献 |
攻读硕士学位期间发表的论文 |
致谢 |
(6)面向公共安全监测的跨模态检索技术(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 跨模态数据关联方法研究现状 |
1.2.2 时空索引研究现状 |
1.3 论文研究内容与组织结构 |
第二章 基于语义的多模态时空数据关联模型 |
2.1 概述 |
2.2 多模态时空数据规范化语义表达 |
2.2.1 本体理论相关概念 |
2.2.2 时空数据特征-语义映射 |
2.2.3 多模态时空数据语义表达模型 |
2.3 多模态时空数据关联性度量方法 |
2.3.1 时间关联性计算 |
2.3.2 空间关联性计算 |
2.3.3 语义关联性计算 |
2.4 本章小结 |
第三章 时空语义一体化索引方法 |
3.1 概述 |
3.1.1 Geohash |
3.1.2 倒排索引 |
3.2 时空语义一体化索引结构 |
3.2.1 索引设计思想 |
3.2.2 索引结构 |
3.3 时空语义一体化索引算法 |
3.3.1 索引构建算法 |
3.3.2 索引项插入算法 |
3.3.3 索引项删除算法 |
3.4 本章小结 |
第四章 跨模态时空数据检索方法 |
4.1 概述 |
4.2 时空关联检索模式 |
4.3 时空变化对象的跨模态检索 |
4.3.1 时空关系查询 |
4.3.2 语义相似度查询 |
4.4 时空变化过程的跨模态检索 |
4.4.1 行为过程检索模式 |
4.4.2 事件变化过程检索 |
4.5 本章小结 |
第五章 实验与分析 |
5.1 实验数据 |
5.2 多模态时空数据关联模型的构建 |
5.2.1 实例化多模态时空数据语义表达模型 |
5.2.2 多模态时空数据的关联性度量与分析 |
5.3 时空语义一体化索引构建性能分析 |
5.4 跨模态时空数据检索实验与分析 |
5.4.1 语义相似度查询分析 |
5.4.2 行为过程检索分析 |
5.4.3 事件变化过程检索分析 |
5.5 本章小节 |
第六章 总结与展望 |
6.1 研究工作总结 |
6.2 研究工作展望 |
致谢 |
参考文献 |
攻读硕士学位期间取得的成果 |
(7)基于上下文信息的API使用模式和参数推荐方法研究(论文提纲范文)
摘要 |
abstract |
注释表 |
缩略词 |
第一章 绪论 |
1.1 课题研究背景 |
1.2 国内外研究现状 |
1.2.1 基于频繁序列挖掘的API使用模式推荐技术 |
1.2.2 基于机器学习的API序列推荐技术 |
1.2.3 基于搜索的API参数推荐技术 |
1.3 本文的主要研究内容和创新点 |
1.4 本文各章内容安排 |
第二章 API使用模式和参数推荐相关技术 |
2.1 程序静态分析 |
2.1.1 抽象语法树 |
2.1.2 静态程序切片 |
2.1.3 Eclipse JDT |
2.2 自然语言处理 |
2.2.1 自然语言理解 |
2.2.2 信息检索 |
2.2.3 Stanfor NLP |
2.3 聚类算法 |
2.4 深度学习 |
2.4.1 循环神经网络 |
2.4.2 长短时记忆网络LSTM |
2.4.3 RNN Encoder-Decoder模型 |
2.5 本章小结 |
第三章 基于语义相似度的API使用模式推荐方法 |
3.1 方法框架 |
3.2 数据预处理 |
3.3 元数据结构提取 |
3.3.1 构建项目数据集 |
3.3.2 提取API调用序列 |
3.3.3 提取注释信息和方法签名 |
3.4 API使用模式挖掘 |
3.5 基于语义相似度的API使用模式推荐算法 |
3.6 本章小结 |
第四章 基于上下文信息的API参数推荐方法 |
4.1 方法概述 |
4.2 实例分析 |
4.3 含参数的方法调用信息提取 |
4.4 参数上下文信息提取 |
4.4.1 参数类型分类 |
4.4.2 参数上下文信息数据集构建 |
4.5 基于深度神经网络的模型训练和参数推荐 |
4.5.1 数据准备 |
4.5.2 RNN Encoder-Decoder参数推荐模型训练和推荐 |
4.6 本章小结 |
第五章 实验及结果分析 |
5.1 基于语义相似度的API使用模式推荐方法实验 |
5.1.1 实验准备 |
5.1.2 实验设置 |
5.1.3 实验一 |
5.1.4 实验二 |
5.1.5 实验三 |
5.2 基于上下文信息的API参数推荐方法实验 |
5.2.1 实验设置 |
5.2.2 实验四 |
5.3 本章小结 |
第六章 总结和展望 |
6.1 总结 |
6.2 未来工作展望 |
参考文献 |
致谢 |
在学期间的研究成果及发表的学术论文 |
(8)语义约束的滑坡灾情评估优势信息智能选取方法(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 语义关联描述与表达研究综述 |
1.2.2 语义关联构建研究综述 |
1.2.3 时空信息智能选取方法研究综述 |
1.3 研究目标 |
1.4 研究内容 |
1.4.1 滑坡灾情评估知识图谱形式化表达 |
1.4.2 滑坡灾情评估知识图谱关系抽取 |
1.4.3 基于知识图谱的灾情信息优选方法 |
1.5 论文组织结构 |
第2章 滑坡灾情评估要素关联模型 |
2.1 多评估要素耦合的层次表达模型 |
2.1.1 滑坡灾害灾情评估要素 |
2.1.2 多层次语义关联统一描述 |
2.2 滑坡灾情评估要素本体建模 |
2.2.1 评估任务 |
2.2.2 评估模型 |
2.2.3 模型参数 |
2.2.4 评估数据 |
2.2.5 要素间关联 |
2.3 滑坡灾情评估知识图谱结构与形式化表达 |
2.4 本章小结 |
第3章 灾情评估知识图谱构建与知识推理 |
3.1 滑坡灾情评估知识图谱构建流程概述 |
3.2 基于语义相似度的关联关系度量 |
3.2.1 内容关联度量 |
3.2.2 时空关联度量 |
3.2.3 尺度关联度量 |
3.3 数据驱动的灾情评估知识图谱关联自动构建 |
3.3.1 面向工作流的参数节点关联构建 |
3.3.2 基于相似度的评估数据关联构建 |
3.4 基于元路径的语义关联推理方法 |
3.4.1 异构信息网络与元路径 |
3.4.2 元路径规则构建 |
3.4.3 “因果-同质-互补”高层语义关联生成 |
3.5 本章小结 |
第4章 基于知识图谱的灾情评估优势信息选取方法 |
4.1 滑坡灾情评估信息优选方法框架 |
4.2 融合语义关联的评价指标 |
4.2.1 相关性评价指标 |
4.2.2 完整性评价指标 |
4.2.3 冗余-互补评价指标 |
4.3 顾及冗余的多源数据优选方法 |
4.3.1 基于数据价值理论的效用函数构建 |
4.3.2 最大相关最小冗余数据优选算法 |
4.4 面向任务的优势信息智能评价与选择策略 |
4.4.1 模型-数据耦合的参数节点精度评估 |
4.4.2 耦合工作流的数据自适应选择方法 |
4.5 本章小结 |
第5章 滑坡灾情评估信息优选原型系统及实验分析 |
5.1 概述 |
5.1.1 实验数据 |
5.1.2 原型系统架构 |
5.2 面向灾情评估任务数据优选实例分析 |
5.2.1 图谱建模与关联推理实例 |
5.2.2 最大相关最小冗余数据优选算法实验分析 |
5.2.3 多模态数据关联检索实验分析 |
5.2.4 面向任务的数据选择实验分析 |
5.3 分析与讨论 |
第6章 总结与展望 |
6.1 研究总结 |
6.2 未来展望 |
参考文献 |
附录 :攻读博士学位期间的主要工作与科研成果 |
致谢 |
(9)融合本体语义与用户属性的协同过滤推荐算法研究(论文提纲范文)
致谢 |
摘要 |
abstract |
变量注释表 |
1 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.3 本文研究内容 |
1.4 论文组织结构 |
1.5 本章小结 |
2 相关基础理论 |
2.1 个性化推荐算法 |
2.2 协同过滤推荐算法 |
2.3 本体语义相似度 |
2.4 协同过滤算法存在的问题 |
2.5 本章小结 |
3 融合本体语义与用户属性的协同过滤推荐算法 |
3.1 基于本体语义的项目相似度计算 |
3.2 用户属性相似度 |
3.3 长尾项目处理 |
3.4 算法描述 |
3.5 本章小结 |
4 实验结果与分析 |
4.1 实验数据 |
4.2 实验度量标准 |
4.3 仿真实验结果与分析 |
4.4 本章小结 |
5 结论与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
作者简历 |
学位论文数据集 |
(10)基于FAQ的中文问答系统的研究与实现(论文提纲范文)
摘要 |
ABSTRACT |
符号对照表 |
缩略语对照表 |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 问答系统研究现状 |
1.2.2 FAQ问答系统相关技术研究现状 |
1.3 研究内容 |
1.4 组织架构 |
第二章 相关理论与技术研究 |
2.1 文本预处理技术 |
2.2 基于TextRank的关键词提取 |
2.3 基于Word2vec的相似度计算 |
2.4 基于相似度计算的问句分类 |
2.5 评价标准 |
2.6 本章小结 |
第三章 类别关键词提取和问句定位方法研究 |
3.1 本文研究概述 |
3.2 文本预处理和实验数据 |
3.2.1 文本预处理 |
3.2.2 实验数据 |
3.3 基于改进ECE的候选关键词确定方法 |
3.3.1 改进的期望交叉熵 |
3.3.2 基于改进ECE的候选关键词确定算法 |
3.3.3 实验分析 |
3.4 基于改进TextRank的类别关键词提取方法 |
3.4.1 TextRank不足及改进方向概述 |
3.4.2 TextRank算法的改进 |
3.4.3 基于改进TextRank的类别关键词提取算法 |
3.4.4 实验分析 |
3.5 基于相似度计算的问句定位方法 |
3.5.1 问句的类别相似度 |
3.5.2 问句的词序列相似度 |
3.5.3 基于类别和词序列相似度的问句定位算法 |
3.5.4 实验分析 |
3.6 本章小结 |
第四章 FAQ中文问答系统原型设计与实现 |
4.1 需求分析 |
4.2 系统原型设计与实现 |
4.2.1 概要设计 |
4.2.2 详细设计与实现 |
4.3 本章小结 |
第五章 实验分析与系统测试 |
5.1 关键词提取算法实验分析 |
5.1.1 实验目的和内容 |
5.1.2 实验过程和结论 |
5.1.3 资源管理模块测试 |
5.2 问句定位算法实验分析 |
5.2.1 实验目的和内容 |
5.2.2 实验过程和结论 |
5.2.3 自动问与答模块测试 |
5.2.4 失配问题处理模块测试 |
5.3 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
作者简介 |
四、SCORM学习资源的语义相似度度量(论文参考文献)
- [1]基于复杂网络的科研关系研究[D]. 余思雨. 北京邮电大学, 2021(01)
- [2]传感器本体匹配结果的集成方法研究[D]. 卢家伟. 福建工程学院, 2021(02)
- [3]多源矢量数据语义一致性处理关键技术研究[D]. 赵云鹏. 战略支援部队信息工程大学, 2021
- [4]预训练深度学习架构下的语义地址匹配与语义空间融合模型研究[D]. 徐流畅. 浙江大学, 2020(01)
- [5]基于视觉与语义的网页识别技术研究[D]. 张元禛. 哈尔滨工业大学, 2020(02)
- [6]面向公共安全监测的跨模态检索技术[D]. 杨清清. 电子科技大学, 2020(07)
- [7]基于上下文信息的API使用模式和参数推荐方法研究[D]. 张云帆. 南京航空航天大学, 2020(07)
- [8]语义约束的滑坡灾情评估优势信息智能选取方法[D]. 张骏骁. 西南交通大学, 2019(06)
- [9]融合本体语义与用户属性的协同过滤推荐算法研究[D]. 姜丽. 辽宁工程技术大学, 2019(07)
- [10]基于FAQ的中文问答系统的研究与实现[D]. 段佳平. 西安电子科技大学, 2019(02)