新能源之建筑节能论文提纲

2022-11-15 版权声明 我要投稿

论文题目:基于文本挖掘技术的学术研究趋势自动化识别及可视化技术研究

摘要:文本挖掘是处理海量文本数据最重要的技术手段之一。随着信息技术和社会各行各业的发展,相关的信息资源和论文研究数据的爆炸式增长,为文本挖掘带来了发展机遇和挑战。文本数据不同于其他类型的数据,它大都以非结构化的形式存在,而文本数据特别是研究性论文数据中蕴含着大量专家学者的重要研究观点和意见方法,单凭人力读取和处理这些信息资源,不仅耗时费力,而且难以全面获取多类型的有价值信息。这些现象的存在凸显了文本挖掘技术的重要性。现有论文分析方法主要以人力总结和计量式论文分析方法为主,存在明显的不足和缺陷。如何有效构建基于文本挖掘技术的新型文本数据分析及解读方法值得深入研究。由此,本文通过深入探索多种文本挖掘和数据可视化技术,以建筑节能领域和物流领域内的具体论文数据为基础,构建一套学术趋势自动化识别和可视化方法。首先,从Science Direct数据库中提取出与建筑节能和物流相关的综述型论文,分别是4951和496篇,以此为研究素材;其次,根据论文数据的结构特征建立预处理方法,构建论文的基础信息语料库,如“年份”,“期刊”、“作者”、“关键词”和“摘要”等;再次,采用TF-IDF算法、图论和社交网络分析、LDA主题模型和情感分析等方法,构建多层次的论文数据挖掘方法;最后,以R语言为工具,自主开发可视一体化分析工具,将本研究构建的理论方法嵌入到实践工具中,帮助研究人员全面快速了解相关领域的总体研究趋势和动态。本文的主要结论如下:本文验证了文本挖掘技术在处理学术论文数据中的可行性和有效性。本文构建的文本挖掘及可视化方法可以帮助研究人员快速完成学术趋势的自动化识别和结果可视化。针对建筑节能领域的综述型研究,本文获得的要点信息包括:(1)最主要研究主题有:建筑节能的起源和发展阶段、气候变化带来的影响及政府应对气候变化的措施、建筑节能改善的具体环节、各种方法和技术的总结、不同阶段和时期节能减排的工作进程和成果、建筑围护结构研究、新能源的开发和利用、节能意识和建筑节能对人类发展的重要性;(2)本数据集内的文章主要投稿期刊是“Renewable and Sustainable Energy Reviews”、“Journal of Cleaner Production”、“Energy and Buildings”、“Applied Energy”和“Construction and Building Materials”等;(3)重要的研究时间节点是1992年、1997年、2009年和2015年;(4)有影响力的研究人员有Kamaruzzaman Sopian、Saidur Rahman和Jian Zuo三个和五个重要关系对Jingjing Jiang与Bin Ye、Vygandas Gaigalis与Romualdas Skema、Yunho Hwang与Reinhard Radermacher、Bj?rn Petter Jelle与Arild Gustavsen,以及Baolong Wang和Xianting Li;(5)研究中出现最多的关键词有新能源开发(Renewable energy)、能源有效利用(Energy efficiency)、环境、经济和能源的可持续发展(Sustainability)、太阳能(Solar energy)和研究地区中国(China)等关键词。针对物流领域的综述型研究,本文获得的要点信息包括:(1)论文中重要的时间节点是2010年;(2)217个期刊中,结合被刊载量和影响因子获得的重要期刊有“Journal of Cleaner Production”、“Renewable and Sustainable Energy Reviews”、“European Journal of Operational Research”、“International Journal of Production Economics”和“Omega”;(3)论文中相对重要的作者是:JoséM Merigó,Robert Pellerin和Joseph Sarkis,合作关系紧密的作者对是:Angappa Gunasekaran和Eric W.T.Ngai、Angappa Gunasekaran和Eric W.T.Ngai、Bruno De Meulenaer和Frank Devlieghere等;(4)重要的研究关键词有物流、可持续发展、绿色供应链、交通运输发展、闭环经济、人道物流和人工智能等,而该数据集中研究的两大主题是供应链管理和发展以及绿色物流的发展。本文基于文本挖掘技术构建出一种新的文本挖掘通用方法,实现在短时间内最快挖掘大量文本数据,并获得有用的研究趋势和动态信息,另外,借助建筑节能和物流领域的论文数据进行研究方法和交互式软件实用性和适用性的验证,发现自主开发的交互式软件为挖掘结果的直观呈现和解读提供了极大的便利。更重要的是,该方法不仅为初入相关学术领域的学者了解行业的重要信息和趋势提供了客观方法和工具,也为学者们的论文研究拓宽了思路,更为政策指定者指明了前进方向。

关键词:文本挖掘技术;可视化技术;TF-IDF算法;图论;社交网络分析;Latent Dirichlet Allocation主题模型;情感分析

学科专业:物流工程(专业学位)

摘要

ABSTRACT

第1章 绪论

1.1 研究背景

1.2 研究目标与意义

1.2.1 研究目标

1.2.2 研究意义

1.3 行文脉络

第2章 文本挖掘技术和可视化技术研究综述与趋势识别论文分析

2.1 国内外研究现状

2.1.1 文本挖掘技术

2.1.2 趋势识别研究

2.1.3 数据挖掘可视化

2.2 研究问题提炼

2.3 研究内容

2.3.1 论文数据确定和预处理

2.3.2 分析方法和数据可视化

2.4 技术路线

第3章 研究理论基础及方法

3.1 TF-IDF算法

3.1.1 特征项频率TF

3.1.2 逆文本频数IDF

3.1.3 TF-IDF算法应用

3.2 图论(GRAPH THEORY)和社交网络分析(SOCIAL NETWORK ANALYSIS)

3.2.1 图论

3.2.2 社交网络分析

3.2.3 图论和社交网络分析方法应用

3.3 主题模型

3.3.1 LDA(Latent Dirichlet Allocation)主题模型基本原理

3.3.2 基于Gibbs抽样的参数估计

3.3.3 模型输入和主题数确定

3.3.4 主题模型可视化

3.4 情感分析

3.4.1 情感分析定义

3.4.2 情感分析实操

3.5 数据分析和可视化平台

3.6 本章小结

第4章 基于建筑节能和物流领域论文数据构建语料库

4.1 数据采集

4.1.1 文本数据特征

4.1.2 论文文本数据采集来源

4.2 数据预处理

4.2.1 数据清洗和预处理

4.2.2 建筑节能和物流领域论文数据语料库

4.3 本章小结

第5章 多层次学术论文信息挖掘及可视化方法

5.1 研究方法和问题

5.2 基于TF-IDF算法的重要学术年份、期刊和年度重要关键词识别

5.2.1 年份数据集研究

5.2.2 期刊数据集研究

5.2.3 关键词数据研究

5.3 基于图论和社交网络分析的权威关系识别

5.3.1 作者数据集

5.3.2 作者关系邻接矩阵(AdjacencyMatrix)和作者关系网络

5.3.3 单个重要作者识别

5.3.4 重要作者关系对识别

5.3.5 小结

5.4 基于LDA(Latent Dirichlet Allocation)主题模型和情感分析的关键主题研究---摘要数据集

5.4.1 最优主题数

5.4.2 LDA主题模型可视化和主题解读

5.4.3 基于情感分析的感情基调研究

5.5 数据可视化一体呈现

5.5.1 交互式一体可视化

5.5.2 交互式软件------论文研究一体化展示

5.6 本章小结

第6章 结论及建议

6.1 结论

6.2 本文创新点

6.3 后续研究建议

参考文献

指导教师对学位论文的学术评语

学位论文答辩委员会决议书

附录1:年份数据分析代码及结果

附录2:期刊数据集分析代码及部分结果

附录3:关键词数据集分析代码及分析结果

附录4:作者数据集分析部分代码及结果

附录5:摘要数据集分析部分代码及结果

附录6:交互式界面代码和界面呈现

致谢

上一篇:园林景观工程建设论文提纲下一篇:中学篮球论文提纲