图书介绍

学术WEB主题结构挖掘研究【2025|PDF下载-Epub版本|mobi电子书|kindle百度云盘下载】

学术WEB主题结构挖掘研究
  • 杨波著 著
  • 出版社: 南京:南京大学出版社
  • ISBN:9787305198267
  • 出版时间:2018
  • 标注页数:204页
  • 文件大小:30MB
  • 文件页数:216页
  • 主题词:学术研究-网络信息资源-主题分析

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

学术WEB主题结构挖掘研究PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第一章 引言1

1.1 研究背景1

1.1.1 基于文本的主题聚类2

1.1.2 基于链接分析的主题聚类3

1.1.3 基于复合网页特征的主题聚类4

1.1.4 基于宏观网络拓扑结构的Web主题社区发现5

1.1.5 基于Web访问日志的用户社区发现6

1.1.6 基于Web主题图的信息浏览和检索可视化7

1.2 研究意义8

1.3 Web主题结构分析研究现状9

1.3.1 Web显著性指标研究9

1.3.2 基于学术Web的机构主题聚类研究11

1.3.3 非学术Web空间的行业主题显著性研究12

1.3.4 学术Web社区的地域影响因素研究13

1.4 研究内容13

第二章 Web主题结构挖掘相关算法18

2.1 概述18

2.2 Web搜索中的主题分析算法19

2.2.1 主题敏感的PageRank19

2.2.2 HITS22

2.3 基于图的社区发现算法24

2.3.1 Trawling24

2.3.2 最大流算法25

2.4 基于局部网络关系的社区发现算法28

2.4.1 基于共链的社区发现28

2.4.2 基于SNA的社区发现31

2.5 基于复杂网络的社区发现算法33

2.5.1 GN及其衍生算法34

2.5.2 基于模块度优化的算法36

2.5.3 派系过滤算法(CPM)38

2.5.4 LPA算法39

2.5.5 COPRA算法41

2.5.6 SLPA算法43

2.5.7 算法对比44

2.6 小结46

第三章 Web主题结构挖掘中的数据采集技术研究47

3.1 相关研究47

3.1.1 概述47

3.1.2 搜索引擎48

3.1.3 通用Web信息采集工具51

3.1.4 自主开发的专用采集工具52

3.2 数据采集模型与策略55

3.2.1 数据采集模型55

3.2.2 链接解析57

3.2.3 链接统计规则58

3.2.4 页面选择与链接分类59

3.2.5 链接预测61

3.3 Web数据采集系统的设计65

3.3.1 总体架构65

3.3.2 功能介绍67

3.3.3 参数配置69

3.3.4 任务监控71

3.4 小结72

第四章 学术Web宏观主题结构挖掘研究74

4.1 概述74

4.2 大学网站的链接特征76

4.2.1 链接动机76

4.2.2 链接集中规律77

4.3 封闭样本的数据采集和结构分析技术研究79

4.3.1 数据采集策略79

4.3.2 基于k核的链接结构分析研究81

4.3.3 基于复杂网络的链接结构挖掘研究83

4.4 实验84

4.4.1 样本选择84

4.4.2 数据有效性分析85

4.4.3 基于k核的社区发现结果分析88

4.4.4 基于力导向的社区发现结果分析89

4.4.5 基于复杂网络的社区发现结果分析和评测90

4.4.6 结果对比92

4.5 小结94

第五章 多层次网络中的Web主题结构挖掘研究96

5.1 概述96

5.2 研究对象选择与数据预处理97

5.2.1 样本选取98

5.2.2 主题标注100

5.2.3 网站域名识别102

5.3 基于学院层面的主题显著度研究107

5.3.1 基本数据特征107

5.3.2 社区主题显著性评价指标110

5.3.3 社区主题结构分析算法性能比较111

5.3.4 社区主题结构分析结果116

5.4 基于大学层面的主题显著度研究117

5.4.1 基本网络特征117

5.4.2 主题特征优化策略118

5.4.3 不同阈值下的主题显著度分析120

5.5 小结121

第六章 多维度机构网络主题一致性比较研究123

6.1 相关研究123

6.2 数据采集与预处理125

6.3 单一机构网络分析126

6.3.1 引用网络分析126

6.3.2 合著网络分析128

6.4 机构网络主题一致性比较130

6.5 小结131

第七章 开放Web空间的主题结构挖掘研究133

7.1 社区扩展相关算法134

7.1.1 HITS134

7.1.2 Companion和Companion-136

7.1.3 基于网页的社区发现研究的不足138

7.2 基于网站的社区扩展算法研究139

7.2.1 算法设计139

7.2.2 基于链接强度的样本选择规则142

7.2.3 基于域名结构的样本选择规则143

7.2.4 基于链接耦合的向下扩展145

7.2.5 基于链接评估的向上扩展147

7.3 基于开放集合的Web主题图实现框架和相关度评价148

7.3.1 实现框架148

7.3.2 社区成员相关度评价151

7.4 实验152

7.4.1 样本选择152

7.4.2 数据采集与处理154

7.4.3 基于核心扩展的Web主题图157

7.4.4 基于二次扩展的Web主题图160

7.4.5 多层次扩展的Web主题图结构对比162

7.4.6 基于核心扩展的Web主题图评价164

7.4.7 基于二次扩展的Web主题图评价165

7.4.8 研究结果对比166

7.5 小结167

参考文献169

附录190

热门推荐