图书介绍
文本挖掘中若干关键问题研究【2025|PDF下载-Epub版本|mobi电子书|kindle百度云盘下载】

- 陆旭著 著
- 出版社: 合肥:中国科学技术大学出版社
- ISBN:9787312022807
- 出版时间:2008
- 标注页数:118页
- 文件大小:6MB
- 文件页数:127页
- 主题词:数据采集-研究
PDF下载
下载说明
文本挖掘中若干关键问题研究PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 导论1
1.1 研究背景1
1.2 文本分类综述2
1.3 本书的内容结构10
1.4 本书的创新工作12
第2章 文本分类概述13
2.1 文本分类的数学定义13
2.2 文本分类任务的特点13
2.3 文本分类系统的组成14
2.4 文档预处理16
2.5 文档的表示19
2.6 常用文本分类模型23
2.7 文本分类器学习、测试和评价27
第3章 偏最小二乘回归方法的基本理论30
3.1 偏最小二乘回归的发展历史30
3.2 偏最小二乘回归的基本原理31
3.3 偏最小二乘回归的基本思想32
3.4 数学原理32
3.5 偏最小二乘回归的理论算法33
3.6 成分数的确定36
第4章 基于变量投影重要性指标的特征选择方法研究38
4.1 维数约简技术38
4.2 符号约定39
4.3 常用的特征选择方法39
4.4 常用的特征抽取方法42
4.5 基于变量投影重要性指标的特征选择方法44
4.6 实验结果和分析47
第5章 偏最小二乘Logistic文本分类模型研究57
5.1 Logistic回归模型57
5.2 偏最小二乘Logistic回归模型63
5.3 偏最小二乘Logistic文本分类模型65
5.4 实验结果和分析67
第6章 GHTC层次文本分类模型研究76
6.1 层次分类概述77
6.2 层次特征选择79
6.3 GHTC层次文本分类模型80
6.4 实验结果和分析84
第7章 总结与展望93
7.1 总结93
7.2 研究展望94
附录1 REUTERS-21578前10个常见类和前10个稀有类的前20个特征VIP值96
附录2 复旦文本分类语料库部分类别的前20个特征VIP值100
附录3 OHSUMED语料库层次结构102
附录4 20 Newsgroups语料库各节点各特征维数的微平均F1值和宏平均F1值变化情况106
参考文献107
后记118
热门推荐
- 133426.html
- 3514750.html
- 3106886.html
- 3281090.html
- 2923493.html
- 2926945.html
- 3754810.html
- 3446019.html
- 1718851.html
- 3625542.html
- http://www.ickdjs.cc/book_495114.html
- http://www.ickdjs.cc/book_2696997.html
- http://www.ickdjs.cc/book_657418.html
- http://www.ickdjs.cc/book_1840213.html
- http://www.ickdjs.cc/book_2065377.html
- http://www.ickdjs.cc/book_1316734.html
- http://www.ickdjs.cc/book_1291858.html
- http://www.ickdjs.cc/book_2271600.html
- http://www.ickdjs.cc/book_2814781.html
- http://www.ickdjs.cc/book_2801294.html