中国社会科学出版社
当前位置: 重点图书 >

文本情感分析关键技术研究

纸书售价: 52.0 纸书定价:¥65.0 电子书售价: 26.0

内容简介

作者简介

目录

全部显示∨

全部显示∨

目录

第一章 绪论
第一节 研究背景和研究意义
一 自然语言处理
二 文本情感分析
第二节 文本情感分析整体研究现状
一 语料阶段
(一)评测语料
(二)跨领域语料研究
二 文本的预处理阶段
三 特征标注与特征选择阶段
(一)情感特征的标注方法
(二)情感特征的选择方法
四 情感分类阶段
(一)情感建模的方法
(二)情感分析的其他研究点
(三)目前已有系统
五 中文文本情感分析亟待解决的问题
第三节 研究内容与结构
一 研究内容
二 研究结构
本章小结
第二章 情感语义块特征
第一节 研究现状
第二节 情感特征的定义
一 特征项的选择与权重
(一)字特征
(二)词特征
(三)确定特征权重
二 语义块特征无监督提取
(一)基于块的语义分析
(二)无监督方法
(三)无监督学习
(四)文本理解
(五)无监督分词
(六)已存在的方法
(七)存在的问题
三 情感语义块特征的生成
(一)后缀树的生成
(二)通过后缀树查找独立的语义单位
第三节 情感特征采集系统
一情感特征的自动标注
二 情感特征的人工标注
本章小结
第三章 网络挖掘的数据获取
第一节 万维网①介绍
一 万维网的发展
二 因特网的历史
第二节 网络挖掘
一 网络数据挖掘特点
二 网络挖掘步骤
(一)前处理
(二)数据挖掘
(三)后处理
三 网络数据挖掘的内容
(一)网络数据挖掘的组织结构
(二)关联规则与序列模式
(三)监督方法
(四)信息检索和网络搜索
(五)社会网络分析
(六)信息抓取②(Web Crawling)
(七)结构化数据的提取:包装器生成(W rapper Generation)
(八)信息集成
(九)意见挖掘和情绪分析
(十)网络使用挖掘
本章小结
第四章 中文分词
第一节 自然语言处理
一 自然语言处理技术
(一)分词的思想
(二)分词的概况
(三)自然语言文本处理研究步骤
二 无监督分词研究
(一)研究方法
(二)技术路线
(三)实验方案
(四)可行性分析
(五)传统方法需要突破
(六)分句、分词、语法分析、语义分析研究的内容
(七)面向中文文本的无人监督理解的实现方法与技术
第二节 中文分词的前沿性及创新性
一 国内外当前水平
(一)国外中文信息处理方法的研究现状
(二)国内中文信息处理方法的研究现状
二 分词的前沿性
三 分词的创新性
本章小结
第五章 算法准备
第一节 机器学习概述
第二节 文本特征选择方法
一 过滤器方法
二 包装器方法
三 文本学习方法
第三节 文本分类器核心算法
一 相关定义
(一)文本概率网络的应用实例
(二)文本概率网络的推理
二 最优基于概率网络的文本分类器
(一)决策超平面
(二)最小距离分类器③
(三)概率密度估计
(四)高斯分布的均值向量
(五)基础概率分类器
(六)离散特征下的特征向量
三 线性决策函数及决策超平面
(一)应用感知器算法定义线性超平面
(二)超平面实例
(三)感知器算法的变体
(四)维度扩展实例
(五)感知器算法在神经网络建模中的应用
(六)感知器算法的收敛方法
四 均方错误估计
五 随机近似和LMS算法
六 错误平方和估计
七 最优分类器的输出——偏差和方差的困境
本章小结
第六章 基于遗传算法的情感特征选择
第一节 特征选择相关工作
一 特征选择
二 特征选择方法
(一)DF(文档频率)
(二)TS(特征增强)
(三)TC(特征贡献)
(四)En(基于熵的特征排序)
(五)CHI(χ2统计)
(六)MI(互信息)
(七)IG(信息增益)
(八)算法比较
第二节 情感特征选择的算法设计
一 情感特征编码
二 群体设置
三 个体适应度函数
四 遗传算子
(一)选择算子
(二)交叉算子
(三)变异算子
(四)遗传算法的终止规则
第三节 改进的K-均值聚类及实验结果
一 改进K-均值聚类
二 特征选择的实验结果
(一)实验数据
(二)评价指标
(三)实验结果
三 公开语料上的实验对比
(一)实验数据
(二)评价指标
(三)实验结果
本章小结
第七章 基于局部高频字串的语句条件随机场模型
第一节 句法分析
一 句法分析研究
二 依存句法分析
三 依存关系与汉语依存语法
四 基于规则的依存信息抽取
五 句法研究代码实现与分析
(一)句法标识
(二)局部组合中心词为名词
(三)局部组合中心词其他情况
(四)中心词左侧查找函数
(五)中心词左侧无父节点
(六)中心词右侧查找函数
(七)局部组合的可能性分析
(八)单动词语句的句法分析
(九)多动词语句的句法分析
(十)语句处理其他情况分析
(十一)副词情况的处理函数
(十二)非动词情况判定
(十三)普通词组句法分析
(十四)介词中心句
(十五)形容词中心句
第二节 采用CRF进行句法级别情感分析过程
一 语句中的局部高频字串
(一)局部高频字串的定义
(二)局部高频字串的过滤
二 对语句信息进行CRF模型情感分析
(一)标注语句情感标签
(二)条件随机场算法
(三)算法模型
三 HMM模型
第三节 实验结果及分析
一 实验研究资源
二 实验结果评价
三 CRF模型与HMM、MEMM、SVM模型的对比
四 实验结果与前人代表性的算法比较
五 局部高频字串对情感分类的影响
六 局部高频字串特征对不同评论数据的影响
本章小结
第八章 基于集成情感成员模型的文本情感分析方法
第一节 自动分类问题
一 贝叶斯算法
二 K-近邻
三 人工神经网络
四 决策树
第二节 集成学习
第三节 成员模型1:基于神经网络和进化论算法的个体模型
一 人类情感判断过程分析
二 文本情感分析过程的计算机模拟
三 个体模型的定义
(一)情感特征
(二)特征权重
(三)先验知识库
四 个体模型的建模
(一)个体模型基于蒙特卡罗方法建模
(二)特征编码定义
(三)个体模型初始化算法
五 构建针对文本情感分类的神经网络模型
(一)神经网络的定义及算法
(二)构建针对文本情感处理的神经网络
(三)改进反向传播算法进行训练
(四)建模步骤
六 判断结果汇总
(一)“群体效应”
(二)“个体间对话”建模
七 个体模型的进化
第四节 其他成员模型
一 成员模型2:基于语义块获得情感特征集的个体模型
二 成员模型3:基于条件随机场模型
三 成员模型的集成
第五节 实验技术方案搭建
一 服务器LINUX平台
(一)红旗LINUX
(二)服务器部署
二 J2EE架构
三 服务器集群的配置
四 jfreechart实验结果可视化
五 服务器集群测试环境实现
(一)环境配置
(二)远程服务器设置
(三)本地测试环境设置
第六节 实验结果及分析
一 英文影评语料实验研究
(一)实验数据
(二)评价指标
(三)实验结果
(四)实验结果与其他研究者比较
二 中文影评语料实验研究
(一)实验数据
(二)评价指标
(三)基于进化算法的成员模型1的进化
三 中文同领域和跨领域情感语料对比实验研究
本章小结
第九章 结论与展望
第一节 工作研究现状
第二节 工作总结与未来工作展望
一 工作总结
二 无监督学习算法的研究意义
(一)情感分析的研究分析未来展望
(二)应用方向与前景:教学评语研究
(三)研究方法及实验手段
(四)未来工作可行性分析
本章小结

浏览历史

清空记录
中国社会科学出版社