广州及时雨侦探调查公司
NEWS
公司新闻
您当前位置:首页 > 公司新闻
广州市私家侦探腾达公司
作者:  更新时间:2020-04-30 06:03:46  浏览数:841

情感档文本_情感文本_文本情感分析算法

【摘要】:互联网的科普与演进使得网络上主观性文本如产品、新闻、社会丑闻的评论等长期发生。这些主观性文本蕴含着丰富的信息资源,如何对文本信息进行有效地处理跟利用,是信息管理遭遇的一大问题,而文本情感分类技术可以为其提供一条有效的缓解方法。文本情感分类技术是对网络上庞大的主观性文本进行自动的情感偏好辨识的过程。文本情感分类用于商务智能、电子政务、信息分析等领域可以获得客户兴趣喜好、了解民情民意和对将来金融、股票市场进行分析等,具有重大的应用价值。目前,英文文本情感分类研究已有一定的累积,而中文由于其特殊性,研究相对较少。在此背景下,本文利用机器学习方法对中文文本进行情感分类研究。在对中文文本进行探讨跟对机器学习方法进行总结的基础上,针对文本情感分类机器学习方法中的文本特征表示、文本特征表示高维性难题和分类模型三个方面展开深入的探究。本文的主要研究内容与创新点如下:(1)构造了对于英文文本的基于依存语法关系的三元组依存关系特点。将非结构化的文本方式转换为机器学习算法能够辨识的结构化形式是进行文本情感分类的首要步骤,也是机器学习的文本表示阶段。由于常见英文文本表示方式缺乏词语间修饰关系的词义信息,利用依存语法阐释句子中短语间的修饰关系的特点,将句子中的依存关系转换为文本表示特征项。

情感文本_文本情感分析算法_情感档文本

在研究中文文本依存语法关系的基础上,结合英文词汇特征,对原有依存句法树中的节点进行删除与合并,给出了删除与合并结点的算法步骤。为了验证三元组依存关系特点的有效性情感文本,将三元组依存关系特点的建立方式用于中文评论数据实例中。同时,构造了文本情感分类任务常用的特点表示方式,通过机器学习分类算法将不同特征表示进行分类,将受到的分类准确率进行非常。结果证实,三元组依存关系特点是一种有效的文本表示方式,且在文本情感分类准确率上超过常见的特点表示方式。(2)提出了基于BPSO算法的随机子空间选择性集成机器学习方法。文本特征表示高维性是文本由非结构化形式转换为结构化特征向量空间后常见到的难题。传统的维数约减手段在特性维数的确认上没有统一的指导。本文利用集成机器学习方法中的随机子空间将高维特征空间界定为若干子空间的特点,将随机子空间用于文本情感分类中,解决了文本特征高维性跟特点约减维数难以确认的弊端。利用BPSO算法的全局优化搜索能力对随机子空间训练受到的基分类器进行改进选择,构成基于BPSO算法的选择性集成机器学习方法。将所提方式用于中文评论数据,研究了BPSO算法对随机子空间基分类器的改进过程,并对BPSO算法优化选择前后的集成平台的分类准确率和系统变化度进行预测相当。

情感文本_情感档文本_文本情感分析算法

实验结果证实,BPSO随机子空间方法可以有效缓解文本特征空间高维性问题提升工作强度,且在必定程度上增加了文本情感分类准确率和集成平台差别度。(3)提出了元学习与深度学习相结合的机器学习分类模型。为了进一步提升文本情感分类准确率,将深度信念网络用于文本情感分类中。深度意志网络有超强的特点学习能力,但在输入节点和网络层数过多的状况下,网络计算量较大,运行时间较长。借助集成机器学习中的元学习观念将深度意志网络成为元学习器的练习方式,BPSO随机子空间方法成为基分类器的练习方式,构造了深度信念网络元学习分类模型,给出了深度信念网络元学习方法的理论框架及算法步骤。为了探究元学习对深度意志网络形成的制约情感文本,将深度意志网络元学习与深度信念网络作用于中文评论数据,对其分类准确率、运行时间进行非常。结果证实,深度信念网络元学习方法不仅巨大程度上增加了深度信念网络的练习时间,而且无法较大幅度的提升文本情感分类准确率。

companynews公司新闻
公司名称:广州及时雨调查公司
24小时免费咨询电话:185-2064-4544
微信:185-2064-4544
Q Q:3123417795
邮  箱:3123417795@qq.com
地  址:广州