期刊检索

  • 2024年第56卷
  • 2023年第55卷
  • 2022年第54卷
  • 2021年第53卷
  • 2020年第52卷
  • 2019年第51卷
  • 2018年第50卷
  • 2017年第49卷
  • 2016年第48卷
  • 2015年第47卷
  • 2014年第46卷
  • 2013年第45卷
  • 2012年第44卷
  • 2011年第43卷
  • 2010年第42卷
  • 第1期
  • 第2期

主管单位 中华人民共和国
工业和信息化部
主办单位 哈尔滨工业大学 主编 李隆球 国际刊号ISSN 0367-6234 国内刊号CN 23-1235/T

期刊网站二维码
微信公众号二维码
引用本文:刘远超,宋明凯,刘铭,张想.用于细颗粒度挖掘的产品评论语料库构建技术[J].哈尔滨工业大学学报,2012,44(3):64.DOI:10.11918/j.issn.0367-6234.2012.03.013
LIU Yuan-chao,SONG Ming-kai,LIU Ming,ZHANG Xiang.Research of product review corpus constructing technology for fine-granularity mining[J].Journal of Harbin Institute of Technology,2012,44(3):64.DOI:10.11918/j.issn.0367-6234.2012.03.013
【打印本页】   【HTML】   【下载PDF全文】   查看/发表评论  下载PDF阅读器  关闭
过刊浏览    高级检索
本文已被:浏览 1941次   下载 1552 本文二维码信息
码上扫一扫!
分享到: 微信 更多
用于细颗粒度挖掘的产品评论语料库构建技术
刘远超1, 宋明凯1, 刘铭1, 张想1
哈尔滨工业大学 计算机科学与技术学院,150001 哈尔滨, lyc@insun.hit.edu.cn
摘要:
为了辅助进行产品评论中特征-观点对识别的挖掘工作,对细颗粒度产品评论语料库的构建技术进行了研究.介绍了用于产品评论细颗粒度挖掘的语料库构建方法,以及目前初步进行的语料标注工作.标注数据可以数据库形式存储,从而实现了无结构化到结构化的转变,为自动查询等处理提供了极大方便.实验结果表明:虽然文中的标注方法以手机产品为例,但具有良好的移植性,可以应用到其他产品评论的细颗粒度语料库构建.相应的语料库构建对于高性能机器学习方法的应用、特征-观点对识别算法的性能提高以及自动评价等具有重要意义.
关键词:  产品意见挖掘  细颗粒度语料库构建  语料标注
DOI:10.11918/j.issn.0367-6234.2012.03.013
分类号:TG454
基金项目:教育部人文社会科学研究青年基金资助项目(10YJCZH099);中央高校基本科研业务费专项资金资助项目(HIT.NSRIF.2009065);语言语音教育部-微软重点实验室开放基金资助项目 (HIT.KLOF.2009022).
Research of product review corpus constructing technology for fine-granularity mining
LIU Yuan-chao,SONG Ming-kai,LIU Ming,ZHANG Xiang
Abstract:
Quantitative analysis and mining of product reviews posted by users are helpful for both manufacturers and consumers. During the work of fine-granularity product review mining, extracting feature-opinion pair is one of the core works. The corresponding corpus construction is of great significance for the application of high performance machine learning methods, improving the performance of feature-opinion extraction algorithm and automatic evaluation. This article introduces corpus constructing technology for fine-granularity product review mining and the initial corpus labeling work, thus realizing non-structured to structural changes. The corpus can be stored in database and thus provide great convenience for automatic query processing. Although current labeling work was performed in mobile phone products, it can be applied also to other product types for fine granularity corpus construction. So our work has good transplantation ability. 
Key words:  product review mining  fine-granularity corpus construction  corpus annotation

友情链接LINKS