项目基本情况Basic information of the project
成果简介:本项目致力于开发一种可靠性大数据文本挖掘技术系统、该系统致力于研究文本挖掘技术在可靠性信息提取中的应用。该系统通过提供自然语言处理(NLP)和高级的语言学技术,自动对大量文本进行分类和分析,识别出其中的实体、事实和实践。采用系统对数据的分析结果,可以构建元数据,定义信息分类,生成规则和概念定义,该系统也应用于大量文档数据集合,以及用来触发实时的业务处理。主要包含的系统模块有:数据质量检测模块、数据分析模块等。模块可实现如下技术,将文本数据转化成系统格式,辅助文本分类。采用知识规则、语义和概念,对文档进行自动化的处理。通过分类层次的统一定义和规则,将彼此独立的文档联系起来,形成整合的文档库和文本资产。提供完备的文本挖掘解决方案,将非结构化数据(自由形式文本)和结构化数据整合在一起,能够在集成的预测建模环境中,为企业提供完成的视图和有价值的分析结果。
管理团队与技术团队Management team and technical team
哈尔滨理工大学
效益分析Benefit analysis
该项目为储备库项目资源,暂无效益分析内容。