首页 > 技术交易 > 科技成果
文本的表示与释义计算研究
发布时间: 2023-12-08 浏览量:23
  • 交易方式:面议
  • 联系电话:0451-88028910
  • 单位名称或姓名:王云龙
  • 产业领域:数字经济
  • 成果类型:
项目基本情况Basic information of the project
本课题以语言释义的表示和计算为研究对象,以深度学习和对抗学习为理论基础,从语义角度出发,结合各类语言学知识,开展大数据、机器深度学习大背景下的语言生成、语言表示和释义计算的基本理论、基本方法和关键技术研究,实现释义语料的自动生成,构建词的深度表示模型和文本的深度释义匹配模型,进行语言文字信息处理的基础理论研究,提升中文信息处理水平。研究以释义语料的自动生成、词和句子的语义表示和释义计算为主要研究内容。 2. 要解决的主要技术难点和问题 (1) 研究内容:释义语料的自动生成。 主要技术难点和问题:解决生成对抗网络只能处理连续对象与自然语言的离散性之间的矛盾,利用生成对抗网络自动构建释义语料。 (2)研究内容:字形、字音、字义多视角交互的词的深度表示及释义计算模型。 主要技术难点和问题:利用神经张量网建模字形、字音、字义的交互关系,构建多视角交互的汉语词的深度表示模型。 (3)研究内容:融合句法和语义特征的文本深度释义匹配模型。 主要技术难点和问题:以句法信息加强文本语义信息的表达,通过卷积神经网络实现释义文本匹配空间内的模式提取,构建融合句法和语义的深度释义文本匹配模型。 3. 研究的创新点 (1)提出了面向释义语料自动生成的“变分自编码-生成对抗网络模型”(VAE-GAN),该模型解决了生成对抗网络在自然语言处理领域难以有效应用的难题。利用变分自编码在隐空间本质上连续的特性进行编码,将离散的文本映射到连续的空间,满足了生成对抗网络要求其处理对象连续的要求,扫除了其在自然语言处理领域应用的主要障碍。应用该理论,进行释义语料自动生成,解决了释义语料匮乏问题。 (2)提出了形、音、义多视角交互的词的深度表示模型,将汉语的词视为字的形、音、义不同的视角下的组件,并利用神经张量网建模字的形、音、义的交互关系,为汉语词的深度表示提供新的、更有效的模型。 (3)提出了融合句法和语义特征的文本深度释义匹配模型,探索了语言释义计算的新方法,以句法信息加强文本语义信息的表达,通过卷积神经网络实现释义文本匹配空间内的模式提取,解决了语言的释义计算问题。
管理团队与技术团队Management team and technical team
黑龙江工程学院
效益分析Benefit analysis
该项目为储备库项目资源,暂无效益分析内容。
成果推荐Result recommendation