首页 > 技术交易 > 科技成果
声音段落级潜在语义自动挖掘及语义特征提取方法研究
发布时间: 2023-12-08 浏览量:22
  • 交易方式:面议
  • 联系电话:0451-88060623
  • 单位名称或姓名:于晓东
  • 产业领域:数字经济
  • 成果类型:
项目基本情况Basic information of the project
非语音声音的语义识别是声音感知与理解研究的核心内容之一,是人机智能接口与计算机视听觉计算的重要研究基础。目前,关于非语音声音的语义识别的声学事件检测和计算场景分析等研究大多只关注于声音中局部声学对象的低层语义识别问题,缺乏对声音段落(本项目中指一定时长的声音)整体语义的识别研究。同时,由于声音信号自身并不含有天然可分的语义基元,这使得声音段落的整体语义识别与特征提取极具挑战性。本项目以提取声音段落的整体语义特征为目标,首先基于声音段落的码本表示和联合聚类的基本思想,将含有少量语义信息的码字与声音段落投影到其公共子空间中以挖掘潜在语义基元,并获得声音段落的语义基元表示;然后通过构造声音段落的语义基元表示与其整体语义信息的可区分性共同子空间,并在此空间中提取整体语义特征。项目的主要研究内容包括:适合声音段落语义特征表示与提取的码本构建与优化、潜在语义基元的自动挖掘方法、声音段落的整体语义提取方法,以及提供更多语义识别先验知识的声音背景信息提取。本项目的研究工作对提高计算机声音的认知能力,进而推动其走向现实应用具有重要的理论意义和实用价值。
管理团队与技术团队Management team and technical team
哈尔滨师范大学
效益分析Benefit analysis
该项目为储备库项目资源,暂无效益分析内容。
成果推荐Result recommendation