上述步骤s302a可以为:步骤s302b:判断当前帧图像和在当前时刻之前的预设时长内采集到的连续多帧图像,是否均包含目标对象;如果是,执行上述步骤s303。在本实现方式中,在获取到当前帧图像后,电子设备便可以利用图像识别算法判断当前帧图像和在当前时刻之前的预设时长内采集到的连续多帧图像,是否均包含目标对象。其中,当判断结果为是时,电子设备可以确定存在用户进入目标防护舱,则在当前时刻,目标防护舱内可能发生异常事件,这样,电子设备便可以继续执行步骤s303。需要说明的是,在本实现方式中,电子设备可以采用任一能够检测出当前帧图像和在当前时刻之前的预设时长内采集到的连续多帧图像中是否均包含目标对象的图像识别算法执行上述步骤s302b,对此,本发明实施例不做具体限定。其中,上述预设时长可以为任一时长,例如,2s,5s等,这都是合理的。下面,对电子设备执行上述步骤s302b的具体过程进行说明:电子设备在获取到每帧关于目标防护舱的图像后,判断该图像中是否包含目标对象。进而,在获取该图像的下一帧图像后,判断该下一帧图像中是否包括与前一帧图像相同的目标对象。依次类推。语音关键事件检测的应用步骤是如何的?欢迎咨询!江苏自主可控语音关键事件检测标准
本文涉及事件数据处理技术,尤指一种语音关键事件检测检测方法和装置。背景技术:互联网上每天都会产生大量的新闻数据,描述许多已经发生的事件。但由于事件种类繁多,无法快速而且准确地分辨事件的类型以及事件中的主体。对发生的公共事件或者特定行业内所发生的事件进行区分和主体识别,不仅有助于实时把握事件的发展趋势以及整个行业的发展方向,也可辅助高层决策,降低风险,具有重要的实际应用价值和研究意义。现有进行语音关键事件检测的方法大都辅助使用已有的自然语言处理工具,但是在实际应用中并不能通过这些工具预先处理好。事件的类型往往可以从一些关键词中获取,比如”杀”,“袭击”等,这类词就被称为触发词。因此快速准确地识别出这些触发词就极其重要。现有的语音关键事件检测识别方法:基于图神经网络的模型;[2]基于深度学习、注意力机制、序列标注的模型等。现有方法存在以下缺点:1、现有方法只进行事件类型检测即事件触发词,并没有进行事件主体抽取,任务单一,不具备较强的实际应用价值。2、现有方法大都使用特定的自然语言处理工具,如jieba,ltp,standfordnlp等首先对句子进行分词,建立依存树,然后再将这些特征输入模型。江苏自主可控语音关键事件检测标准在语音数据中,关键事件检测可以帮助我们定位到重要的音频段,如会议中的关键决策或演讲中的关键观点。
在本申请的示例性实施例中,在通过双向lstm网络获得语句的向量化语义表示w1之前,所述方法还可以包括:将语句中的m个字符随机初始化为一个维度为[m,n]的n维向量d,其中,对于从0到m-1的索引id,每个id对应一个不同的字符;对于长度为s的语句,该语句中每一个字符能够在向量d中找到对应的id,从而获得维度为[s,d]的向量。在本申请的示例性实施例中,通过双向lstm网络获得语句的向量化语义表示w1可以包括:将维度为[s,d]的向量输入预设的双向lstm神经网络,将所述双向lstm神经网络的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中,通过bert模型获得语句的向量化语义表示w1可以包括:将语句直接输入所述bert模型,将所述bert模型的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中,所述向量化语义表示w1的维度可以为[s,d1];其中,当通过双向lstm网络获得语句的向量化语义表示w1时,d1为2*lstm隐层节点数;当通过bert模型获得语句的向量化语义表示w1时,d1=768。在本申请的示例性实施例中,所述方法还可以包括:预先将触发词的类型划分为x种,将事件主体的类型划分为y种,其中,x、y均为正整数;在获得语句的向量化语义表示w1之前。
检测模型为:基于各个样本图像和每个样本图像的事件检测结果所训练得到的模型。在该检测模型的训练过程中,可以将各个样本图像作为待训练模型的输入,将各个样本图像的事件检测结果作为待训练模型的输出。这样,在训练过程中,待训练模型可以学习各个样本图像中的图像特征,输出各个样本图像的事件检测结果,逐步建立样本图像的图像特征和事件检测结果的对应关系。这样,经过大量样本图像的学习,便可以得到上述检测模型。而该训练得到的检测模型也就可以用于对基于当前帧图像确定的待分析图像进行检测,输出的事件检测结果,即为关于目标防护舱的事件检测结果。显然,在训练上述检测模型时,所使用的样本图像为关于防护舱的图像。需要强调的是,不同类型和数量的待分析图像,所利用的检测模型也是不同的。为了行为清楚,后续将会对待分析图像与检测模型之间的对应关系进行举例说明。需要说明的是,上述检测模型可以在电子设备中训练得到的,也可以在与电子设备通信连接的其他电子设备中训练得到的,这样,电子设备便可以从该其他电子设备中获得上述检测模型,这都是合理的。此外,在本发明实施例中,电子设备可以检测目标防护舱内是否发生异常事件,则在这种情况下。语音关键事件检测有哪些关键技术?欢迎咨询!
使用自注意力机制对获得的每个span的表示w2进行计算,得到每个span的新的语义表示w3;对所述新的语义表示w3进行span分类,确定每个span是否为一个事件的触发词或事件主体。通过该实施例方案,能够同时抽取事件触发词和事件的主体,可获取更加有用的信息,具有较强的实际应用价值;在数据处理和建模的过程中不使用现有的自然语言处理工具,使得操作简单,也避免了因使用自然语言处理工具而导致的误差累积的问题,同时也更加符合真实应用场景;通过划分span的方式,完美解决了序列标注存在的问题,效率更高,适用性更强。本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的其他优点可通过在说明书以及附图中所描述的方案来实现和获得。附图说明附图用来提供对本申请技术方案的理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。图1为本申请实施例的事件检测方法流程图;图2为本申请实施例的事件检测装置组成框图。具体实施方式本申请描述了多个实施例,但是该描述是示例性的,而不是限制性的。语音关键事件检测一般应用在什么行业?欢迎来电咨询!江西自主可控语音关键事件检测标准
在医学领域,语音关键事件检测可以用于分析患者的语音数据,辅助医生进行疾病诊断。江苏自主可控语音关键事件检测标准
确定当前时刻,关于目标防护舱的事件检测结果。需要说明的是,电子设备可以通过多种方式执行上述步骤f23,对此本发实施例不作具体限定。为了行文清晰,后续对上述步骤f23的具体实现方式进行举例说明。显然,在本实施例三中,采用多种数据来确定检测关于目标防护舱的事件检测结果,使得到的事件检测结果更可靠,且具有说服力,从而可以提高对防护舱内用户出现异常事件的检测准确率。其中,由于类图像可能为:当前帧图像和当前帧图像之前的连续m帧图像的多张图像,也可能为:当前帧图像;第二类图像可能为:包括光流图和光流图之前的连续n帧光流图的多张图像,也可能为:光流图。因此,在本实施例三中,待分析图像和辅助图像,以及分别对应的场景图像检测模型和光流图检测模型,也可能存在多种情况。具体的:种情况:待分析图像为:当前帧图像和当前帧图像之前的连续m帧图像的多张图像;场景图像检测模型为:采用各个样本图像组和每个样本图像组的事件检测结果所训练得到的模型,且每一样本图像组中包括m+1帧场景图像;辅助图像为:包括光流图和光流图之前的连续n帧光流图的多张图像。江苏自主可控语音关键事件检测标准