Reconeixement de veu mitjançant xarxes neuronals

dc.contributor Universitat de Vic. Màster en Tecnologies Aplicades de la Informació
dc.contributor.author Clos Calm, Xavier
dc.date.created 2012-09-28
dc.description Curs 2011-2012
dc.description.abstract La interacció home-màquina per mitjà de la veu cobreix moltes àrees d’investigació. Es destaquen entre altres, el reconeixement de la parla, la síntesis i identificació de discurs, la verificació i identificació de locutor i l’activació per veu (ordres) de sistemes robòtics. Reconèixer la parla és natural i simple per a les persones, però és un treball complex per a les màquines, pel qual existeixen diverses metodologies i tècniques, entre elles les Xarxes Neuronals. L’objectiu d’aquest treball és desenvolupar una eina en Matlab per al reconeixement i identificació de paraules pronunciades per un locutor, entre un conjunt de paraules possibles, i amb una bona fiabilitat dins d’uns marges preestablerts. El sistema és independent del locutor que pronuncia la paraula, és a dir, aquest locutor no haurà intervingut en el procés d’entrenament del sistema. S’ha dissenyat una interfície que permet l’adquisició del senyal de veu i el seu processament mitjançant xarxes neuronals i altres tècniques. Adaptant una part de control al sistema, es podria utilitzar per donar ordres a un robot com l’Alfa6Uvic o qualsevol altre dispositiu. ca_ES
dc.description.abstract The man-machine interaction by voice covers many areas of research. Among others, we have systems for speech recognition, speech synthesis and identification, verification and speaker identification, and voice activation (orders) for robotic systems. Recognizing speech is natural and simple for people, but it is a complex task for machines for which several methodologies and techniques exists, including artificial neural networks. The aim of this work is to develop a Matlab based tool for recognition and identification of words spoken by a speaker, from a set of possible words and with good reliability within predetermined margins. The system is speaker independent, meaning that the user of the system has not been involved into the training process of the system. During the project, an I/O interface has been designed that allows performing signal acquisition and processing of voice through neural networks and other techniques. Adapting a control part, the system could be used to give orders to a robot, for example Alfa6Uvic robot or other devices. ca_ES
dc.format.extent 78 p. ca_ES
dc.rights Aquest document està subjecte a aquesta llicència Creative Commons ca_ES
dc.subject.other Xarxes neuronals (Informàtica) ca_ES
dc.subject.other Reconeixement automàtic de la parla ca_ES
dc.subject.other Interacció persona-ordinador ca_ES
dc.title Reconeixement de veu mitjançant xarxes neuronals ca_ES
dc.description.version Director/a: Jordi Solé i Casals
