Hoe werken Cat Speech Translation-apps?

Hoe werken Cat Speech Translation-apps?

Je hebt waarschijnlijk apps gezien die beweren te vertalen wat je kat zegt. Maar kunnen ze het miauwen van je kat echt in het Engels vertalen? Het korte antwoord is ja, een soort van. Het is moeilijk vanwege de unieke 'taal' van elke kat, maar met moderne technologie kunnen ze behoorlijk dichtbij komen.





Kattenvertaal-apps zoals MeowTalk gebruiken een vorm van spraakherkenning die de nadruk legt op machinaal leren. Laten we eens nader kijken.





Spraakherkenning en machinaal leren

Mary Theresa McLean/ Pixabay





Spraakherkenning werkt door spraak op te nemen en de audio om te zetten in een digitaal gegevensbestand. Het codeert gegevens zoals toonhoogte en volume als gegevenspunten die de app kan analyseren en matchen met betekenissen. DPA-microfoons legt uit dat deze gegevenspunten er heel verschillend kunnen uitzien, afhankelijk van de achtergrondgeluiden en hoe een woord wordt uitgesproken.

Soms vinden we spraakherkenning vanzelfsprekend, maar het is een ongelooflijk technisch hoogstandje. Zeker als je bedenkt hoe complex menselijke spraak is. Als De wetenschapper legt uit dat elk woord een breed scala aan klanken of 'fonemen' bevat die in elkaar overlopen. Het is erg moeilijk om een ​​computer spraak te laten begrijpen. De nieuwe grens van kattengeluiden zal nog moeilijker zijn.



Apps die spraakherkenning gebruiken, zijn geprogrammeerd met een 'vocabulaire' van woorden die een dataset wordt genoemd. De app koppelt uw spraak vervolgens aan de dichtstbijzijnde optie in zijn gegevensvocabulaire.

Als het een fout maakt, corrigeert u het en bewaart het die gegevens voor de volgende keer. Dit is onderdeel van machine learning. Het is hoe een programma spraak leert herkennen, zelfs als het niet identiek is aan de dataset waarmee het begon.





Gerelateerd: Wat zijn machine learning-algoritmen? Hier is hoe ze werken

Spraakherkenning heeft nog steeds problemen, vooral met spraakgebreken en accenten. Sommige bedrijven verbeteren echter machine learning om deze problemen op te lossen. Na verloop van tijd kan machine learning spraakherkenning veranderen in een krachtig hulpmiddel.





hoe maak je een tekstavonturenspel

Zo werkt spraakherkenning voor mensen. Maar werkt het ook voor katten?

Spraakherkenning versus Miauwherkenning

Ariana Suárez / Unsplash

Ten eerste moeten we begrijpen waarom het vertalen van een bepaald soort miauw als 'ik heb honger' anders is dan het analyseren van menselijke spraak. Het probleem is meestal dat communicatie met katten meer afhankelijk is van non-verbale signalen zoals houding. Een ander probleem is het ontbreken van een universele 'kattentaal'.

Volgens de ASPCA , volwassen wilde katten miauwen nooit naar elkaar, alleen naar mensen. Ander onderzoek door de menselijke samenleving voegt eraan toe dat die geluiden 'niet voorkomen in een vacuüm'. We moeten ze naast lichaamstaal en andere contexten interpreteren. In veel gevallen zijn deze stille signalen het enige verschil tussen een miauw die 'ik heb honger' betekent en een miauw die 'ik wil spelen' betekent.

Naast dit probleem hebben geen twee katten dezelfde taal. Katten ontwikkelen gepersonaliseerde 'talen' voor hun baasjes. Deze zijn deels gebaseerd op imitatie van de stem van de eigenaar en deels op de persoonlijkheid van de kat. Geen twee katten klinken hetzelfde, zelfs niet als ze dezelfde behoefte of behoefte uitdrukken. Dus hoe kan het spraakvocabulaire van één app voor allemaal worden vertaald?

Flexibel machinaal leren voor katten

Gratis te gebruiken geluiden/ Unsplash

Hoewel een paar virtuele assistenten graag Auto poging om toon en emotie te begrijpen, spraakherkenning is nog steeds verschrikkelijk bij non-verbale signalen. Maar dat betekent niet dat het onmogelijk is om ze te interpreteren.

bestanden worden niet geüpload naar Google Drive

MeowTalk gebruikt een flexibeler soort machine learning om deze problemen op te lossen.

downloaden: Miauw Praat voor Android | ios (Vrij)

Meowtalk is gemaakt door Javier Sanchez, die ook aan het Alexa-team werkte. Hij stelde zich de app voor als een opstap naar slimme halsbanden. Deze halsbanden zouden kattengeluiden vertalen in menselijke spraak, gebaseerd op complexe machine learning-strategieën om mensen te helpen hun katten beter te begrijpen en te verzorgen.

Het MeowTalk-team compenseerde voor uniciteitsproblemen door meer specifieke profielen voor elke kat te maken. In de app registreer je elke kat apart. Wetenschap Noorwegen meldt dat kittens anders miauwen dan volwassen katten, dus vraagt ​​de app ook naar de verjaardag van de kat. Elk profiel genereert een uniek datanetwerk voor de kat, waarbij een beetje deep learning wordt geïntegreerd in machine learning.

Gerelateerd: Deep Learning versus machine learning versus AI: hoe gaan ze samen?

Voor woordenschat begint MeowTalk met 10 geluidsprofielen in zijn dataset. Elk heeft een andere betekenis, zoals 'gelukkig' of 'jagen'. Wanneer de app een geluid hoort en het bij het verkeerde eind heeft, kun je dit corrigeren of een nieuwe interpretatie maken.

CATSOUNDS-gegevens verzameld van Akvelon

Corrigeren vertelt de app om de basiswoordenschat te vervangen door het nieuwe geluid.

is er portretmodus op iphone 7

U kunt de app bijvoorbeeld vertellen dat 'Jacht' moet worden afgestemd op korte tjilpen in plaats van een lang gejank. Dit soort correctie is nuttiger dan het toevoegen van meerdere geluiden om te matchen met één, wat betekent dat de manier waarop spraakherkenning doet, wat zou zijn als de app vertellen dat een lang gejank en korte chirps beide 'Moederoproep' betekenen.

Machine learning in apps voor spraakherkenning is meestal bestand tegen dit soort overschrijven. Het zou hetzelfde zijn als proberen Siri te leren dat als je 'technologieblog' zegt, je echt 'peer' bedoelt. Maar de flexibelere vorm van machine learning die MeowTalk gebruikt, kan deze correctie gemakkelijker aan.

Het creëren van een nieuwe interpretatie voegt een betekenis toe die niet eerder was gecodeerd. Als uw kat bijvoorbeeld een specifieke oproep heeft wanneer ze haar favoriete speeltje wil, kunt u 'Ik wil mijn muis' als optie toevoegen. Het is vergelijkbaar met het toevoegen van een woord aan uw autocorrectiewoordenboek.

Verwant: Hoe u uw eigen autocorrectiewoorden op Android definieert

Na verloop van tijd kunt u een zeer persoonlijk spraakprofiel voor uw kat ontwikkelen. Uiteindelijk kan het zelfs geavanceerd genoeg zijn om nuttig te zijn voor dierenoppassers of om gedragsproblemen op te lossen. Als er niets anders is, helpt het katteneigenaren om meer aandacht te besteden aan hun huisdieren.

Het oordeel: werken Cat Translation-apps?

Uiteindelijk is 'kattenvertaling' nog steeds erg afhankelijk van de gebruiker die de app leert hoe zijn kat praat. Dat zal waarschijnlijk altijd het geval zijn vanwege de unieke communicatie van elke kat.

Maar het feit dat machine learning zo ver is gekomen dat ontwikkelaars hierin zelfs gedeeltelijk kunnen slagen, is ongelooflijk. Machine learning en AI gaan razendsnel vooruit en we kunnen niet wachten om te zien waar ze naartoe gaan.

Deel Deel Tweeten E-mail Gerelateerde onderwerpen
  • Technologie uitgelegd
  • Taal leren
  • Machinaal leren
Over de auteur Natalie Stewart(47 artikelen gepubliceerd)

Natalie Stewart is een schrijver voor MakeUseOf. Ze raakte voor het eerst geïnteresseerd in technologie op de universiteit en ontwikkelde een passie voor mediaschrijven op de universiteit. Natalie's focus ligt op technologie die toegankelijk en gebruiksvriendelijk is, en ze houdt van apps en apparaten die het leven van gewone mensen eenvoudiger maken.

Meer van Natalie Stewart

Abonneer op onze nieuwsbrief

Word lid van onze nieuwsbrief voor technische tips, recensies, gratis e-boeken en exclusieve deals!

Klik hier om je te abonneren