Taligenkänning är en teknik som tillåter talad inmatning i system. Du pratar med din dator, telefon eller enhet och det använder vad du sa som input för att utlösa vissa åtgärder. Tekniken används för att ersätta andra metoder för inmatning som att skriva, klicka eller välja på andra sätt. Det är ett sätt att göra enheter och programvara mer användarvänliga och öka produktiviteten.
Det finns många tillämpningar och områden där taligenkänning används, inklusive militären, som ett hjälpmedel för nedsatta personer (föreställa sig en person med krämpling eller inga händer eller fingrar), inom medicinsk fält, inom robotik etc. I den närmaste framtiden, nästan alla kommer att utsättas för taligenkänning på grund av dess utbredning bland vanliga enheter som datorer och mobiltelefoner.
Vissa smartphones gör intressant användning av taligenkänning. IPhone- och Android-enheterna är exempel på det. Genom dem kan du initiera ett samtal till en kontakt genom att bara få talade instruktioner som "Call office." Andra kommandon kan också vara underhållna, som "Slå på Bluetooth."
Problem med taligenkänning
Taligenkänning, i sin version som kallas tal till text (STT), har också länge använts för att översätta talade ord till text. "Du pratar, den typ", som ViaVoice skulle säga på sin låda. Men det finns ett problem med STT som vi vet. ViaVoice är en av de bästa inom branschen, så föreställ dig resten. Tekniken har mognat och förbättrats, men text till text gör fortfarande folk att ställa frågor. En av huvudproblemen är de enorma variationerna bland människor som uttalar ord.
Inte alla språk menas i taligenkänning, och de som gör ofta stöds inte lika bra som engelska. Som ett resultat av detta utför de flesta enheter som kör taligenkänningsprogramvara rimligen endast på engelska.
En uppsättning hårdvarukrav gör det svårt att använda taligenkänning i vissa fall. Du behöver en mikrofon som är intelligent nog för att filtrera bort bakgrundsbrus men samtidigt kraftfullt nog för att fånga röst naturligt.
Med tanke på bakgrundsbrus kan det orsaka att ett helt system misslyckas. Som ett resultat misslyckas taligenkänning i många fall på grund av ljud som inte är användarens kontroll.
Taligenkänning visar sig vara bättre som en inmatningsmetod för nya telefoner och kommunikationsteknologier som VoIP, än som ett produktivitetsverktyg för masstextinmatning.
Ansökningar av taligenkänning
Tekniken blir populär på många områden och har lyckats med följande:
- Enhetskontroll. Att bara säga "OK Google" till en Android-telefon bränder upp ett system som är alla öron till dina röstkommandon.
- Bil Bluetooth-system. Många bilar är utrustade med ett system som kopplar sin radiomekanism till din smartphone via Bluetooth. Du kan sedan ringa och ta emot samtal utan att röra på din smartphone och kan till och med ringa nummer genom att bara säga dem.
- Rösttranskription. I områden där människor måste skriva mycket, fångar en del intelligent program sina talade ord och transkriberar dem till text. Detta är aktuellt i vissa ordbehandlingsprogram. Rösttranskription fungerar även med visuell röstbrevlåda.