Als Manager Research & Development bij G2 Speech, heb ik te maken met verschillende mensen en werk ik met meerdere technologieën. Met die kennis en ervaring probeer ik me een beeld te vormen over nieuwe technologie en nieuwe functionaliteiten. Deze verwerken we vervolgens in onze oplossingen om zo waarde toe te kunnen voegen voor onze klanten.
Vanochtend in de auto op weg naar kantoor, vroeg ik me af of spraakherkenning nu echt de volgende grote technologische doorbraak is? En als dat zo is, waarom duurt het zo lang voordat spraakherkenning volwassen genoeg is om gebruikt te worden in onze dagelijkse leven. Kunnen we spraakherkenning straks ook toevoegen aan het lijstje van revolutionaire technologieën, zoals de introductie van de muis in de jaren 80? De grafische gebruikersinterface (ook geïntroduceerd in de jaren 80, maar eigenlijk alleen een succes vanwege het gebruik van de muis.)? Of het touchscreen, dat al in de jaren tachtig gebruikt werd in de industrie, maar eigenlijk pas omarmd werd door de introductie van de iPhone® en later de iPad®? Ik denk het wel.
Het zal niet vandaag of morgen gebeuren. Maar het gaat wel snel gebeuren. De technologieën die ik net noemde, hebben ons leven drastisch verandert. Had je me 15 jaar geleden gevraagd of ik me voor kon stellen dat ik nu, een smartphone zou gebruiken met enkel een touchscreen voor het bijhouden van mijn e-mail en agenda, die me helpt mijn geldzaken te regelen, en die me in staat stelt met vrienden te communiceren, zonder daarbij gebruik te maken van de telefoonfunctionaliteit? Wat denk je dat ik toen gezegd zou hebben? We konden ons geen voorstelling maken van zo’n klein apparaat dat meer technologie en rekenkracht tot zijn beschikking zou hebben dan de gemiddelde ruimtevaart-satelliet van dat moment. Waarschijnlijk had ik toen geantwoord: ‘Waar en wanneer kan ik zo’n apparaat krijgen?’
Hoe stellen we ons dat voor? Hoe gaan wij spraakherkenning gebruiken? Gaat het zich ontwikkelen tot zoiets als in Star Trek? (Ik ben overigens geen diehard Star Trek fan.) Of zoiets als in de films Minority Report en Iron Man? (Dat wordt al beter.) Waarschijnlijk wel. Het stelt ons in staat om op een intuïtieve manier te communiceren met technologie om ons heen; het stellen van vragen en opdracht geven tot simpele taken.
Spraakherkenning is al een tijdje beschikbaar en hoewel de prestaties en nauwkeurigheid met iedere nieuwe versie beter worden, is er in de basis niet veel veranderd. Het volgende hoofdstuk in het tijdperk van spraakherkenning is wat wij noemen, language understanding. Dit betekent dat niet alleen de woorden herkend worden en dat de gesproken woorden omgezet worden naar geschreven tekst, of dat er enkel korte, letterlijke spraakcommando’s gebruikt kunnen worden. Maar juist interpreteren wat er gezegd wordt en daar betekenis aan geven. Hierdoor heb je veel verschillende mogelijkheden om iets te zeggen, en toch hetzelfde resultaat te krijgen.
Eigenlijk is dit precies wat we momenteel onderzoeken bij G2 Speech. Zijn we in staat om, vandaag de dag, een intuïtieve manier te vinden die ons in staat stelt met systemen interactie te hebben, en kunnen we data gebruiken voor medische verslaglegging en voor het ontwikkelen van prestatie-indicatoren voor ziekenhuizen of individuele afdelingen? Zijn we in staat die data te gebruiken voor het ondersteunen van beslissingen, voor het geven van directe feedback aan de arts met betrekking tot zijn verslag en voor het voorschrijven van medicatie? De tijd zal het ons leren. Over 15 jaar kan ik het je waarschijnlijk haarfijn uitleggen.
Als je meer wilt weten over hoe spraakherkenning woorden en zinnen steeds slimmer kan interpreteren, bekijk dan de video van Google eens. Deze duurt maar 8 minuten en neemt je mee in de ontwikkelingen van spraakherkenning.Ook hoor ik graag van je als je feedback hebt of als je bijvoorbeeld meer zou willen weten over spraakherkenning. Of als je suggesties hebt waarover we zouden kunnen bloggen. Laat het ons weten.
Blog geschreven door Bas Jansen, Manager R&D G2 Speech