Próbáink során legalább nyolcvanszázalékos
biztonsággal képes szöveggé alakítani az iPhone vagy iPad készüléknek
feolvasott magyar nyelvű szöveget egy új alkalmazás. A Dragon Dictation
teljesen ingyenes lesz, de használatához mobilinternetes kapcsolatra is
szükség van.
Tesztünk során inkább a gépírásban jeleskedő, hadaró újságírókkal és
rádiós múlttal rendelkező, profin hangsúlyozó, kellemes hangú
kollégákkal egyaránt kipróbáltattuk a budapesti központtal is rendelkező
Nuance cég ingyenes applikációit, melyek egyikének diktálni lehet, a
másikkal pedig webes kereséseket lehet végrehajtani az iPhone vagy
iPad-készülékhez beszélve. A megoldás nem csak a legújabb iPhone 4S-sel
kompatibilis, hanem a korábbi, iOS 4-es rendszert használó régebbi
iPhone, iPad és iPod Touch modellekkel is használható.A készüléknek előbb Békés Pál A kétbalkezes varázsló című meseregényének egy bekezdését olvasták fel kollégáink, később áttértünk a Karinthy-fordította Micimackó egyik részletére.
Hangutánzó szavakkal és helynevekkel lehet megzavarni a diktálós programot
Háttérzajtól, hangtól és beszédsebességtől függetlenül remekül teljesített a Dragon Dictation. Ugyan egy olyan felvétel sem készült, amelyet azonnal el lehetett volna küldeni közlésre, de a legtöbb esetben a hangból szövegfájllá alakított szövegben csak néhány módosítást kellett eszközölni, ráadásul a programok képesek tanulni, így az első próbák után egyre kevesebb hibát ejtettek, a végeredmény pedig csaknem teljesen hibátlan szöveg lett.
Megfigyelésünk szerint a hangsúlyozás okozta a legnagyobb problémát a programnak, mondatrészek határán gyakran tévedett a Dragon Dictation. A tesztszövegnek használt Micimackó-bekezdés döngicsélés szavával sokadjára sem sikerült megbirkóznia a programnak, rendre gőgicsélésnek értette. A többi hangutánzó szóval is elbánt a program, aki loccsanásról, poccsanásról vagy zakkanásról akar smsezni, az jobban teszi, ha begépeli ezeket a szavakat. A nevekkel sincs kibékülve a program, teljesen esetleges, hogy a város- és személyneveket ki tudja-e találni a Dragon-program, vagy keres helyettük egy hasonló hangzású magyar szót. Minél mindennapibb a szöveg, annál jobb a hangfelismerő hatékonysága, egy kocsmázásra, koncertlátogatásra felszólító smst már első próbálkozásra is felismer, a szakkifejezéseket tartalmazó leveleket még célszerűbb kézzel írni.
Amerikába küldi a hangunkat
Az Apple legújabb iPhone-jába épített Siri-szolgáltatáshoz hasonló funkciókat biztosító program a számítási felhőn keresztül működik: az eszköz gyakorlatilag csupán felveszi a hangot és továbbítja egy amerikai szerverre, amely elvégzi annak elemzését.
A hangfelismerő programot kifejlesztő cég európai üzletágának vezetője, Reimund Schmald az [origo]-nak elmondta, hogy a Dragon Dictation önálló tanulásra is képes. Nem igényli, hogy használója manuálisan javítgassa át a hibás szavakat, a felhőben futó program maga is újraértékeli a korábban felismert hangsorokat, de manuálisan is meg lehet adni változtatásokat, ezeket a rendszer megjegyzi, és tanul belőlük.
A hangvezérelt Dragon Search segít a neten keresgélni és wikipédiázni
Ehhez hasonló egyébként a Google Fordító szolgáltatásának a működési elve is, amelynek tudása a bevitt szöveg mennyiségének növekedésével, a felhasználók által javított hibás fordítások szaporodtával lett egyre okosabb.
A felhőben tartják agyukat, ezért internetkapcsolat nélkül nem működnek a Dragon-szoftverek
Egyelőre csak iPhone-ra jelenik meg
A Dragon Dictation és a hangfelismerős keresésre képes Dragon Search november 17-én jelenik meg az Apple magyar App Store-jában. Mindkét program ingyenes lesz, az azonnali pénzszerzés helyett egyelőre a működő magyar hangfelismerés létét akarja demonstrálni a Nuance a szoftverekkel. A cég nem dolgozik a program androidos és Windows Phone 7-es verzióján - bár házon belül készítettek egy androidos tesztverziót - a Nuance által biztosított ingyenes programozói felületre azonban bárki építhet saját programot, így a titkárnő nélküli diktálás az Apple készülékein kívül eltérő eszközökön is elérhetővé válhat.
A Nuance képviselői ugyan nem közölték, hogy meddig lesz ingyenes a két Dragon-program, ám az iPhone és iPad felhasználóknak valószínűleg nincs félnivalójuk. A cég nem az appokból jut pénzhez, hanem az általa kidolgozott technológiákat licenceli orvosi felhasználásra, telefonos ügyfélszolgálati rendszerekhez, és egyéb, az állami szférában működő szövegértelmező rendszerekhez. A Nuance neve gyakran nem is szerepel a technológiát felhasználó terméken, ám lehet tudni, hogy a cég fejlesztéseinek köszönhetően tudja kimondani az előadó nevét az Apple iPod Nanója, olvassa fel a könyveket az Amazon Kindle, és tud új címet felvenni hangparancs alapján a TomTom navigációja.
Nincsenek megjegyzések:
Megjegyzés küldése