پروژه بازشناسي گفتار پيوسته
بازشناسي گفتار پيوسته بهمعني تشخيص گفتار انسان توسط كامپيوتر و تبديل آن به متن است كه در آن گفتار ورودي بهصورت دنبالهاي پيوسته از كلمات و جملات ادا ميشود. در حال حاضر شركت عصرگويشپرداز با استفاده از جديدترين تكنيكهاي موجود، يك موتور بازشناسي گفتار پيوسته، مستقل از گوينده و با واژگان بزرگ را توسعه داده است كه با استفاده از آن نرمافزار ديكته گفتاري فارسي (نويسا) در نسخههاي گوناگون توليد و عرضه شده است. با استفاده از اين موتور امكان طراحي و توسعة نرمافزار ديكتة گفتاري براي زبانهاي ديگر (مانند انگليسي، عربي، كردي و ...) نيز فراهم است. تحقيقات بيشتر براي بهبود دقت و افزايش قابليتهاي اين موتور بازشناسي همچنان ادامه دارد.
اشاره به روشهاي شبکه عصبي،
HMM،
MFCC،
Robustnessو ...
پروژه بازشناسي گفتار تلفني
به موازات پروژه بازشناسي گفتار پيوسته كه در آن گفتار معمولاً از طريق ميكروفون به كامپيوتر داده ميشود، پروژة بازشناسي گفتار تلفني نيز در شركت عصرگويشپرداز انجام شده است. بازشناسي گفتار تلفني در مقايسه با بازشناسي گفتار ميكروفوني داراي پيچيدگي بيشتري است؛ زيرا گفتار تلفني كيفيت پايينتري داشته و پهناي باند آن محدود به 4 كيلوهرتز است. همچنين گفتار تلفني معمولاً بهصورت محاورهاي بوده و تنوع گويندگان و همچنين تنوع كانالهاي ارتباطي در آن بسيار بالا ميباشد. اين مسائل باعث ميشود كه براي بازشناسي گفتار تلفني از تكنيكهاي متفاوتي نسبت به بازشناسي ميكروفوني استفاده گردد. بازشناسي گفتار تلفني براي بازشناسي اعداد و فرمانهاي گفتاري در سيستمهاي تلفن گوياي گفتاري و سيستمهاي
IVRمبتني بر گفتار استفاده ميشود.
پروژه تبديل متن به گفتار (TTS)
هدف از اين پروژه خواندن متون الكترونيكي توسط رايانه است. اين پروژه شامل دو بخش يا دو زيرپروژه است. بخش اول تبديل متن به دنبالهاي از واحدهاي آوايي (مانند واجها، هجاها و ...) است و بخش دوم تبديل دنبالة واحدهاي آوايي به گفتار (سنتز گفتار) ميباشد. بخش اول وابسته به زبان بوده و براي هر زباني بايد جداگانه انجام شود ولي بخش دوم ميتواند مستقل از زبان انجام شود. شركت عصرگويشپرداز براي بخش اول يك موتور تبديل متن به واحدهاي آوايي (
TTP) را براي زبان فارسي توسعه داده است. براي بخش دوم نيز يك موتور سنتز گفتار با كيفيت بالا با استفاده از روشهاي نوين سنتز، طراحي و توسعه داده شده است كه ميتواند براي زبانهاي گوناگون مورد استفاده قرار گيرد. مهمترين مسئله در تبديل متن به گفتار، كيفيت گفتار خروجي است كه سعي ميشود هرچه بيشتر به لحن گفتار انسان نزديكتر بوده و كمتر حالت ماشيني داشته باشد. تلاشها براي افزايش كيفيت گفتار خروجي سيستم تبديل متن به گفتار در شركت عصرگويشپرداز ادامه دارد.
اشاره به روشهاي پارامتري، و ...
پروژه شناسايي گوينده از روي صدا
صداي انسان از ويژگيهاي بيومتريك و منحصربهفرد هر شخص ميباشد. هدف از شناسايي گوينده، استخراج اطلاعاتي از سيگنال گفتار است که در بردارنده هويت منحصر به فرد گوينده ميباشد. شناسايي گوينده شامل دو حوزه تعيين هويت گوينده و تصديق هويت گوينده است. در تعيين هويت گوينده، فرد از روي صحبت کردن شناسايي ميشود و در تصديق هويت، ادعاي فرد مبني بر اينکه چه کسي است، تاييد يا رد ميگردد. سامانههاي شناسايي گوينده در کاربردهاي مختلف امنيتي و کنترل دسترسي، به تنهايي يا در کنار ديگر روشهاي امنيتي مورد استفاده قرار ميگيرند. شركت عصرگويشپرداز يك سيستم شناسايي گوينده با دامنه باز را توسعه داده است كه قابل اجرا بهصورت برخط و برونخط بوده و قادر است پردازشها را برروي خطوط تلفن و ماهواره نيز انجام دهد.
پروژه تشخيص كلمات كليدي در گفتار
تشخيص کلمات کليدي گفتار به معناي پيدا کردن يک کلمه يا عبارت خاص در گفتار ميباشد.
رفتن به بالای صفحه