تبدیل گفتار به نوشتار با چند نرم افزار و اپلیکیشن کاربردی 

 

چند سالی می شه که خاطره ی بد اعتماد به بعضی سایتا واسه خرید نرم افزار تبدیل گفتار به نوشتار، در ذهنم حک شده. درست از همون موقع که هزینه زیادی صرف خرید نرم افزار تبدیل صدا به متن کردم، و به نتیجه نرسیدم، تصمیم گرفتم تموم برنامه های مدعی در این مورد رو چک کنم. در این مورد فهرستی از روش ها و معرفی مختصری از این مدل برنامه ها رو در اختیار شمام قرار میدم و در آخر از شما می خوام که تجربه کاربریِ هر کدوم از این وسیله ها رو با ما در بین بذارین.

 

تبدیل گفتار به نوشتار با سایت speechtexter.com

اولین باری که تونستم خوب به کمک یک وسیله آنلاین، صدا رو به نوشتار تبدیل کنم، روزی بود که با سایت speechtexter آشنا شدم. تجربه واقعا هیجان انگیزی بود چون که چند هفته پیش از اون، حدود ۳۰۰ هزار تومن هزینه کرده بودم و یک سی دی خریده بودم که طراح اون مدعی بود از راه این نرم افزار می تونین به سرعت بالا، گفتار خود رو به متن تبدیل کنین. اما این محصول، دردسرای زیادی داشت و از شما چه مخفی، سرعت تایپ دستی ام از سرعت نوشتار اون بیشتر بود. البته شمار خطاهای این محصول هم خیلی زیاد بود و من واقعا فرصت اصلاح اشتباهاتش رو نداشتم.

speechtexter.com نرم افزاری تحت وبه که به شما اجازه می ده به شکل آنلاین، سریع صحبت کنین و اونم سریع گفته هاتون رو تایپ کنه. البته زبون این سرویس، قابل تغییر به چند ده زبون دنیاست که خوشبختانه فارسی هم در بین فهرست اون دیده میشه. بیایید کمی با این برنامه کار کنیم.

شروع کار

اگه به آدرس speechtexter.com برید تصویر زیر رو در صفحه اول سایت مشاهده می کنین:

همونجوریکه در تصویر مشاهده می کنین، شما می تونین در طرف راست، تعیین زبون صوتی و نوشتاری و در طرف چپ کلیدای راحت واسه شروع نوشتن، و مدیریت نوشتار رو تحت کنترل بگیرین.

اینجا یک دکمه به نام START هست که واسه شروع صحبت باید اونو بزنین. دقت داشته باشین که، به محض شروع صحبت، یک اعلان واسه تون ارسال می شه که میکروفون خود رو به مرورگر بشناسانید و روی ALLOW کلیک کنین تا همگام سازیا صورت گیرد.

تعیین زبون

بدین منظور روی آیکون طرف راست که UNITESD نوشته، یک بار کلیک کنین تا فهرست زبونا رو مشاهده کنین. می تونین در بین فهرست به دنبال فارسی باشین یا اینکه در باکس جست وجو زبون فارسی رو پیدا کنین و خروجی رو انتخاب کنین.

وقتی زبون به درستی مشخص شد می تونین روی START کلیک کنین تا ویرایشگر سفید اون نشون داده شه. به عنوان یک نشون از آمادگی وسیله واسه ضبط صدای شما، یک حلقه پردازشگر در بالا شروع به کار می کنه. وقتی این حلقه فعال باشه معنیش اینه که شما می تونین خیلی آسون بگید تا برنامه بنویسد.

ویرایشگر دارای وسایل قالب بندی متنه که ازجمله ی اونا میشه به فونت، اندازه، رنگ، راست چین یا چپ چین، بولد کردن، ایتالیک و زیرخط دار بودن و مواردی مثل این اشاره کرد.

البته بعضی دستورات صوتی هم هست که در بین گفتار خود می تونین به کار ببرین تا ویرایشگر کار جدیدی واسه تون بکنه. مثلا اگه بخواهید به پاراگراف بعدی برید، کافیه بگید: «پاراگراف جدید»

با گفتن و ادای اصولی این عبارت، می تونین بیان کننده رو سر خط در پاراگراف جدید مشاهده کنین.

دقیقا مثل این دستور، دستورات دیگری هم وجود دارن که با ادای اونا می تونین کار جدیدی در ویرایشگر انجام بدین. ازجمله ی این عبارت ها میشه به موارد زیر اشاره کرد:

  1. نقطه؛
  2. ویرگول؛
  3. دو نقطه؛
  4. نقطه ویرگول؛
  5. علامت سوال.

در آخر وقتی متن خود رو نوشتید می تونین در داخل همون ویرایشگر، شروع به ویراش کنین و بعضی جملات رو درست کنین یا به جملات چیزی اضافه کنین. در آخر می تونین با انتخاب تموم جملات و کپی کردن اون، متن رو به ویرایشگرایی که می خواید مثل WORD، نوت پد یا حتی به سایت انتقال بدین.

اما بدونین که به کمک نوار وسیله بالای ویرایشگر همین نرم افزار هم می تونین روی متن کارایی بکنین. مثلا، این وسیله ها رو در عکس زیر مشاهده می کنین:

به کمک این وسیله ها می تونین متن رو در یک فایل متنی ذخیره کنین یا اینکه متن رو چاپ کنین. می تونین به کمک دستورات UNDO و REDO روی متن ویرایشایی انجام بدین. به کمک همین نوار وسیله می تونین همه متن رو در کلیپ برد ذخیره کنین یا اینکه همه متن رو پاک کنین. واسه این منظور از دکمه ی CLEAR استفاده کنین.

دو نکته در مورد این برنامه

۱. استفاده از این برنامه، رایگان و با اتصال به اینترنت امکان پذیره. در بین استفاده از برنامه ممکنه با پیغامی مثل No speech was detected. Please try again روبه رو شید.

در اینجور شرایطی باید اتصال اینترنتی و حتی اتصال میکروفون خود رو چک کنین. در این مواقع اگه یک بار روی دکمه ی STOP کلیک کنین و دوباره START رو بزنین خیلی آسون می تونین مشکل رو حل کنین.

۲. شما می تونین هرچندبار که لازمه، عملیات رو قطع و وصل کنین و متن خود رو در آخر تکمیل کنین. اما موقع استفاده از این وسیله ها مراقب باشین که به اشتباه روی CLEAR کلیک نکنین چون که زحمات تون به باد میره.

تنها در یک صورت بعد از پاک شدن به وسیله این دکمه می تونین متن رو بازیابی کنین که عملیات ریستور قابل انجام باشه. در این حالت اولین آیکون قالب بندی از طرف راست، مشکیه و این معنیش اینه که متن به شکل DRAFT ذخیره شده. روی این گزینه در اینجور شرایطی یک بار کلیک کنین تا متن برگردد. اما واسه بار دوم این دکمه عمل نمی کنه.

این وسیله سرعت خیلی خوبی داره، و به شما اجازه ویرایش علاوه بر نوشتار هم می ده.

معرفی وسیله دوم: Dictate

Dictate داستان جالبی داره. همه ما میدونیم که «بیل گیتس» درست از یک گاراژ که در اون کار می کرد، به این مقام دست پیدا کرده. شاید یه سری از آدما با تغییر جایگاه خود، از یاد ببرن که از کجا به کجا رسیدن اما بیل گیتس اون گاراژ رو کماکان حفظ کرده و اونو به عنوان بخشی از شرکت خود واسه پیشرفت ی ایده های کارمندانش استفاده کرده.

در بین کارمندان بیل گیتس، هر فردی که ایده ای جدید داشته باشه در این گاراژ که این روزها بیشتر حالت اداری داره به پیشرفت ی ایده خود می پردازه.

Dictate ابزاریه که به وسیله کارمندان این شرکت در همین جای رشد پیدا کرده و البته روز به روز بر موفقیتش اضافه می شه.

Dictate برنامه ایه که می تونه در کنار برنامه های ویرایشگر مثل WORD بنشیند و به کمک افرادی بیاد که می خوان تایپ کنن. واقعا برنامه ویرایشگر تبدیل صدا به متن در مایکروسافت Dictate نام داره.

خیلی از افرادی که از سرویس ایمیلی Microsoft Outlook استفاده می کنن از این وسیله بهره می گیرن تا عملیات نوشتن متنای ایمیل رو سریع تر بکننن. واسه این آموزش هم من سعی دارم، این نرم افزار کمکی رو با Microsoft Outlook ترکیب و از اون استفاده کنم.

واسه استفاده از Dictate لازمه که به سایت مربوطه اش مراجعه و نرم افزار لازم رو دانلود کنین. دقت کنین که شما باید به تناسب نرم افزار Outlook خود، نسخه مناسب رو انتخاب کنین.

این مطلب مشابه را هم بخوانید :   تاریخچه بازاریابی؛ داستان پر ماجرای بازاریابی از کجا شروع شد "

Dictate دارای نسخه های ۳۲ بیتی و ۶۴ بیتیه. واسه همین لازمه که نسخه های Dictate و Outlook دقیقا از یک ساخت بهره مند باشن.

شناسایی نسخه نرم افزار

واسه شناسایی نسخه نرم افزارتان، کافیه برنامه رو باز کنین و به راه File> Account Office> About Outlook برید. در این قسمت مثل تصویر زیر می تونین نسخه Outlook رو مشخص کنین.

بعد از شناسایی، باید نسخه مناسب رو دانلود و اونو نصب کنین. دقت کنین که هنگام نصب باید همه نرم افزارهای واسه مایکروسافت رو ببندید.

نحوه ی استفاده از Dictate در Outlook

بعد از اینکه برنامه رو نصب کردین، Outlook رو باز کنین. در بین سر برگای این برنامه، برابر عکس زیر می تونین Dictate رو مشاهده کنین.

در زبانه ای که باز می کنین، می تونین دو بخش جداگونه مشاهده کنین:

  • بخش طرف چپ که با RESPONSE مشخص شده.
  • بخش طرف راست که با LANGUAGE OPTIONS مشخص شده.

در بخش LANGUAGE OPTIONS می تونین مشخصات زبون رو مشخص کنین و در بخش RESPONSE عملیات ضبط رو انجام بدین.

واسه ضبط کردن روی START و واسه توقف روی STOP کلیک کنین.

دقت کنین که این برنامه اول صدای شما رو کامل می شنوه و جمله کامل رو می نویسه. این برخلاف وسایل دیگریه که شاید تا الان تست کردین و البته ما در این مقاله اونا رو به شما یاد آوری کردیم.

استفاده از فرمونای صوتی در این برنامه هم رواج داره. مثلا با گفتن DELETE آخرین جمله نوشته شده حذف می شه. با گفتن New line، وارد خط بعدی میشید و در آخر اگه بخواهید نوشتار رو تموم کنین، می تونین روی STOP کلیک کنین یا آسون تر بگید Stop dictation!

Manual Punctuation بخشیه که می تونین بعضی دستورات صوتی رو در اون مشاهده و تحت اختیار بگیرین. مثلا این برنامه به طور خودکار انتهای هر جمله رو، نقطه گذاری می کنه اما شما می تونین این کار رو خودتون بکنین. به کمک Manual Punctuation می تونین بقیه دستورات رو هم تحت کنترل بگیرین. ازجمله ی این دستورات میشه به موارد زیر اشاره کرد:

دوره زمانی (Period)، کاما (Comma)، علامت سوال (Question mark)، نقل قول باز (Open quote)، بستن نقل قول (Close quote)، کولون (Colon)

عمر این برنامه طولانی نیس اما شما می تونین به عنوان یک وسیله کمکی اونو در کنار برنامه های ویرایشگر مایکروسافت استفاده کنین. این برنامه می تونه تا ۲۰ زبون رو درک کنه و تا ۶۰ زبون رو به طور کامل بنویسد اما وجود اشکالات نگارشی در اون، دور از انتظار نیس.

روش سوم: استفاده از ربات voicybot

اول لازمه که وارد تلگرام شید و @voicybot رو بنویسین و روی اون کلیک کنین تا وارد ربات شید.

روی START که در انتهای صفحه کلیک کنین (لمس کنین) تا عملیات تبدیل گفتار به نوشتار به وسیله تلگرام، شروع شه:

اول لازمه که زبون خود رو مشخص کنین. فهرست مفصلی از زبونا در اول به وسیله این برنامه و ربات تلگرام در اختیار شما قرار میگیره. بدین صورت می تونین با کمک دکمهای جهتی < و > بین زبونا گردش کنین و Persian رو پیدا کنین. روی این دکمه کلیک کنین تا زبون فارسی تنظیم شه:

روال کار با این ربات به شکل ضبط صداست. شما باید دکمه ی میکروفون در طرف راست در تلگرام رو فشار بدین، و شروع به صحبت کنین. بعد از تموم شدن صحبت، میکروفون رو آزاد کنین تا عملیات تشخیص گفتار شروع شه. هنگامی که به وسیله ربات پردازش صورت میگیره، این مراحل برابر عکس بالا گزارش می شه. در آخر اون چه که ربات به اون دست پیدا می کنه و درک می کنه در زیر صدای ضبط شده نوشته می شه:

اینجوری می تونین صداهای خود رو ضبط و به نرم افزار معرفی کنین.

یک ویژگی عالی این نرم افزار تلگرامی اینه که می تونین صدای ضبط شده ی خود رو به شکل فایلای صوتی مثل mp3 و غیره، به برنامه معرفی کنین. واسه این منظور، می تونین با هر نرم افزار ضبط صدا، صدای خود یا هر فردی رو ذخیره و ضبط کنین و بعد به کمک توانایی ضمیمه کردن فایل، که آیکون اون به شکل گیره شکله و در کنار آیکون میکروفون قرار داره، فایل ضبط شده رو آپلود کنین و بعد از اینکه فایل بارگزاری شد، عملیات تشخیص صدا صورت خواهد گرفت و متن واسه شما ارسال میشه.

دقت کنین که این ربات خطا هم داره. پس بعد از تبدیل گفتار به نوشتار، توجه کنین که با یک بررسی در متن، عبارتی اشتباه برگردان نشده باشه.

این ربات واسه هر دو حالت تلگرام، یعنی تحت اندروید و دسکتاپ قابل استفادهه.

اپلیکیشنای اندرویدی تبدیل گفتار به نوشتار

اگه به کمک بعضی مارکتای اپلیکیشن در ایران، بخواهید به دنبال اینجور نرم افزارهایی باشین، باید عبارت، تبدیل گفتار به نوشتار رو جست وجو کنین. در اینجور حالتی شمار زیادی اپلیکیشن به شما پیشنهاد داده می شه.

اصول کار همه این نرم افزارها مشابهه. بعد از اینکه نرم افزار رو نصب کردین، از شما در مورد تعیین زبون سؤال می شه. معمولا این اپلیکیشنا، زبون رو روی فارسی تنظیم کردن.

بعد از اون با زدن یک دکمه ی شروع، از شما خواسته می شه که صحبت کنین. از زمانی که دکمه ی شروع رو میزنین، سرویسای یاد شده به کمک سرویس گوگل، صدای شما رو شناسایی می کنن و عملیات ضبط و تبدیل رو انجام میدن.

بعد از اینکه دکمه ی شروع رو زدید با یک دیالوگ باکس به شکل زیر روبرو میشید:

این صفحه نشون می ده که اپلیکیشن مورد نظر از گوگل قوت گرفته. شما باید حرف زدن خود رو شروع کنین تا برنامه اونو فهمیده باشه. معمولا باید چند بار صحبت کنین تا نرم افزار صدای شما رو دریافت و اونو درک کنه و بعد اونو بنویسد:

در تجربه ای که با چند برنامه اندرویدی داشته ام، فهمیده ام که، سرعت واکنش اپلیکیشنا خیلی پایینه و بعضی وقتا خطاهایی داره که واقعا آزار دهنده ان. من تا الان اپلیکیشن قوی در این باره ندیده ام اما نسخه های تحت وب می تونن خیلی بهتر جواب انگار داشته باشن. تجربه شخصی شما در این باره چیه؟

برنامه های بومی ایرونی

با توجه به اینکه تعداد کاربرانی که می خوان با تبدیل گفتار به نوشتار، به امور تایپی خود سرعت ببخشند هر روز بیشتر می شه، سایتای ایجاد شدن که به کاربران کمک می کنن تا با رابط کاربری ایرونی بتونن صدای خود رو به متن تبدیل کنن. اما نکته ی مهمی در این باره هست که هنوز بعضی از این سرویسا دارای کمبودا و نواقصی هستن. مثلا بعضی با سرعت خوبی که در نوشتار دارن، امکان ویرایش در لحظه رو واسه شما فراهم نمی کنه. یا اینکه بعضی علاوه بر ارائه سرویس محدود رایگان، سرویس تبدیل گفتار به نوشتار خود رو با هزینه ماهانه ارائه می ده.

به نظر می رسه که اگه بخواهید از وسایل یاد شده استفاده کنین، می تونین خیلی آسون به کمک وسایل تحت وب و وسایل اندرویدی و حتی ربات تلگرامی خوب کار خود رو پیش ببرین و احتیاجی به وقت گذرانی با بقیه وسایل محدود نیس.

در این باره دیدگاه ها و تجربیات مهم ی خود رو با ما در بین بذارین و به ما بگید که تا الان از چه ابزاری واسه این هدف استفاده کردین.



Be the first to comment

Leave a Reply