در اين مقاله قصد داريم تا يکي از پرکاربرد ترين قابليتهاي گوگل را بررسي کنيم و ببينيم که چه مزايا و معايبي دارد. قابليت مورد نظر ما تايپ صوتي در گوگل است که به کاربران اين اجازه را ميدهد تا بدون نياز به تايپ کردن تنها با گفتن چيزي متن آن را داشته باشند. در ادامه با ما همراه باشيد.
تايپ صوتي گوگل چيست؟
اگر بخواهيم تعريف دقيقي از اين فناوري داشته باشيم، ميتوانيم بگوييم که تايپ صوتي در گوگل يک ابزار رايگان براي ديکته گفتن در سرويسهايي همانند Google Docs، Google Slides و پردازنده کلمات آنلاين گوگل و ابزارهاي پرزنت و ارائه آن ميباشد. از آنجايي که بيشتر نرم افزارهايي که براي تايپ کردن از آنها استفاده ميشود، قابليت برخورداري از اين سرويس گوگل را دارند، به طور کلي ميتوان گفت که تايپ صوتي گوگل قابليت استفاده براي همه را دارد.
تايپ صوتي گوگل در روي کيبرد اکثر گوشيهاي هوشمند وجود دارد و در حقيقت همان نشانهي ميکروفوني است که در پايين کيبرد و در سمت چپ دکمه فاصله قرار گرفته است. در رايانههاي شخصي هم با استفاده از مرورگر کروم ميتوانيد از سرويس Google Doc کمک گرفته و از اين فناوري استفاده نماييد.
در بروزترين نسخه اين سرويس قادر است از 119 زبان زنده دنيا پشتيباني کند و محتواي موجود در صوتهاي اين زبانها را به متن تبديل کند. سرويس رايگان تايپ صوتي گوگل نيز براي کاربران فارسي زبان و بر روي زبان فارسي نيز در دسترس عموم ميباشد.
چگونه از تايپ صوتي گوگل استفاده کنيم؟
کاربراني که از گوشيهاي هوشمند استفاده ميکنند با زدن دکمهي ميکروفون بر روي کيبرد گوشي خود ميتوانند از تايپ صوتي گوگل بهرهمند شوند. در تصوير زيد ميتوانيد محل اين دکمه را مشاهده نماييد.
اگر از Google Docs استفاده ميکنيد با مراجعه به منو، قسمت Tools را باز کرده و گزينه Voice typing را فعال نماييد.
لازم به ذکر است که قابليت تبديل صوت به متن گوگل براي سازندگان اپليکيشني که ميخواهند از قابليت تايپ صوتي بر روي اپ خود استفاده کنند در دسترس ميباشد و با پرداخت هزينه ميتوانند api تايپ صوتي گوگل را دريافت نمايند.
آيا قابليت تايپ صوتي گوگل بر روي زبان فارسي در ايران هم کاربرد دارد؟
بله، قابليت تايپ صوتي گوگل بر روي زبان فارسي هم در دسترس کاربران فارسي زبان ميباشد. با استفاده از راههايي که گفته شد کاربران ميتوانند از مزاياي سرويس تبديل گفتار به نوشتار گوگل در زبان فارسي بصورت رايگان بهرهمند شوند. پس از فعال کردن قابليت تبديل گفتار به نوشتار ميتوانيد به آي زبان مراجعه کرده و پيش فرض زبان را تغيير داده و زبان فارسي را انتخاب نماييد. پس از اطمينان از صحت عملکرد و کيفيت ميکروفوني که داريد ميتوانيد از تايپ صوتي بهرهمند شويد.
مزاياي تايپ صوتي در گوگل چيست؟
گوگل در چند سال اخير سرمايهگذاري سرسام آوري را بر روي فناوري زبان بر روي زبانهاي مختلف در دنيا انجام داده است. نتيجهي اين سرمايهگذاري فوقالعاده فناوري شده که در بسياري از زبانها با کيفيت خوب گفتار را درک کرده و آن را به نوشتار تبديل مينمايد. از مزاياي تايپ صوتي فوقالعاده گوگل ميتوان به موارد زير اشاره نمود:
سرعت فوقالعاده
قدرت تايپ کلمات يک فرد عادي بين 38 تا 40 کلمه در دقيقه ميباشد که اين تعداد برابر است با به طور ميانگين 2400 کلمه در ساعت. اگر به جاي روشهاي تايپ قديمي از تايپ صوتي گوگل استفاده شود اين سرعت را ميتوان تا چيزي حدود 4 برابر افزايش داد. يعني در هر دقيقه به صورت ميانگين 150 کلمه.
دسترسي بالا
از آنجايي که تايپ صوتي گوگل بر روي پلتفرمهاي متفاوتي در دسترس است و در گوشيهاي هوشمند نيز ميتوان در هر کجا از آن استفاده کرد، ميتوان در هر کجا از آن استفاده نمود. ديگر لازم نيست همانند روشهاي قديمي يک جا نشسته و ساعتها به تايپ کردن مشغول شويد.
دقت بالا
يک تايپيست معمولي به صورت ميانگين از هر 100 کلمه 8 کلمه را اشکال دارد. در صورتي که با استفاده از تبديل گفتار به نوشتار گوگل ميزان خطا تا حد زيادي کاهش ميابد. زيرا به جاي نوشتن کلمات با استفاده از کيبرد، کلمات مستقيما به هوش مصنوعي گوگل گفته شده و او نيز آنها را به نوشته تبديل کرده است.
توانايي تبديل صوت به متن در هر پلتفرمي
به کمک سرويس تبديل گفتار به نوشتار گوگل ميتوانيد فايلها را به هر فرمتي که ميخواهيد ذخيره کنيد. زيرا بسياري از نرم افزارهايي که از آنها استفاده ميشوند قابليت وصل شدن به سرويس تايپ صوتي را دارند. در غير اين صورت نيز ميتوانيد از پلتفرمهاي گوگل براي تبديل گفتار به نوشتار استفاده نموده و پس از ويرايش فايل نهايي آن را در پلتفرم مورد نظر کپي کرده و با فرمت دلخواه ذخيره نماييد.
پر واضح است اگر بخواهيم مزاياي تايپ صوتي گوگل را بنويسيم، ميتوانيم يک مقاله را به آن اختصاص دهيم. اما قصد ما در اين مقاله بررسي کلي اين قابليت است و ميخواهيم از تمام جوانب به آن نگاهي بندازيم.
معايب تايپ صوتي در گوگل چيست؟
شايد عنوان اين بخش براي شما سوال بر انگيز باشد و بگوييد مگر ممکن است که سرويسي که گوگل با آن همه عظمت ارائه ميدهد عيب و يا مشکلي داشته باشد؟ بايد بگوييم که براي کاربراني که کارهاي کوچکي با تايپ صوتي دارند و نميخواهند به طور پيشرفته از آن استفاده کنند، اين سرويس همانگونه که هست بسيار عالي خواهد بود و نقدي بر آن نيست. مشکل از جايي شروع ميشود که بخواهيم از تايپ صوتي براي مقاصد پيشرفتهتر استفاده نماييم. در اين بخش ممکن است با مشکلات زير مواجه شويم:
نياز به اتصال دائمي اينترنت
شايد بتوان گفت يکي از معايب اين تايپ صوتي گوگل بخصوص در زبان فارسي آن است که در زمان استفاده از آن حتما بايد به اينترنت دسترسي دائم داشته باشيد. اين مسئله شايد در استفادههاي محدود و کم به چشم نيايد اما زماني که نياز داريد تا گفتارهاي طولاني را به متن تبديل کنيد و يا در مکانهايي قرار داريد که دسترسي مناسبي به اينترنت نداريد، بسيار مشکل آفرين ميشود.
سرور خارج از ايران
يکي از مشکلاتي که سازمانهاي داخلي با آن روبهرو هستند، آن است که طبيعتا چون گوگل يک شرکتهاي خارجي است، سرورهاي آن نيز در خارج از کشور قرار دارد و سازمانها و شرکتهايي که داراي دادههايي هستند که نميخواهند به خارج از سازمان برود، عملا نميتوانند از تايپ صوتي گوگل استفاده کنند. زيرا آنها به سرويسهايي نياز دارند که به صورت لوکال بر روي سرورهاي خودشان نصب شود و هيچ اطلاعاتي را به بيرون از سازمان نفرستند.
عام بودن گفتار به نوشتار
يکي از مشکلاتي که کاربران فارسي زبان در استفاده از تايپ صوتي گوگل با آن مواجهه هستند، آن است که اين سرويس تنها قادر است گفتار عام در زبان فارسي را متوجه شود و کلمات تخصصي در زبان فارسي که برخي کسبوکارها، همانند وکلا و حقوقدانان و…، از آنها به کرات استفاده ميکنند را به درستي متوجه نميشود. به همين خاطر کسبوکارهاي اين چنيني براي تبديل گفتار به نوشتار و تايپ صوتي نميتوانند بر کمک گوگل اتکا کنند.
نفهميدن لهجههاي مختلف زبان فارسي
زبان فارسي پر است از لهجهها و گويشهاي مختلف. اگر نرم افزاري بخواهد در زبان فارسي به خوبي کار کند نياز دارد که تمام اين لهجهها را متوجه شود. متاسفانه همانطور که در مورد قبل به آن اشاره شد تايپ صوتي گوگل گفتار عام زبان فارسي را متوجه ميشود و باز هم کاربران فارسي زبان با مشکلات بسياري در اين زمينه روبهرو هستند.
پولي بودن api سرويس تايپ صوتي گوگل
بسياري از توسعه دهندگان اپليکيشن که ميخواهند از قابليت تايپ صوتي در اپليکيشن خود استفاده نمايند، اول از همه به سراغ سرويس گوگل ميروند. برعکس اينکه تايپ صوتي گوگل بر روي سرويسهايي که خود ارائه ميدهد رايگان ميباشد، براي دريافت api آن به صورت دقيقهاي بايد هزينه پرداخت نمود. چون اين هزينه به دلار محاسبه ميشود براي کاربران داخلي استفاده از آن به صرفه نميباشد و عملا نميتوانند از تايپ صوتي گوگل استفاده نمايند.
زماني که تايپ صوتي گوگل در زبان فارسي مشکل آفرين ميشود چه کنيم؟
اگر شما هم در استفاده از تايپ صوتي در گوگل به معايبي که گفته شد و يا مشکلات ديگري برخورديد، تنها راه شما روي آوردن به سرويسهاي تايپ صوتي ديگر است. سرويسهايي که بتواند همان کيفيت را با استانداردهاي مورد نياز شما در اختيارتان قرار دهد. اگر به دنبال چنين سرويسي هستيد، ما فارس آوا را به شما معرفي ميکنيم. سرويس فارس آوا يکي از بهترين موتورهاي تبديل گفتار به نوشتار در زبان فارسي مي باشد.
محصول فارس آوا تبديل گفتار به نوشتار را به صورت تخصصي براي زبان فارسي انجام مي دهد و قادر است ارتباط کلامي بين شما و کامپيوتر يا موبايلتان را فراهم کند. محصول فارس آوا با تکيه بر دانش متخصصان هوش مصنوعي ايراني و با بهره گيري از آخرين تکنولوژي هاي روز دنيا توليد شده است و به دليل جمع آوري بزرگ ترين ديتاسِت موجود در زبان فارسي و تمرکز ويژه روي اين زبان، ضمن بهره مندي از تنوع گفتاري بسيار وسيع موفق شده است تا در رقابت با شرکت هاي بزرگي چون گوگل (بر روي زبان فارسي) داراي ضريب دقت بالايي باشد.
محصول فارس آوا داراي قابليت هاي زير مي باشد:
- تبديل گفتار به متن فارسي با دقت و سرعت بالا
- بهره مندي از آخرين تکنولوژيهاي يادگيري عميق
- تبديل گفتار به متن بصورت همزمان (Real-Time)
- تشخيص گفتار و صوت در محيط هاي نويزي
- پشتيباني از انواع لهجه ها و گويش ها
- قابليت تبديل گفتار محاوره اي به متن
- پشتيباني از انواع فرمتهاي صوتي و ويديويي
- تبديل گفتار انگليسي به متن انگليسي
- غير وابسته به گوينده و عدم نياز به آموزش براي هر فرد
- ارائه API محصول فارس آوا و SDK تبديل گفتار به متن در قالب وب سرويس
- ارائه پنل تحت وب براي آپلود کردن فايلها جهت پردازش
- قابل نصب روي سرور مشتري و عدم نياز اتصال به اينترنت
- بهره مندي از دايره واژگان (فرهنگ لغت) بسيار وسيع
- تبديل گفتار به نوشتار به کمک هوش مصنوعي
با توجه به قابليت هاي ذکر شده، محصول فارس آوا مي تواند چنين کاربرد هايي داشته باشد:
- امکان استفاده در تمامي سيستم هاي عامل (Android, IOS, Mac, Windows, Linux)
- امکان استفاده براي تمامي برنامه هاي تحت موبايل (تمامي پلتفرمها)
- امکان استفاده در برنامه هايي از قبيل دستيارهاي شخصي هوشمند در موبايل
- امکان استفاده هاي عمومي از قبيل : تايپ گفتاري و اجراي دستورات صوتي
- امکان سفارشي سازي براي تشخيص دستورات خاص صوتي
- امکان سفارشي سازي براي کاربردهاي خاص و افزايش دقت
- پردازش داده هاي حجيم گفتاري
علاوه بر آن فارس آوا داراي دو محصول جانبي ميباشد که ميتواند عمليات تبديل متن به گفتار (TTS) و استخراج کلمات کليدي (KWS) را انجام دهد. چنانچه قصد داريد با محصول فارس آوا بيشتر آشنا شويد به صفحه محصول فارس آوا مراجعه کنيد و اگر درخواست دمو داريد به صفحه تماس با ما مراجعه نماييد.