تاريخ انتشار : 1395/09/01 - 16:16
كد :101667
هوش مصنوعی آی بی ام سن کاربر را بر اساس نحوه صحبتش تخمین میزند
بهزودی نرمافزار هوش مصنوعی IBM با آنالیز کردن نحوه صحبت ، سنمان را تخمین میزند و تجربه کاربری ما را سفارشی میکند.
بهتازگی آی بی ام دو گام اساسی در عرصه هوش مصنوعی برداشته است که برای یک ناظر بیطرف پیشرفتهای بسیار چشمگیری به نظر میرسند؛ ولی جیسون پلکانوس از واحد تحقیقات آنالیز صوتی آی بی ام این گامها را مراحلی ضروری در جهت افزایش کارایی ماشینهای هوشمند میداند.
اولین گام اساسی، افزایش حساسیت و دقت نرمافزار تشخیص اتومات صدا است که با هدف شناسایی هویت و جنسیت کاربر بر اساس الگوی صدای او عمل میکند. در سال ۲۰۰۰ بهترین نرمافزار تشخیص صدا و احراز هویت صوتی کاربر، حدود ۱۰ درصد خطا داشت؛ ولی نرمافزار جدید آی بی ام این رقم را به ۰.۵۹ درصد کاهش داده است که رکورد حیرتانگیزی محسوب میشود.
پلکانوس اذعان دارد که این بهبود کارایی از دید کاربران صرف بسیار جزئی است و شاید در بیشتر مواقع قابلتشخیص نباشد؛ ولی بااینحال میگوید:
اگر یک سیستم کامپیوتری دارای استانداردها و کیفیت سختافزاری و نرمافزاری بالایی باشد، کاربر آن قادر خواهد بود خطاهای مکرر نرمافزار شناسایی صوتی را تشخیص بدهد. با داشتن یک نرمافزار عالی با استانداردهای برتر، سیستمهای کامپیوتری دارای کارایی بالاتر نسبت به نمونههای ضعیفتر، حدود ۵۰ درصد خطای کمتری در تشخیص صدای کاربر خواهند داشت. در چنین شرایطی است که اختلاف واقعی به چشم میآید.
دیگر دستاورد چشمگیر آی بی ام، توسعهی سامانهای است که با توجه به آهنگ و نحوهی صحبت کردن کاربر، سن او را تخمین میزند. به گفته آی بی ام؛ این سامانه در مقایسه با نمونههای مشابه بسیار دقیقتر است و بیشترین نرخ خطای آن به ۴.۷ سال محدود میشود.
شاید بپرسید که این قابلیت چه مزیتی برای کاربران دارد.
در مرحله اول باید بدانید نرمافزار تخمین سن هوشمند میتواند مکالمه با ماشین را بر اساس گروه سنی ، واژههای پرمصرف و روش گفتگوی خاص کاربر سفارشیسازی کند. به عقیدهی پلکانوس سامانه فوق حساس به صدای گوینده؛ علاوه بر بهینه کردن قابلیت فعالسازی با صدای کاربر ، تمهیدات امنیتی صوتی و ...، بهزودی قابلیت چندوظیفگی صوتی نیز ارائه خواهد کرد. او میگوید:
فناوریهای رایج مانند اپلیکیشنهای گفتگوی مجازی، دستیارهای صوتی گوشیهای هوشمند و تجهیزات تعامل صوتی خانههای هوشمند بر دیالوگهای از پیش تعیینشده مبتنی هستند. سامانهای که بتواند بهصورت همزمان با چند کاربر تعامل گفتاری هوشمند داشته باشد، در بدو ورود به فرصت هیجانانگیزی برای دستاندرکاران فناوری دیجیتال تبدیل خواهد شد.
نظرات كاربران :
لطفاً نظر خود را وارد نمائيد