فرصتهای جدید هوش مصنوعی به نفوذ در رفتار کاربران تکنولوژی منجر میشود. برنامه نویسان وب اکنون میتوانند از این فرصتها استفاده کنند و برنامههای تأثیرگذاری برای دستگاههای IoT طراحی نمایند. اما برخی تأثیرات غیرممکن به نظر میرسد زیرا ما بیشتر تحت تأثیر عوامل فیزیکی مانند رنگ، صدا، بو، گرما و حرکت قرار میگیریم که نمیتوانند در برنامههای اینترنت اشیا منعکس شوند.
بااینحال برخی از تکنولوژیهای هوش مصنوعی راهکارهای جدیدی را برای شبیهسازی هر چه بیشتر محیطهای فیزیکی در اپلیکیشنهای اینترنت اشیا ارائه دادهاند. با شفافسازی روند استفاده از تکنولوژیهای جدید، میتوانیم با استفاده از دستگاههای IoT و AI آنها را به اهداف اعلام شده خود هدایت کنیم.
اگر هدف ما بهبود شاخصهایی مانند شادی کاربر باشد، ابتدا باید آن را اندازهگیری کنیم. امروزه برای انجام این کار چندین ابزار وجود دارد که حتی بهتر از انسانها عمل میکنند:
- تشخیص مشخصه فردی
- تجزیه و تحلیل تن صدا
- تشخیص عاطفه
این ابزارها میتوانند برای ایجاد تعاملات جدید و برنامههای کاربردی که قبل از آن امکانپذیر نبودند و حتی با بینشهایی که ما قادر به مشاهده آن نبودیم، ترکیب شوند. الزام به دست آوردن این بینش در دستگاه، داشتن حداقل یک یا چند میکروفن، استفاده از تعامل صوتی و بالقوه شامل یک دوربین است.
تشخیص تن صدا
خدمات به رسمیت شناختن گفتار بهطورمعمول با متن بازگشتی (API ها) امکانپذیر میشود، بااینحال، آنها همچنین میتوانند اطلاعات زیادی را در مورد کاربر فراهم آورند. این اطلاعات میتوانند به صورت بههنگام در زمان تعامل کاربر یا بهطور بالقوه برای تجزیه و تحلیل دادهها در آینده ذخیره شوند. برنامه نویسان تنها با استفاده از تن صدا میتوانند اطلاعات زیر را در مورد شخص سخنران به دست آورند:
- جنسیت سخنران
- زبان
- سن
- لهجه
- شناسایی بیومتریک سخنران
در رأس این امور، میتوان تشخیص داد که یک یا چند نفر صحبت میکنند. یک توسعه دهنده هوشمند UX میتواند پس از اتمام سخنرانی متن را به گفتار تبدیل نماید یا دیگر ویژگیهای گفتاری را مطابق با نظر کاربر تنظیم کند. همچنین، با شناسایی کاربر، ممکن است محتوا بهطور خاص به آن کاربر با بارگذاری مشخصات فردی ارائه شود. شرکتهایی که API ها را شناسایی و طبقهبندی میکنند عبارتند از مایکروسافت، Alchemy و Kaggle
تشخیص احساسات
گام بعدی تجزیه و تحلیل و درک معنی ظریفتر از تشخیص آنچه که کسی میگوید، است. درحالیکه درک زبان طبیعی میتواند یک بیانیه را به متن پیوست کند، درک هدف کاربر و همچنین ارجاع به آن متمایز از تجزیه و تحلیل احساسات از انتخاب کلمات کاربر است. در حال حاضر خدمات متعددی توانایی تجزیه و تحلیل متن و ارائه بخشهای مختلف زبان را ارائه میدهند.
آی بی ام واتسون یکی از این خدمات است که چندین جنبه از استفاده فرد از زبان و شخصیت را مشخص میکند:
- احساساتی مانند موافقت، خستگی، غرور، محدوده عاطفی، و اجتماعی بودن
- نیازها
- ارزشها
یکی از محدودیتهای این خدمات، میزان منبع اطلاعاتی موردنیاز برای انجام تجزیه و تحلیل است. از نظر واتسون، آنها حداقل 100 کلمه نیاز دارند. این بهطورمعمول طولانیتر از آنچه کسی در فرمان دادن یک دستگاه با صدای یا یک ورودی معمولی استفاده میکند، میباشد.
چند راه برای ساختن دستگاه وجود دارد. اول، یک راه وجود دارد که میتواند برای کاربران آزار دهنده باشد: ضبط مداوم صدا و تبدیل گفتگو به نوشتار. محدودیت این روش این است که ممکن است بیش از یک نفر صحبت کند و همچنین به طور معمول رونویسی مستمر مستلزم خطا است.
یکی دیگر از روشها، جمعآوری اظهارات افراد در طول زمان و ارسال آن برای تحليل احساسات پس از رسیدن به حداقل زمان ممکن است. نقطهی قوت این روش در سادگی آن است ولی از طرف دیگر ضعف آن این است که تجزیه و تحلیل به هنگام را فراهم نمیکند و هم زمانی بین نمونهها و محتوا و زمینه میتواند متفاوت باشد. در نتیجه تجزیه و تحلیل ممکن است درهم شکسته و پراکنده شود.
ادامه دارد...