اینترنت اشیا و هوش مصنوعی عمیقاً با یکدیگر مرتبط هستند. دستگاههای IoT دادههای بسیار حجیم تولید میکنند و پردازش این دادها نیازمند روشهای هوشمندی است که با هوش مصنوعی و یادگیری ماشین امکان پذیر میگردد. ازاینرو، با گسترش سریع دستگاهها و سنسورهای متصل و شبکهای، نقش فناوریهای هوشمند در این حوزه به شدت در حال رشد است. امروزه هوش مصنوعی کاربردهای متنوعی در حیطههای مختلف IoT دارد. در این مقاله، یک کاربرد خاص که پردازش زبان طبیعی (محاورهای) میباشد، بررسی میشود.
قابلیت و توانمندی ادراک گفتار:
یکی از مفاهیم اصلی پردازش زبان طبیعی، توانایی ادراک گفتار انسانی است. واضح است که لازمه کنترل دستگاههای هوشمند از طریق فرامین صوتی، قابلیت و توانمندی ادراک گفتار است که از طریق روشهای NLP امکان پذیر میگردد.
در IoT، ارزش تشخیص گفتار بیش از حد ارزشمند است. رابطهای صوتی که بدون نیاز به استفاده از دست امکان ارتباط و تعامل با کاربر را مهیا میسازند مزایای بسیاری را به همراه دارند. این رابطها قابلیت استفاده مؤثر از سیستم را ارتقا میدهند. به عنوان یک قاعده کلی میتوان گفت هر چه یک سیستم پیچیدهتر باشد طراحی یک رابط کاربری یا رابط وب برای کنترل آن نیز سختتر خواهد بود. رابطهای صوتی، با توجه به ماهیت بصری خود و تعامل صوتی و گفتاری، کاربری ساده و مؤثرتری داشته و یادگیری استفاده از آنها برای کاربران بسیار سادهتر است.
گاهی اوقات، یک رابط صوتی صرفنظر از ویژگیهای قابلیت استفاده از سیستم، میتواند در ارتقای ایمنی سیستم ایفای نقش نماید. تصور کنید یک تکنسین در ارتفاع 150 فوت روی دکل خطوط برق فشارقوی مشغول به کار است. اگر این فرد بتواند بدون نیاز به استفاده از دست و انگشتان خود و تنها از طریق دستورات صوتی، ابزارهای دیجیتال خود را کنترل نموده و یا با افراد دیگر در ارتباط باشد، احتمال وقوع حوادث خطرناک برای او به شدت کاهش مییابد.
در بازارهای مصرف نیز محبوبیت کنترل گفتاری در حال افزایش است. حدود 50 درصد خانوارهای ایالات متحده از صدا برای دسترسی به محتوای آنلاین استفاده میکنند. بنابراین، افزایش مصرف تجهیزات عمومی الکترونیک که توسط صدا فعال یا کنترل میشوند، یک گام طبیعی از تکامل این تکنولوژی است.
یکی از مزایای دیگر NLP قابلیت بومیسازی سیستمها میباشد. به عبارت دیگر میتوان به جای ارائه یک رابط کاربری عمومی با زبان بیگانه برای کشورهای دیگر، رابطهای بومیشده و منطبق با زبان محلی کاربران ارائه نمود. برای این منظور میتوان موتور پردازش NLP را بر اساس زبان محلی موردنیاز انتخاب نمود. این روش بسیار مؤثرتر از ترجمه میباشد و حس خوشایندتری را برای کاربران به همراه دارد. این قابلیت میتواند به عنوان یک مترجم نیز مورد استفاده قرار گیرد.
به عنوان مثال، شرکت ژاپنی ili، یک محصول قابل پوشیدن را ارائه کرده است که میتواند عبارات ساده را برای مسافران خارجی، بدون دسترسی به اینترنت ترجمه کند. محصول مشابه دیگری نیز با عنوان pilot یکی دیگر از دستگاههای متصل است که امکان ترجمه در حال حرکت را دارد. برخلاف ili، این سیستم قادر به گفتگوی دوطرفه نیز میباشد یعنی pilot نهتنها زبانهای مختلف را درک میکند، بلکه میتواند پاسخ مربوط به یک زبان خارجی را نیز سنتز کند.
دستیارهای صوتی:
یکی از دیگر کاربردهای NLP سیستمهای دستیاری است که قادر به پاسخگویی سؤالات هستند. این سیستمها ما را قادر میسازند تا سؤالات خود را به صورت طبیعی و گفتاری مطرح کنیم و سیستم پاسخ ما را یافته و ارائه مینماید. در حال حاضر، سیستمهای متنوعی با این قابلیت موجودند که دراینبین میتوان به دستیار Alexa از کمپانی آمازون، Google Home از شرکت گوگل و یا HomePod از شرکت اپل اشاره نمود. این دستیارها با ارتباط گفتاری فعال و کنترل شده و قادر به پاسخ به سؤالات مختلف هستند و در نتیجه به مردم کمک میکنند تا سریعاً به اطلاعات مورد نیاز دسترسی پیدا کنند. این قابلیت را میتوان به یک منشی هوشمند و همواره در دسترس نیز تشبیه نمود.
این قابلیت برای کاربردهای خاص مثل کاربردهای پزشکی و یا نظارت بر سلامت از اهمیتی بیشتر برخوردار میگردد. به عنوان مثال بیمارستان متعلق به دانشگاه Thomas Jefferson با همکاری شرکت IBM Watson محصول مشترکی ارائه نمودهاند که مشابه یک پرستار مجازی هوشمند برای بیمار عمل میکند. این محصول اولاً قادر به پاسخگویی سؤالات بیمار است و ثانیاً شرایط محیطی اتاق بیمار را نیز مثل میزان روشنایی و غیره را بنا به خواست و فرمان صوتی بیمار کنترل میکند.
یک قابلیت دیگر این حوزه، امکان استخراج اطلاعات خاص برای کاربر میباشد. مثلاً اطلاعات خاصی از یک مقاله یا از یک کتاب را استخراج نماییم. استفاده از این سیستمها در اتومبیل نیز در حال گسترش است و میتوانند بهعنوان دستیار به راننده کمک کنند. مثلاً راننده میتواند تقاضای یافتن مسیر نماید و یا در مورد وضعیت ترافیکی راهها از این دستیار سؤالاتی بپرسد.
ادراک احساس:
بهطورکلی ادراک گفتار از ادراک محتوای متنی بسیار پیچیدهتر است. دلیل این امر آن است که متن فاقد احساس است در حالیکه گفتار حاوی اطلاعاتی بیشتر که همانا احساس است نیز میباشد. به عبارت دیگر با بیان یک جمله متنی یکسان ولی با لحنهای متفاوت میتوان معانی یا مفاهیم متفاوتی را ارائه داد.
به همین دلیل شاخه جدیدی در هوش مصنوعی با عنوان آنالیز احساس ایجاد گردیده است و تجهیزاتی که امکان ادراک احساس از گفتار را داشته باشند بسیار مؤثرتر عمل مینمایند.
بهعنوانمثال محصول API از شرکت IBM Watson قادر به تشخیص احساساتی مثل حس توافق، حس احساس مسئولیت و غیره میباشد. شرکت Disney نیز محصولی که از طریق پردازش تصویر احساساتی مثل ترس، تعجب و غیره را تشخیص میدهد برای آنالیز نحوه تأثیر گزاری فیلم روی بیننده را به کار گرفته است.
سخن آخر:
درنهایت همانطور که میبینید، IoT نهتنها اشیا را باهم مرتبط میکند، بلکه فنآوریهای مختلف را نیز باهم متصل میسازد. جهانی شامل دستگاههایی در کنار انسانها که باهم کار میکنند را تصور کنید که پرسشهای یکدیگر را میفهمند، نیازهای همدیگر را میسنجند و پاسخهای مربوطه را ارائه میکنند. چشماندازی بسیار روشن و مطلوب در پیش رو میباشد.