برای بسیاری از توسعهدهندگان اینترنت اشیا (IoT)، تجزیهوتحلیل دادههای سری زمانی یک مرز جدید است. این افراد ممکن است نیاز به گسترش مجموعه مهارتهای خود برای ایجاد برنامههایی داشته باشند که میتوانند از دادههای سنسورهای جدید استفاده کنند. درک دادههای ایجاد شده و یافتن الگوهای معنیدار همچنان مانعی برای اجرای موفق طرحهای اینترنت اشیا است.
جریان سریع دادهها میتواند به شکل دادههایی با سری زمانی از انواع متنوع باشد. باید به ترتیب آنها رعایت شود و مداوم به روز شود.
انواع دادههای سری زمانی در تحقیقات زمینشناسی، پردازش تصویر، ساخت و سایر تنظیمات صنعتی مورد استفاده هستند. دادههای تجهیزات اینترنت اشیا (IoT) میتواندگزارشهای مفیدی ایجاد کنند و تجسمهای واقعی و حلقههای بازخورد خودکار با دادههای سنسورهای IoT ایجاد کنند. به همین علت، توسعهدهندگان ممکن است نیاز به یادگیری عناصر علوم دادهها و حتی یادگیری عمیق و هوش مصنوعی (AI) برای موفقیت در تجزیهوتحلیل دادههای سری زمانی داشته باشند. بااینحال برخی میگویند هوش مصنوعی (AI) همیشه موردنیاز نیست و در مواردی ممکن است حتی وجود آن زیادی باشد.
درک ویژگیهای سنسور IoT
به گفته دن لوچ مهندس بازاریابی نرمافزار محاسبات ریاضی MathWorks ، شرکتکنندگان در صنعت باید مهارتهای جدیدی را برای تحقق بخشیدن به دادهها بدست آورند.
او در ادامه گفت: "در سالهای اخیر افزودن سنسورها به سیستمهای عملیاتی و دسترسی به دادههای توزیعشده از راه دور بسیار سادهتر شده است. هزينه افزودن سنسورها كم است و زیرساختهای موردنیاز هماکنون در همهجا حضور دارند. چالش اصلی در دسترس بودن تخصص برای تحقق ارزش جریان دادهها است."
وی افزود:" توسعهدهندگان برای تجزیهوتحلیلهای مفید در برنامهها، باید ویژگیهای اساسی که سنسورهای مختلف نمایش میدهند را بدست آورند. نرخ نمونهگیری دادهها با عملکرد موردنیاز در سیستم گرهخورده است بنابراین درحالیکه ممکن است گرفتن نمونههای متعدد در هر ثانیه نظیر اندازهگیری ضربان قلب برای چیزهایی مثل اندازهگیری جزر و مد اقیانوس عملی منطقی نباشد.
نوع داده سنسور نیز بر تحلیل بسته به اینکه بهعنوانمثال دادهها مقدار دما هستند یا دادههای برداری تأثیر میگذارد و ممکن است نیاز به استفاده از یک آنالایزر شیمیایی دیگری باشد. همچنین دستیابی به روشهای مختلف برای تجزیهوتحلیل دادههای پیکسل RGB اغلب شامل کاربردهای بینایی ماشین میشود.
کارخانههای تولیدی، زنجیرههای تأمین و ارائه خدمات و سرویسها توانستهاند سریهای زمانی از "انواع دادهها" از انواع حسگرها را ایجاد کنند. بنابراین توسعهدهندگان باید انتظار داشته باشند که دادههای حسگرهای مختلف را در داشبوردهای سری زمانی با هم ادغام و مطابقت دهند.
محل اجرای تحلیل و ظرفیت ذخیره و قدرت پردازش موجود دو عامل هستند كه توسعهدهندگان باید به آن توجه كنند. این به معنا که استقرار آنالیز در سیستمهای محاسباتی لبه (edge)، محلی (local) یا ابرداده (Cloud) است.
توسعهدهندگان اینترنت اشیا (IoT) امروزه با هوش مصنوعی (AI) و شبکههای عصبی عمیق آشنا هستند و معتقدند که باید از چنین رویکردهایی استفاده کنند اما نتایج آنها بسته به نوع دادهای که سنسورها انتخاب میکنند متفاوت خواهد بود.
طبق گفتههای کریس راجرز مدیر ارشد اجرایی شرکت SensiML ، در بستر محاسبات لبه (edge) و تجزیهوتحلیل دادههای اینترنت اشیا (IoT)، ابزارهای سادهتر یادگیری ماشین میتواند در بعضی موارد کار را بسیار ساده کند.
به عنوان نمونه کسی که وظایف بازرسی بصری خط کارخانه را انجام میدهد میتواند از روشهای تشخیص الگوی یادگیری ماشین سادهتر استفاده کند که الزامات آموزش مدل را آسانتر کند. برای جریان دادههای سری زمانی از شتاب سنج، میکروفون، فشارسنج، سنسور فشار یا سلولهای بار و الگوریتمهای یادگیری کلاسیک ماشین که میتوانند یک وضعیت بهتری را نشان دهند و نیاز به آموزش و تست دادههای بسیار کمتری دارند، استفاده میشود.
ادغام روشهای سری زمانی
به گفته روزاریا سیلیپو دانشمند اصلی داده در KNIME ، اکنون تجزیهوتحلیل دادههای سری زمانی شاهد روشهای ادغام مفیدی است.
وی میگوید: "یکی از این شاخهها از طریق آمار با [میانگین سرعت حرکت اتورژنتیک، یا ARIMA] و نیازهای آماری و دیگری از طریق یادگیری ماشینی با نیازهای کمتر و الگوریتمهای قدرتمندتر حاصل میشود." وی توصیه کرد که این دو شاخه هنوز در حال ادغام هستند و این باعث ایجاد "احساس بینظمی" برای توسعهدهندگانی میشود که در حال تحلیل دادههای سری زمانی هستند. قدرت و سرعت محاسبه در زمان واقعی (realtime) بیشازپیش موردتوجه قرار گرفتهاند. اگر كاهش قابلملاحظهای در سرعت ایجاد شود، كاهش اندكی در عملکرد پیشبینی میشود. جریان دادههای IoT سریع ، ناهمگن و معمولاً بسیار وابسته به بعد است. با ایجاد تصویری از چنین دادههایی و با اجرای سریع ابعاد کاهش پیدا میکند تا انواع دادههای مختلف را در همان فضا نشان دهد.
بهطورکلی تغییرات سیستمهای حسگر و سیگنالینگ با گذشت زمان کاملاً قابل توجه است، راجرز SensiML که از دهه 1990 کار خود را به عنوان مهندس تست اتومبیل شروع کرد ، بیان میکند کهدر آن زمان، هزینه سنسور و پیچیدگی سفارشات بسیار زیاد بود. حجم دادهها با هزینههای سنسور محدود میشد. بهعنوانمثال، یک برنامه NVH به زنجیرهای گرانقیمت متشکل از شتاب سنجهای پیزوالکتریک، تقویتکنندههای شارژ، ماژولهای تهویه سیگنال و تختههای کسب داده نیاز داشت که به راحتی برای هر کانال 5000 دلار هزینه در بر میداشت. وی ادامه داد: "امروزه ما میتوانیم به آرایه وسیعی از دستگاههای کمهزینه که قادر به مقایسه کیفیت سیگنال در IC های حسگر چند محوره با هزینهای کمتر از 1 دلار در هر کانال هستند، دسترسی داشته باشیم.