IoT データ収集:現在の方法と研究のクイックガイド
IoT デバイスによって生成されるデータは、データの作成自体、収集、データの価値向上という 3 つの段階に分かれていると考えることができます。
IoT デバイスによって生成されるデータは、データの作成自体、収集、データの価値向上という 3 つの段階に分かれていると考えることができます。
IoT デバイスによって生成されるデータは、3 つのフェーズに分かれていると考えることができます。初期段階はデータ作成そのものです。このフェーズは IoT デバイスのレベルで行われ、そこからデータがネットワーク経由で送信されます。IoT データ移行の第 2 段階は、収集と整理です。第 3 段階は、そのデータを実際に使用することです。。 これは、そのデータをさまざまな状況で価値のあるものにするプロセスです。
以下では、これらの段階にわたるIoTデータ収集とデータ保存のプロセスを追跡します。
IoT の世界では、 各イベントはデータを作成します。データを送信するには、MQTT、WAMP、HTTP、CoAP、Sigfox などの標準プロトコルが必要です。それぞれに長所とそれに付随するユースケースがあります。これらのプロトコルは、IoT デバイスから更新やその他の情報を取得して、特定の集中管理された場所に送信して実際の処理を行うことをサポートします。
この段階では、将来の使用に備えてデータをどのように集計して保存するかを決定する必要があります。今後どのように進めるかは、IoT データをどのように消費するかによって決まります。ここでアプローチを選択し、データをリアルタイムで送信するか、バッチで送信するかを決定します。また、IoT 分析の精度を最大限に高めるには、データポイントをどのような順序で作成するかを決定します。
リアルタイムデータを使用すると、最大限の精度が保証されます。このアプローチにより、各 IoT デバイスによって生成されたすべてのデータへのアクセスが保証されます。ただし、これは通常、大量の受信データを意味します。複数の IoT デバイスから送られてくるデータをソートするための適切なタイムスタンプを設定することは困難になります。受信する IoT データの速度と量に対応できるシステムを検討する必要があります。
利用可能なすべての IoT データをリアルタイムで収集し、すべてを分析するアプローチを選択する 明確な理論的根拠に裏付けられるべきです。そうしないと、膨大な量のビッグデータがクラウドシステム、つまり IoT データの流入を維持するために必要なネットワークリソースと計算リソースに不必要に大きな影響を与える可能性があります。
具体的なIoTアプリケーションも検討する必要があります。これらには、遅延、エネルギー消費、精度の点で独自の要件があります。アプリケーションによっては遅延が許容される場合があります。セキュリティアプリケーションなどは、どちらかというと時間が重要で、遅延の余地がないと見なされています。
多くのユースケースでは、高い精度を必要とせず、データをバッチで送信できます。データがバッチで送信される場合や マイクロバッチただし、すべてのデータの記録は残ります。これはリアルタイムではなく、あらかじめ設定された一定の間隔でのみ行われます。どのユースケースを選択するかは、要件によって異なります。シナリオによっては、分析に正確なリアルタイムデータが必要になることがあります。他のシナリオでは、履歴データも同様に機能します。
受信センサーデータを直接分析することを計画している場合、この段階では、未加工データをストリーミングする多数のデバイスからのIoTデバイスデータをリアルタイムで取り込むことができるIoTプラットフォームが必要です。そのようなプラットフォームの 1 つは、一時的な接続の問題に対応できなければなりません。これには、接続の切断、停止、サーバーの障害などが含まれます。
このプラットフォームは、データの損失を防ぐのに役立ちます。そのため、そのデータに基づいて生成される結果の正確性が損なわれるリスクはありません。プラットフォームでは、データモデリングと IoT データ分析のために、データは既製の形式で保存されます。そこから、収集したデータを機械学習モデルの構築、IoT アプリケーションの開発、データ視覚化の補足に使用します。
繰り返しになりますが、大まかに言えば、IoT データの収集と保存で選択されるアプローチは、特定のユースケースの対象となる要件に大きく依存します。これらには、データの正確性、エネルギー消費、応答時間、プライバシー保護など、さまざまなニーズに基づくデータ収集手順が含まれますが、これらに限定されません。収集される IoT データの量を減らすための実証済みのアプローチは、IoT センサーのレベルで、できるだけデータソースに近い、データの集約、フィルタリング、解釈、および圧縮です。
以下では、対象となるアプリケーションに基づいて、主要なデータ収集アプローチのいくつかを要約します。 この調査で明らかになったように。
この IoT データ収集戦略では、測定要求の頻度とデータの正確性の間のトレードオフが考慮されます。ここでは、目標データの精度に合わせて頻度を調整しています。特定のユースケースでは、ある程度のデータ精度しか必要としない場合があります。精度が高くても、その努力に何の価値ももたらされません。
この戦略の一環として、データ測定の頻度を減らす必要があります。これにより、そのユースケースに最適と計算された精度目標を維持しながら、IoT データの収集に必要なリソースを減らすことができます。
このIoTデータ収集アプローチでは、最大遅延値が事前に設定されています。最後の測定のタイムスタンプからの経過時間は、その最大遅延値を下回っている必要があります。時間関連の要件に基づく IoT データ収集シナリオでは、受信する新しい測定値から最後の測定のタイムスタンプを引いた値が、最大遅延時間を下回る必要があります。これにより、経過時間はデータ測定の「鮮度」に相当します。
このアプローチを選択する場合、エネルギー消費量が重要な要素になります。そのためには、消費電力を最適化しながら、目標とする精度を達成する必要があります。IoT データ収集のためのエネルギー主導型戦略 最大限の効率を目指す。ここでの利点は、目標とするデータ精度で達成されたユーティリティとの差から、そのデータ精度を達成するために必要な測定に必要な測定に必要な消費電力を差し引いたものとして測定されます。
精度重視のシナリオと同様に、ここでは、アプリケーションによっては、精度を高くしても追加のメリットはないことを理解して、特定の目標精度を目指すことを前提としています。
エンドユーザーのプライバシーが重要な場合は、このアプローチを採用できます。この調査では、センサーにデータを要求する回数を最小限に抑え、プライバシー技術を使用して結果にノイズを追加する取り組みが予定されています。
目標は、個々の測定値の精度を変更することでエンドユーザーのプライバシーを保護すると同時に、結果全体について一定レベルの「適切な精度」を維持することです。
結果に「ノイズ」を加える 「差分プライバシー」を使用することで実現されます。この調査によると、これにより、個人に関する情報を明らかにすることなく、ユーザー集団に関するデータを抽出することができます。これは、統計結果を大きく変えることなく、データ抽出プロセスそのものに「ノイズ」が加わったおかげです。
このアプローチでは、データ処理段階ではなく、IoT データ収集段階でノイズを追加することを推奨します。関連する実験では、この種の介入が最終的な統計に及ぼす影響はそれほど大きくないことが示されています。
これは、現在のIoTデータ収集におけるさまざまなデータ収集アプローチと傾向のほんの一部にすぎません。その中には プラットフォーム、 スタジオ データ分析用では、IoT データソースに接続し、IoT データをコンパクトで軽量なデータウェアハウスに直接ストリーミングできます。このプラットフォームでは、データストリームを常に監視および制御できるだけでなく、希望するデータ収集方法を正確に調整できます。
しかし、IoT ソリューションは、接続されたデバイスからリアルタイムデータを取り込むだけでは終わりません。ここから先は、データ管理戦略を構築し、クラウドの広範なデータストレージ機能を活用して、そのデータを IoT アプリ開発を含むさまざまなクラウドコンピューティングシナリオで使用することになります。こうすることで、スマートデバイスから人工知能を使った高度な IoT ソリューションに至るまで、IoT システム全体を構築し維持するための出発点としてプラットフォームを活用できます。詳細なディスカッションについては、お問い合わせください。