データ流通の鍵となる技術の研究

データ流通の鍵となる技術の研究

データ循環

データ流通とは、一定の流通ルールに従って、データの供給者と需要者の間で行われる、データを対象とした行為を指します。データ循環の技術的実装には、主にデータセキュリティ、品質保証、権利と利益の分配、トレーサビリティ監査、透明性の面で多くの要件があります。

データ循環ブロックチェーンは、データ循環プロセスの安全性と効率性を確保するとともに、データのキャッシュが不要、個人のプライバシーが保護される、データの著作権が保護される、データソースが追跡可能で改ざんされないことが保証される、詐欺が効果的に抑制されるなどの利点があります。分散型コンセンサス アーキテクチャにより、データの交換と流通におけるデータの所有権が不明確になるという問題点を効果的に解決します。安全なデータ流通プラットフォームとして、データの所有権を維持しながら、信頼できる流通とデータ利用権の共有をサポートすることを目指しています。

セーフハウスはデータの循環を可能にする

UCloud Safe Houseは、データの所有権とデータ使用権の分離を真に実現し、データ循環プロセスの安全、制御可能、漏洩の防止を保証し、データの独占を打破し、データ循環を便利かつ安全にし、データの民主化を実現し、所有者の安心とユーザーの満足を実現するデータ循環プラットフォームです。

Safe Houseはブロックチェーン技術を利用して分散型ソリューションを実装し、データプロバイダー、データソース需要者、アルゴリズムプロバイダーなどを正確に接続し、さまざまな種類のアルゴリズムを集約し、データ当事者とアルゴリズム当事者として機能します。信頼できる第三者(政府、第三者組織)を利用してすべてのブロックチェーン記録を保存し、信用保証の役割を果たします。

データ循環の鍵となる技術

準同型暗号

準同型暗号は、暗号コミュニティで広く研究されている重要なトピックです。ロン・リベスト他1978 年に銀行業務を応用背景としてこの概念を提案しました。準同型暗号化とは、暗号化されたデータを処理して出力を取得し、この出力を復号化すると、その結果が、暗号化せずに元のデータを同じ方法で処理して得られた出力と一致することを指します。

データ循環プロセス中の委託コンピューティングのシナリオでは、データ保有者自身のコンピューティング能力には限界があり、大規模なデータ統計分析と計算を第三者に委託する必要がありますが、データは第三者に開示できません。したがって、機密データは暗号化して保護する必要があります。準同型暗号化テクノロジを使用した委任コンピューティング シナリオには、データ保持者とデータ処理者という 2 種類の役割が関係します。技術ソリューションの図を以下に示します。

データ所有者は元のデータを所有し、保護する必要がある機密属性を選択します。ローカルで公開鍵と秘密鍵のペアを生成した後、生成されたユーザー公開鍵を使用して、元のデータ内の機密属性を準同型暗号化し、暗号文ファイルを取得します。その後、データ保有者は暗号文ファイルをデータプロセッサに送信します。データプロセッサは暗号文ファイルに対して準同型演算を実行し、平文データ情報を知らなくても暗号文の統計結果を生成します。この結果は、平文状態を直接暗号化することによって得られた処理結果と一致しています。データプロセッサは暗号文の統計結果を取得した後、それをデータ保有者に返します。データ保有者は、処理された暗号文の統計結果を受け取り、ユーザーの秘密鍵を使用して復号化し、平文の統計結果を取得します。

ゼロ知識証明

分散型台帳では、グループコンセンサス機能が満たされている必要があります。つまり、すべての当事者がコンセンサスメカニズムを通じてデータの正当性を確認し、個人または組織のプライバシーデータを含むすべてのデータがすべての当事者に対して透明で可視であるという前提があるため、コンセンサスデータを処理する必要があります。ゼロ知識証明は、データの正当性に関する暗黙の合意を強化し、検証者がデータの具体的な内容を知らなくても、その内容が有効または合法かどうかを確認できるようにします。アプリケーションには、トランザクションの有効性証明、サプライチェーンファイナンス、データの偽造防止およびトレーサビリティなどが含まれます。

データ循環プロセス中の分散型財務データ共有シナリオでは、各企業の財務データがチェーン上に保存されるため、組織間での標準的な財務記録が可能になり、財務報告が改善され、監査コストが削減されます。分散された財務データ記録に基づいて、特定の標準に従って従来のシステムと相互運用可能であり、財務報告から監査までのすべてのプロセスを改善できます。

技術ソリューションの図は次のとおりです。

分散型台帳では、企業は貸借対照表や税額などの財務データを暗号化してチェーン上に保存し、ゼロ知識証明πを生成する必要があります。 π は次のことを証明できます: 貸借対照表の総資産と負債および所有者資本は、対応する項目の合計に等しい。企業が支払う税額は、企業の総利益に所得税率を乗じた額に等しくなります。検証者はπが成り立つかどうかを計算して検証し、検証プロセス中に企業データが漏洩することはありません。ゼロ知識証明が確立された場合、それは会社の財務データが正確で信頼できることを意味し、検証プロセスでは、データ保有会社だけがこのゼロ知識証明を生成できることを保証する必要があります。

グループ署名

グループ署名テクノロジーは、グループの任意のメンバーがグループ全体を代表して匿名でメッセージに署名し、公開で検証できるメカニズムです。クラウド環境では、ユーザーはデータの保存に CSP に依存しており、データのローカル コピーを保持していないため、データがクラウドに正しく保存されていることを確認することが特に重要です。定期的なチェックによって生じるオンラインの負担を軽減し、コンピューティング リソースを節約するために、ユーザーの代わりにアウトソーシングされたデータの整合性をチェックする TPA が導入されています。 TPA がデータのプライバシーを保護し、ユーザー データが TPA に漏洩しないことを保証できることが期待されます。

図に示すシステム モデルには、ユーザー (クライアント)、クラウド ストレージ サーバー (CS、クラウド サーバー)、クラウド コンビネーション サーバー (CCS、クラウド コンバイナ サーバー)、サード パーティ監査人 (TPA、サード パーティ監査人) の 4 つの主体が含まれます。このソリューションは、正確性、安全で効果的なユーザー失効、ビッグデータのプライバシー保護、アイデンティティのプライバシー保護、マルチユーザーの更新、認証、大規模グループのサポートなどの機能を実現できます。

リング署名

通常、リング署名方式は、キー生成、署名、および署名検証で構成されます。リング署名方式は、無条件の匿名性、正確性、偽造不可能性という特性を満たす必要があります。

クラウド サービス プロバイダーはユーザーをグループで管理します。リング署名では、署名者はユーザー グループに参加しており、これらのユーザー グループ内のユーザーがリングを形成します。リング署名が検証されると、署名者が特定の範囲のグループに属していることが示されます。リング内のユーザーが署名する場合、自分の秘密鍵とリング内の他のエンティティの公開鍵を使用して署名しますが、他のエンティティの参加は必要なく、他のエンティティの許可も必要ありません。

これは、協力に基づく他の署名よりもはるかに柔軟です。たとえば、グループ署名には他のエンティティの協力が必要であり、グループにはマネージャーが存在します。管理者の権限が大きすぎると、ユーザーの身元が漏洩する可能性があります。

差分プライバシー

差分プライバシーの基本的な考え方は、元のデータにノイズを追加したり、元のデータを変換したり、統計結果を変更したりすることでプライバシー保護を実現することです。従来のプライバシー保護モデルと比較して、差分プライバシーには次の 2 つの利点があります。

  • 攻撃者の背景知識を考慮に入れません。
  • 定量化可能なプライバシー保証を提供できる厳密な統計モデルを備えています。

プライバシー保護技術が配置されているさまざまなデータ循環リンクに応じて、差分プライバシー技術は次の 2 つのカテゴリに分類できます。

  • 集中型差分プライバシー技術。
  • ローカライズされた差分プライバシー技術。

データ収集差分保護

モバイル デバイスの性能がますます高まるにつれて、データ収集者はさまざまなユーザーにデータ収集タスクを割り当てることができるようになります。ただし、このタイプのデータ収集は、一般的に個人の行動情報に関連しています。そのため、ユーザーがデータ収集に参加すると、個人の機密情報が漏洩するリスクが必然的に生じます。

図に示すように、各ユーザーはまずデータに対してプライバシー処理を実行し、処理されたデータをデータコレクターに送信します。データ コレクターは、収集されたデータに対して統計を実行し、効果的な分析結果を取得します。データの統計分析を行う際に、個人のプライバシー情報が漏洩しないことを保証します。

データ出力差分プライバシー保護技術ソリューション

データが一般に公開されている場合や、データ自体が非常に機密性が高い場合、データがユーザーに直接出力されると、深刻なプライバシー漏洩の問題につながる可能性があります。そのため、データを出力する際に​​は差分プライバシー技術を使用してデータを保護する必要があります。図に示すように、データ利用者にデータを提供する前に、サーバーは差分技術を使用してデータセットを摂動し、ラプラスノイズまたは指数ノイズを追加して、個人のプライバシー情報が漏洩しないようにしながらデータの可用性を確保する必要があります。

プライバシー保護データ共有

データ共有における重要な問題は、共有中にユーザーデータのプライバシー漏洩をどのように回避するかということです。プライバシーを保護するデータ共有技術が登場し、その目標は、データのプライバシーを保護しながら、マイニング価値のある情報をできるだけ多く保持することです。

プライバシー保護データ共有には、データプロバイダーとデータマイニングプラットフォームの 2 つの役割があります。複数のデータプロバイダーがプライバシー保護のためにデータを処理した後、データをデータマイニングプラットフォームに出力し、そこでデータの融合、分析、マイニングが完了します。

プライバシー保護データ共有は、主にプライバシー保護データ処理と安全な環境に基づくデータ共有の 2 つの方向に分けられます。

プライバシー保護データ処理

目標は、データのプライバシーを保護しながら、できるだけ多くのデータ マイニング情報を保持することです。

安全な環境に基づくデータ共有

データ マイニング プラットフォーム上に、すべての関係者から信頼される安全なコンピューティング環境が構築されます。安全な環境により、計算に関係する機密データは出力されず、外部プロセスによって盗まれることもなくなります。各データ プロバイダーはデータを暗号化してデータ マイニング プラットフォームに送信します。データ マイニング プラットフォームはデータを安全なコンピューティング環境で復号化し、最終的にデータ分析とモデリングを実行します。

要約する

法律や規制ではビッグデータのセキュリティに関して厳しい要件が定められています。ビッグデータビジネスを展開する前に、ビッグデータの不正使用、乱用、漏洩によるリスクを回避するために、収集、送信、保管、分析、公開を含むビッグデータのライフサイクル全体を通じてビッグデータのセキュリティリスク管理を実現するための完全なビッグデータセキュリティ管理および制御システムを確立する必要があります。

準同型性、ゼロ知識証明、グループ署名、リング署名、差分プライバシー保護、プライバシー保護データ共有などは、現在、データセキュリティとデータ循環の分野における研究のホットスポットです。さまざまなテクノロジーが開発され、より多くのシナリオに応用されるようになると、実際のアプリケーション シナリオにおいてデータ循環がより大きな役割を果たすようになります。

UCloud のセーフハウス プラットフォームは、セキュリティ管理、ブロックチェーン、マルチパーティ セキュア コンピューティングに基づいており、データ所有者以外のすべての関係者に対して元のデータを非表示にします。協調コンピューティングを通じてデータを共同分析した後、需要側が求める分析結果を出力し、セキュリティを前提としたデータの流通・共有を実現します。

この記事の内容の一部は、「データ循環のための主要技術に関する白書」から引用したものです。

<<:  もう一つの CDN 革命: サーバーレス + エッジ コンピューティング

>>:  FIT2CLOUDは2018年のガートナー・クールベンダーに選出されました

推薦する

アリババクラウドとインテルが共同で「TOP Games」クラウドエコシステム育成計画を開始し、高品質なゲームエコシステムを共同で構築

10月11日、アリババグループ主催の「2017年杭州雲棲カンファレンス」が杭州雲棲鎮で盛大に開催され...

検索ランディングページを通じてオンラインマーケティング戦略を調整する方法

最近、データ分析の知識を少し勉強しているのですが、まだまだ習得できていない知識がたくさんあり、自分は...

tmhhost: ロサンゼルス cn2 gia バックホール + アウトバウンド 200G 高防御 VPS、簡単な評価

数日前、tmhhostのcn2高防御VPSが発売されました(tmhhost:トリプルネットワークcn...

SEOルール1: 正しいURL構造を設定する

SEO コンサルティング サービスをしていたとき、5 つの基本的な SEO の問題によく遭遇しました...

ウェブサイトのセキュリティにおける thinkphp の普遍的な脆弱性の悪用と修復の提案の検出

月収10万元の起業の夢を実現するミニプログラム起業支援プラン中国では、多くのウェブマスターやプラット...

アマゾンは、流行で大きな打撃を受けた州を支援するために、世界中で100万点以上の医療用品を調達した。

アマゾンは、世界的な物流・運営ネットワークを通じて、医療用防護マスク、医療用防護服、医療用手袋など1...

Jiuxian.com 郝紅鋒:新しい電子商取引が増加し、古い電子商取引の80%が消滅する

【はじめに】郝宏鋒氏は、古い電子商取引企業にとって、今年生き残ることができれば、基本的に生き残ること...

リンクベイティングのケーススタディ: メッセージプラグインに関する考察

コアヒント: 昨日、canonical タグについて書いたとき、外部リンクの機会について言及しました...

独立したブログにコメントを投稿するときは、nofollowタグに注意してください

コアヒント: この記事では主に、コメント内の nofollow タグがブログのプロモーションに与える...

Taobao ストアのキーワード最適化の本質的な特性を理解していますか?

Baidu が Taobao の検索エンジンを公開するにつれて、ますます多くのオンライン ショップの...

子供の日のマーケティングの3つの角度、1つを把握することであなたの会社は良い子供の日を迎えることができます

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますあっという...

ストレージコストがクラウドコンピューティングのTCOに与える影響を理解する

ユーザーが支払うクラウド コンピューティング料金は、クラウド コンピューティング サービス プロバイ...

ネットワークマーケティングのスキルについて簡単に説明します

インターネット マーケティングの場合、インターネット マーケティング手法が価値があるかどうかを判断す...

Dell エッジ コンピューティング ソリューション |農家はついに食料を天候に頼る必要がなくなった

戴暁楽がITについて語るデータで植物を理解する農業はこんなにもシンプル下のビデオをクリックしてくださ...

イオンクラウド:2周年、20%割引、サンノゼCN2 GIAとシンガポールCN2 GIA回線のクラウドサーバー

クリプトデータセンターが直営するクラウドサーバー(VPS)ブランド「ion cloud」が、ちょうど...