AWS上海AI研究所が開発したDGLグラフニューラルネットワークフレームワークがAmazon SageMakerでリリースされました

AWS上海AI研究所が開発したDGLグラフニューラルネットワークフレームワークがAmazon SageMakerでリリースされました

 

ディープラーニングは近年、自由形式のテキスト、画像、ビデオなどの複雑なデータから複雑なパターンを抽出できる驚異的な能力により、世界中で大きな注目を集めています。ただし、多くのデータセットはこれらのカテゴリに当てはまらず、グラフやネットワークで表現する方が適切です。当然のことながら、畳み込みニューラル ネットワークや再帰型ニューラル ネットワークなどの従来のニューラル ネットワーク アーキテクチャはこのようなデータセットには適しておらず、新しいアプローチが必要であることがわかります。

グラフニューラルネットワーク入門

グラフ ニューラル ネットワーク (GNN) は、今日の機械学習における最もエキサイティングな進歩の 1 つであり、次の参考論文は始めるのに役立ちます。

GNN は、次のデータセットの予測モデルをトレーニングするために使用されます。

ソーシャルネットワークは、グラフを使用して関連する人々のつながりを示し、

顧客とアイテムの相互作用を示すグラフを備えたレコメンデーションシステム、

化学分析では、化合物は原子と結合の図として表されます。

ネットワークセキュリティ、送信元と宛先のIPアドレス間の接続を説明する図、

その他にも多数あります!

ほとんどの場合、これらのデータセットは非常に大きく、ラベルが付けられているのはそのうちのごく一部だけです。たとえば、不正行為検出のシナリオでは、特定のユーザーと既知の不正行為者との関係を分析して、彼らが不正行為に関与している可能性を予測します。この問題は、グラフ ノードのごく一部にのみラベル (「詐欺師」または「正当」) が付けられる半教師あり学習タスクとして定式化できます。このようなソリューションは、従来の機械学習アルゴリズムで使用するために、手動でラベル付けされた大規模なデータセットを構築し、それを「線形化」する作業よりも優れたパフォーマンスを発揮します。

これらの問題を解決するには、ドメイン知識 (小売、金融、化学など)、コンピューター サイエンスの知識 (Python、ディープラーニング、オープン ソース ツール)、インフラストラクチャの知識 (トレーニング、展開、モデルのスケーリング) が必要です。しかし、これらすべてのスキルを備えた人はほとんどいないため、DGL グラフニューラルフレームワークや Amazon SageMaker などのツールが必要になります。

DGL グラフ ニューラル フレームワークの紹介

DGL グラフ ニューラル フレームワークは、2018 年 12 月に Github でリリースされました。これは、研究者、データ サイエンティスト、科学者がデータセット上でグラフ ニューラル ネットワークを迅速に構築、トレーニング、評価するのに役立つオープン ソースの Python フレームワークです。


DGL は、PyTorch や Apache MXNet などの一般的なディープラーニング フレームワーク上に構築されています。これらのうち 1 つまたは 2 つ知っていれば、便利であることがわかります。私たちは TensorFlow ファンのことを忘れていません。DGL の次のマイナー バージョンでは TensorFlow の予備サポートが追加され、次のメジャー バージョンでは完全なサポートが期待されています。

どのフレームワークを使用する場合でも、初心者向けの例を使用すれば簡単に始めることができます。また、GTC 2019 ワークショップのスライドとコードも非常に役立ちました。

簡単な例を完了したら、DGL に実装されているさまざまな最先端モデルの探索を開始できます。たとえば、グラフ畳み込みネットワーク (GCN) と CORA データセットを使用してドキュメント分類モデルをトレーニングできます。

  1. $ python3 train.py --dataset cora --gpu 0 --self-loop

すべてのモデルのコードを検査および調整できます。 AWS チームはこれらの実装を慎重に検証し、パフォーマンスを確認し、結果が再現できることを確認しました。

DGL には、簡単にダウンロードして実験できるグラフ データセットのコレクションも含まれています。

もちろん、DGL をローカルにインストールして実行することもできますが、エクスペリエンスをよりシンプルでスムーズにするために、PyTorch および Apache MXNet ディープラーニング コンテナに追加しました。これにより、Amazon SageMaker で DGL を簡単に使用できるようになり、個々のサーバーを管理することなく、モデルの大規模なトレーニングとデプロイが容易になります。

WuXi AppTec は、世界的な医薬品および医療機器サービス企業です。新薬の開発は複雑で費用がかかり、長いプロセスであり、通常は26億ドルの費用がかかり、平均12年かかります。このプロセスをスピードアップするために、WuXi AppTec のコンピューター支援医薬品設計 (CADD) チームは、候補となる薬物分子の薬物特性を予測するニューラル ネットワーク モデルを調査してきました。従来の方法を使用すると、科学者はモデルの構築と検証、およびそれを適用するために必要なコンピューティング リソースの設定に数週間、場合によっては数か月を費やします。 DGL と Amazon SageMaker は、科学者に薬物特性予測モデルを迅速に展開するソリューションを提供し、モデリング時間を 5 分の 1 に短縮して、医薬品開発プロセスを加速します。

Bio-Techne は、世界中の研究者や臨床医にサービスを提供するグローバルなライフサイエンスおよび診断会社です。同社の製品ポートフォリオには、500,000 を超える高品質の試薬、機器、臨床管理、組織および液体生検診断テストが含まれています。幅広い顧客に対して、効率的かつ有意義な方法で製品を整理し、推奨することが重要になります。 Bio-Techne Data Labs は、現在の推奨アルゴリズムを改善するために、AWS と連携してグラフニューラルネットワーク (GNN) の使用を積極的にテストしています。 DGL はシンプルで使いやすい API を通じて実装を簡素化し、開発時間を数か月から数週間に短縮します。 BioTechne の評価結果によると、DGL を使用して実装された GNN ベースの推奨モデルによる上位 10 件の推奨は、非 GNN モデルの推奨よりも 70% 正確です。 Bio-Techne は今後もこれらのモデルを最適化し、DGL と Amazon SageMaker を使用して推奨アルゴリズムを正式に導入していきます。

DGL の開発は、2018 年末に設立された AWS 上海人工知能研究所によって推進され、米国パロアルトの MXNet 科学チームとの緊密な協力により完了しました。

<<:  最適なパフォーマンスを得るために Tomcat と JVM のパラメータを調整するにはどうすればよいでしょうか?

>>:  AWS が AWS Wavelength を開始

推薦する

2014 年の動画サイト著作権戦争を包括的に見る

年末が近づくにつれ、動画サイト界隈では著作権の争奪戦や広告出稿、そして舌戦が繰り広げられている。ここ...

Hostus - ホスト評価限定割引コードで10%オフ

hostus.us は、Hostus Cat の限定 10% 割引コードを開設しました。もちろん、1...

Xiaomiフォーラムのユーザーデータが漏洩

国内のセキュリティフィードバックプラットフォームであるWuyun.comが昨夜発表した情報によると、...

簡単にウェブサイトを構築できます!スマートなウェブサイト構築ソフトウェアはホテルのウェブサイトのソースコードを巧みに利用します

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています情報化社会...

#干货推荐# raksmart: 50% オフ、専用サーバー + 1Gbps 無制限トラフィック VPS

raksmart が最後に有益な情報を公開したのは 3 月でした。それからほぼ半年後、raksmar...

百度の監視期間とGoogleのサンドボックスに陥る可能性を減らす方法

多くのウェブマスターがこのような経験をしたことがあるでしょう。新しいウェブサイトはオンラインになった...

pacificrack: ダブル 12 VPS フラッシュ セール、年間 $8.8、768M メモリ/1 コア/10g SSD/1T トラフィック/1Gbps 帯域幅、ロサンゼルス

Pacificrack は中国の顧客向けに「Double 12」フラッシュセールを開催し、ロサンゼル...

ブラックハットの名前変更:値を超えることはできない、それだけ

ブラックハットテクニックは誰もが知っています。通常のウェブサイト最適化方法と比較すると、ブラックハッ...

BoyaとIntelが協力し、Analytics Zoo Cluster Servingをサポートする自動分散型スケーラブル推論プラットフォームを構築

概要データの豊富な固有情報のマイニング、フィッティング機能、データのスケーラビリティなどの利点により...

Jiathisシリーズの製品を使用してウェブサイトへのトラフィックを増やす

誰もが、大手ソーシャル シェア ボタン プロバイダーの 1 つである Jiathis についてよく知...

タオバオオンラインストアの一般的なプロモーション方法の長所と短所を解読する

タオバオでオンラインストアを開設する販売者にとって、トラフィックはすべてを意味します。トラフィックが...

新しいサイトがインデックスされていない場合はrobots.txtファイルを無視しないでください

今日、偶然、ウェブマスターの友人の講演を目にしました。彼は、自分の新しいウェブサイトがなぜ含まれてい...

クラウド分析とリモート監視が自動化の次の大きなトレンドとなる理由

企業は俊敏性を高め、ビジネス継続性のためにクラウドとリモート監視に重点を置く必要があります。テクノロ...

ドギュンはどうですか?レビュー: オーストラリアのハイエンド Unicom AS9929 ネットワーク VPS クラウド サーバー

Dogyunは5月に新製品、オーストラリアのクラウドサーバーを発売した。これは中国聯通の高性能AS9...

Cisco Maciej Kranz: モノのインターネット時代の成功のルール

[51CTO.com からのオリジナル記事] 25 年前、インターネットが人々の生活に入り込みました...