イベントから学ぶ最新技術情報

イベントから学ぶ最新技術情報

グーグルのAI技術、2018年9月最新情報 ― Google Cloud Next ’18 in Tokyo 基調講演レポート

2018年9月19日

2018年現在、グーグルはAI分野でどんな技術やサービスを提供しているのか? Google Cloud Next ’18 in Tokyoの基調講演から、AIに関する部分を書き起こした。

一色政彦 デジタルアドバンテージ 一色 政彦

 グーグル主催のイベント「Google Cloud Next ’18 in Tokyo」(全2日間の1日目)が9月19日に開催された。

 その基調講演の一部では、特に注力していく最先端テクノロジの分野の一つとしてAI(人工知能)が取り上げられた。本稿ではその内容を紹介する。以下は発表内容を独自に書き起こしたものである。

基調講演のAI関連部分の書き起こし

Rajen Sheth(ラジェン・シェス)氏、Director of Product Management, Google Cloud AI

 グーグルのミッションは情報を整理することですが、Google Cloudのミッションは情報を強化することです。そしてGoogle Cloud AIのゴールは、AIをシンプルSimple)で高速Fast)で利用しやすいUseful)ものにすることです。これを皆さまのビジネスの問題を解決する一助にしたいと考えています。

Google Cloud AIのゴール: Simple、Fast、Useful

ビッグデータ解析のためのクラウド

ビッグデータ解析のためのクラウド

 ビッグデータを解析するためにはまず、データの複雑性を無くす必要があります。それにはいくつかの要件があります。

 第一に、クラウドネイティブなデータウェアハウスを作ることです。これはつまり、数秒でデータをクエリできるようにし、何百万というストリーミングデータをリアルタイムで取り込めるようにすることです。次に、例えばApache Hadoop、Apache Sparkとったミドルウェア上でデータを処理して、そこから価値を得なければなりません。最後に、データを可視化して、Google Cloudとサードパーティのツールの上で、きちんとデータとしてのインサイトを生ませなければなりません。これはつまり、「データ分析や機械学習といったものを使いやすいものにする」ということです。

 その中心にあるのがBigQueryです。これは、グーグルが完全に管理しているエンタープライズ・データ・ウェアハウスです。BigQueryは非常にユニークで、信じられないほど速く、膨大な量のデータセットを処理できます。

 お客さまの中には、BigQueryの中にペタバイト(PB)級のデータ(1PB=HDのTV動画を13年分を格納できる量)を入れて、5PB以上のクエリを行っている方もいます。

5PB以上のクエリ

 100のお客さまが1兆行以上のクエリを1回で行っています。また、28兆行のクエリを行った方もいらっしゃいます。

28兆行のクエリ

 本当に膨大な量のデータですが、ではどうやったら、このデータからインテリジェンスが生み出せるのか? というと、それが機械学習となるわけです。

BigQuery ML

 だからこそ、グーグルはBigQuery MLを導入しました。これにより、データ分析者やデータサイエンティストが非常にシンプルなSQLライクな構文を使うことによって、機械学習モデルを作れます(以下の図がその利用の流れです)。

膨大なデータ
エクスポートされたデータ
BigQuery ML
Step 1: モデル作成
モデルを作成するためのクエリ実行
Step 2: 予測
予測するためのクエリ実行

 機械学習をSQLライクなBigQuery MLにした理由は以下の3つです。

  1. シンプル: SQLは多くの人が理解し、使い慣れた言語であること
  2. データベース内蔵: データベースの中からアクセスできること
  3. 高速: 機械学習のモデルを30秒以内に作り上げて、それをビジネスの中ですぐに使えること

 すでに以下のような顧客が使っています。

BigQuery MLのカスタマー事例

 このようにデータ分析においてBigQuery MLは、あらゆる分野(金融、リテール、ゲーミング、メディア&エンターテイメントなど)で驚くような勢いがあります。例えばTwitterは、最も大きなHadoopクラスターを持っており、300PBのストレージを使っています。クラウドネイティブな会社から多くのエンタープライズ企業まで、わたしたちのツールが大きな差を生み出しています。

ディープラーニングへの取り組み

 ところで、皆さんのデータはどうでしょうか?

 実は、データの80%は非構造化データということが分かっています。例えば普通のドキュメント、写真、eメール、商品の評価や動画などは非構造化データです。

80%は非構造化データ

 ここ5年間の深層学習(ディープラーニング)の発展によって、こういったものからインサイトを引き出せるようになりました。しかしディープラーニングは難しいです。ディープラーニングのモデルを本当の意味で作れる人材は、恐らく世界の中でも数万人程度だと思います。また、データサイエンティストは200万人ぐらいしかいません。デベロッパーに関しても2100万人ぐらいしか世界にはいません。

 では、この状況を変えるにはどうすればいいでしょうか? グーグルは3つの分野で努力をしています。

(1)Google Cloud AI: GCPプラットフォーム
GCPプラットフォーム

 グーグルは、ここまでに説明したものも含めて、クラウドのプラットフォームを提供しています。皆さんがモデルを作って、走らせ、スケールさせられるプラットフォームです。

(2)Google Cloud AI: AIツール
AIツール

 またグーグルは、ビルディングブロックとしてAIツール(=クラウドのAPIサービス)を提供しています。これは、グーグルがこれまでに学習させたAIモデルです。

(3)Google Cloud AI: AIソリューション

 さらにグーグルは、AIのソリューションも提供しています。皆さんがビジネスで抱えている問題を解決するためのものです。

AIソリューション

 それぞれについて詳しく説明していきます。

(1)Google Cloud AI: GCPプラットフォーム

 AIを使ううえでのコンピューティングに関する障壁を下げようとしています。

TPU

 具体的には、クラウド上で提供するTPU(Tensor processing unit、GPUのようなグーグル独自のAI用演算処理装置)を使うことによって、機械学習の作業負荷を軽減できます。

Cloud TPU

 例えばebayは、TPUを使うことによって、画像検索のトレーニング時間を100分の1にできました。つまり何カ月かかる作業が数日に短縮できたわけです。その結果、15%ほど精度を上げることにもつながりました。

 最近(2018年5月)、第3世代のTPUを発表しました。これを使うことによって、さらにスピードや性能が上がっています。

第3世代のTPU
Cloud Machine Learning Engine

 データサイエンティストにとって、フレキシビリティが重要です。パフォーマンスも重要ですがロックインされても困ると考えています。そこでグーグルは、Cloud Machine Learning EngineCloud ML Engine)を発表しました。

Cloud Machine Learning Engine

 Cloud ML Engineを使えば、皆さん方のAIモデルをGoogle Cloud上で使えるだけでなく、スケールも簡単です。また、TensorFlowやKeras、scikit-learnといった各種AIライブラリが使えます。

Kubeflow

 さらにML(機械学習)に関しては、「オンプレミスとクラウドの両方にあるデータをシームレスに使えない」という問題が指摘されていました。これを解決するのがKubeflow(キューブフロー)です。

kubeflow

 Kubeflowは、Kubernetes(=コンテナ化したアプリケーションのスケーリングやデプロイなどの運用自動化を行うためのオープンソースのプラットフォーム)の上に構築されたソフトウェアです。Kubeflowを使うと、Kubernetes上で機械学習スタックをシンプルかつ、ポータルブルで、スケーラブルに使えます。つまり、機械学習をオンプレミスとクラウドの間でシームレスに動かせるというわけです。

(2)Google Cloud AI: AIツール

 AIツールに関しては、次のようなビルディングブロックを提供しています。

ビルディングブロック(AIのAPIサービス)
AIツール

 具体的には、Vision(コンピュータービジョン)Natural Language(自然言語)、Text-to-Speech(スピーチ)、Translation(翻訳)、Video Intelligence(ビデオインテリジェンス)などを提供しています。これらのAPIサービスは、グーグルの既存製品からの良いとこ取りです。

 これらのAPIを使えば、たった数行をコーディングするだけでAIが使えます。

AIサービスにようる問題解決のサポート

 事例として例えばSansanでは次のようにCoud Vision APIが活用されています。

Coud Vision API(Sansanの活用事例)

 また、丸紅情報システムのmsys Omnis(エムシス・オムニス)では次のようにCoud Translation APIやCloud Text-to-Speech APIが活用されています。

Coud Translation/Text-to-Speech API(丸紅情報システムの活用事例)
Cloud AutoML(カスタムのAIサービス)

 しかしながら、現場のAI活用では、マス・カスタマイゼーション(=最適な特注品を作ること)の課題があります。例えば2社がまったく同じように見える問題を抱えていたとしても、問題の性質は各社違っており、結局は会社ごとに別々のAIモデルが必要になってくるということです。では、どうやって各社にあったカスタムのAIモデルを作ればよいでしょうか?

 これを解決する方法としてCloud AutoML(クラウド・オート・エム・エル)を提供しています。

Cloud AutoML

 Cloud AutoMLは最強の機械学習サービスだと思います。皆さんの課題に特化した機械学習モデルを作成でき、しかもコードもほとんど書く必要がないからです。これによって、誰もがAIをうまく使いこなせます。

 最初のCloud AutoMLのリリースはAutoML Visionでした。これは、Cloud AutoMLのVisionサービスを、まったく新しい画像認識サービスにカスタマイズできます。AutoML Visionを使うことで、例えば皆さんが製造業の工場製品に欠陥があるかどうかを画像認識するための独自のAIサービスを作成できます。カスタマイズに必要な画像も数十枚ぐらいで、時間も数分程度です。

AutoML(Vision/Natural Language/Translation)

 2つ目がAutoML Natural Languageです。テキスト分析が行える自然言語サービスをカスタマイズできます。例えば皆さんの業務に特化した独自の情報分析・情報理解がテキストから行えるようになります。

 3つ目がAutoML Translationです。これは、グーグルの機械翻訳の技術をカスマイズできます。これも、専門用語や言葉のニュアンスや比喩を解釈するなど、対象に特化した翻訳が行えるようになるわけです。現時点で27の言語ペアがありますが、今後さらに増えていきます。

Kaz Sato(カズ・サトウ)氏、Developer Adovocate, Cloud Platform

 AutoML Visionのデモを行います(以下の画像のとおり)。

データ
訓練(20分)
評価
予測

 加えて、AutoML Translationのデモも行います(以下の画像のとおり)。

ドメイン特有にカスタマイズする必要性
以下の事例について
データ
訓練(23時間)
予測(1):右上がカスタマイズ版の翻訳、右下がオリジナル版の翻訳
予測(2):右上がカスタマイズ版の翻訳、右下がオリジナル版の翻訳

 AutoML Translationの事例として、日経新聞社でも以下の事例があります。

AutoML Translationの事例(日経新聞社)

 このように精度の高いカスタムのAIモデルを簡単にすぐに作れます。さまざまなビルディングブロックをうまく組み合わせることによって、多種多様な問題解決が可能です。

(3)Google Cloud AI: AIソリューション

 ここまでに説明してきたGoogle Cloud AIは、1万4000以上の優良顧客がすでに使用中です。

Google Cloud AIを利用中のカスタマー例

 最後に、AIによるソリューションついて紹介していきます。

AIソリューション応用

 グーグルのAIを、パートナー企業の製品や既存のワークフローに組み込んでいただくことに取り組んでいます。その最たる事例がContact Center AIです。

Contact Center AI

 グーグルの会話・自然言語のAIを組み込んだ、お客さまの質問に自動対応できるソリューションです。2018年初に発表しました。簡単な質問回答だけでなく、Contact Centerのエージェントに情報を与えることで複雑な質問に対してもインテリジェントな回答をすることも可能になります。

 もう一つ、よくある課題が「文章理解」です。どういう形で大量の文章から正しいナレッジを獲得していけばよいのでしょうか? そこで、Iron Mountainと協業しました。

「文章の理解」の事例(Iron Mountain)

 Iron Mountainは、1.7兆ページの文章を管理しています。AIの力で、これらの大量の文章に対してOCRによる文字認識から文書理解までをシームレスに行っています。フォーチュン1000社の95%をサポートしており、このテクノロジにすでにアクセスできるようになっています。2018年以降、グーグルではこのテクノロジをより多くの他の企業にも利用できるようにしたいと考えています。

 「小売り、メディア、金融、製造業など、各社のニーズがどこにあるのか」「どのような形で解決できるのか」という観点で主要業界に特化したAIに発展させながら、できるだけ多くの企業にお使いいただけるようにしていきます。

主要業界に特化したAI

次世代「AI時代」に向けて

 ここまにご紹介したすべての内容で、グーグルがいかにデータとAIを簡単に速く使いやすくしているのかがお分かりいただけたと思います。

簡単に、速く、使いやすく

 皆さま、これはまだ初期段階です。次の画像を見てください。皆さん、覚えていらっしゃいますか?

Mosaic

 これは1994年のMosaicのブラウザーです。多くの人が、これでインターネットを初めて見て体験しました。そこで多くの人にひらめきをもたらしました。わたしはスポーツが大好きなので生中継のサイトから見られるようになったのは本当に素晴らしいと思いました。

 いまAIは、これと同じような黎明期にあるということです。2018年現在、インターネット時代の2014年と同じく、わたしたちはAIの重要なスタートポイントに立っています。次の30年間でAIは、大きなコンピューティング演算力の土台・礎になるのは間違いありません。ぜひ皆さんと一緒に開発し、その時代を現実のものにしていきたいと思っています。

  • このエントリーをはてなブックマークに追加

※以下では、本稿の前後を合わせて5回分(第6回~第10回)のみ表示しています。
連載の全タイトルを参照するには、[この記事の連載目次]を参照してください。

イベントから学ぶ最新技術情報
6. 目指すべき今後の人工知能とは? パネルディスカッション ― データサイエンティスト協会 セミナー2018 第1回

データサイエンティスト協会は、2018年第1回目のセミナーを開催し、『深層学習はすべてを解決できるのか?』と『世界に根差す人工知能と協調による創造性』の2つのセッションと、それを踏まえてAIやデータサイエンティストについて議論するパネルディスカッションを行った。本稿はそのパネルディスカッションの内容を紹介する。

2018年4月27日(金)
イベントから学ぶ最新技術情報
7. 深層学習にはどんなデータが使えるのか? どれくらいのデータ量が必要か? ― DLLAB コミュニティ勉強会 2018Q2

「機械学習・深層学習に向くデータの種類」「PoC(概念実証)段階と実用段階でのデータ収集の違い」「実用段階で精度メンテナンス」「深層学習に必要なデータ量」「アノテーションのクラウドソーシング」「オープンデータ」に関して有識者がコメントしたパネルディスカッションの内容を紹介する。

2018年5月28日(月)
イベントから学ぶ最新技術情報
8. 企業から見たデータサイエンティストの採用と育成(パネルディスカッション)― データサイエンティスト協会 調査・研究委員会セミナー

データサイエンティストの採用で使われている3つのスキルセットや、人材育成のためのインターンシップと各スキルの育て方、データサイエンティストが満足する職場環境や評価制度などについての意見が聞き出された、データサイエンティスト協会主催セミナーのパネルディスカッション内容を紹介する。

2018年6月13日(水)
イベントから学ぶ最新技術情報
9. MSやPFNのAI技術最新情報からPost Kまで ― DLLAB DAY 2018 基調講演レポート

MSのAI技術の最新情報として「Windows MLアーキテクチャ」や「Azure Sphere」「Project BrainWave」など、PFNの事例や「Chainer MN」「Menoh」など、さらにABCIや「Post K」など、基調講演の注目ポイントをまとめる。

2018年6月29日(金)
イベントから学ぶ最新技術情報
10. 【現在、表示中】≫ グーグルのAI技術、2018年9月最新情報 ― Google Cloud Next ’18 in Tokyo 基調講演レポート

2018年現在、グーグルはAI分野でどんな技術やサービスを提供しているのか? Google Cloud Next ’18 in Tokyoの基調講演から、AIに関する部分を書き起こした。

2018年9月19日(水)
Deep Insider の SNS :