イベントから学ぶ最新技術情報

イベントから学ぶ最新技術情報

AIの音声/画像認識技術は人間レベルを超えた!? Microsoftによる最新AI技術。Japan Partner Conference 2017 Tokyo

2017年9月7日

日本マイクロソフトはパートナー向けカンファレンスで、最先端テクノロジとして同社のAI技術を披露し、音声認識や画像/動画認識の精度が格段に上がってきており、「AIの認識技術はすでに人間レベルを超えている」と説明した。

一色政彦 デジタルアドバンテージ 一色 政彦

 日本マイクロソフトが9月1日に開催したパートナー向けイベント「Japan Partner Conference 2017 Tokyo ~Inspire Japan!~」では、FY18(会計年度2018: 日本マイクロソフトでは2017年7月~2018年6月まで)における戦略や、注力分野、事例が紹介された。

 戦略としては、従来の「モバイルファースト、クラウドファースト」にAI要素を足して発展させた「インテリジェントクラウド、インテリジェントエッジ」というコンセプト(図1)および、デジタルトランスフォーメーションを実現するために注力する重点ソリューション(モダンワークプレース/ビジネスアプリケーション/アプリケーション&インフラストラクチャー/データ&AI)が示された。

図1 インテリジェントクラウド、インテリジェントエッジ

 特に注力していく最先端テクノロジの分野としては、AI(人工知能)とMR(Mixed Reality)のHoloLensが取り上げられ、そのパートナー事例が多数発表された。本稿ではその中でも特に印象に残ったAIのデモ内容について、いくつかかいつまんで紹介しよう。

ここまで進んだAI技術 ~マイクロソフトのデモ内容から~

 マイクロソフト技術による音声認識や画像/動画認識の精度が格段に上がってきている。具体的には、2017年8月20日に「AIによる音声認識が人間の誤認識率(WER:Word Error Rate)より低くなった」ことがマイクロソフトにより発表されており、さらに画像認識においてはすでに人間の誤認識率より低いとのこと(図2)。つまり、AIの認識技術が人間レベルをいよいよ超えてきているということだ。

図2 AIの認識技術は人間レベルを超える

音声認識の技術: 文脈からの訂正

 最先端の音声認識技術として示されたデモと同じことが、PowerPoint 2016にPresentation Translatorアドインをインストールすることで自分でも試せるとのこと(ダウンロードはこちらから行えるが、筆者の環境ではインストールに失敗して試せなかった……)。

 同音異義語の多い日本語では、認識した文字の漢字は間違えてしまうことがよくあるが、Presentation TranslatorアドインのAIにより、一度間違えた漢字であっても、その後の文脈に基づき、前に戻って適切に修正されていくとのこと(図3)。

図3 一度誤認識されても文脈から訂正される
図3 一度誤認識されても文脈から訂正される

 また、音声から気持ちを読み取って疑問符にしたりするという文脈分析も可能である。

画像認識の技術: Cognitive Services

 マイクロソフトは「AIの民主化みんなのAI」というキーワードの下、Cognitive Services(クラウド上のWeb API)を推進している。今回のイベントでは、画像認識の技術について、Cognitive Servicesのサンプルを使ったデモがいくつか紹介された。

 例えば、2016年に大ヒットしたTVドラマ『逃げるは恥だが役に立つ』の“恋ダンス”をリアルタイムに分析して登場人物や風景の検出・分類が自動的に素早く行えることや、ヒアリとそれ以外のアリを機械学習すれば高精度に判定できることなどが示された。

図4 大量の画像から学習しておけば、与えられた新たな画像を判定できる

 このように2018年度のマイクロソフトはAIにさらに注力していく予定だ。マイクロソフトだけでなく業界全体でAIへの注目・投資が高まってきており、今後さらにAI技術が急速に発展していきそうである。

  • このエントリーをはてなブックマークに追加

※以下では、本稿の前後を合わせて5回分(第1回~第5回)のみ表示しています。
連載の全タイトルを参照するには、[この記事の連載目次]を参照してください。

イベントから学ぶ最新技術情報
1. 【現在、表示中】≫ AIの音声/画像認識技術は人間レベルを超えた!? Microsoftによる最新AI技術。Japan Partner Conference 2017 Tokyo

日本マイクロソフトはパートナー向けカンファレンスで、最先端テクノロジとして同社のAI技術を披露し、音声認識や画像/動画認識の精度が格段に上がってきており、「AIの認識技術はすでに人間レベルを超えている」と説明した。

2017年9月7日(木)
イベントから学ぶ最新技術情報
2. Chainer×Azureの関係とは? Preferred NetworksのCEO、西川氏が登壇。JPC 2017 Tokyo

PFN(Preferred Networks)のDeep Learningライブラリ「Chainer」とクラウド「Azure」の協業関係の具体的な内容について、PFN社のCEO自らが日本マイクロソフトのパートナー向けカンファレンスで説明した。

2017年9月15日(金)
イベントから学ぶ最新技術情報
3. 機械学習の作業がはかどる新ツール「Workbench」とは? TensorFlowやAWSも使える。Microsoft Tech Summit 2017

マイクロソフトが提供する機械学習向け新サービス&ツール。Azure、AWS、GCP、オンプレスミスなどに対応。TensorFlow、Chainerなどのディープラーニングフレームワークに、PyCharmやVisual Studio Codeなどのコードエディターも使える。

2017年11月16日(木)
イベントから学ぶ最新技術情報
4. 「DEEP LEARNING LAB」勉強会の開催方針と、7割補助金が出るハンズオン講座

ディープラーニングに取り組む人たちの間で人気の勉強会コミュニティ「DEEP LEARNING LAB」の概要と最新情報を紹介。今後の勉強会イベントの開催方針や、専門実践教育訓練給付で7割の補助金が受けられるようになった教育事業について説明する。

2018年2月23日(金)
イベントから学ぶ最新技術情報
5. GTC 2018におけるAI関連の発表内容、そこから見えるNVIDIAの方向性

「NVSwitch」「DGX-2」「TensorRT 4」「ARM社との提携」といったAI関連の発表内容を中心に、GTC 2018の注目ポイントを紹介。そこから垣間見える、NVIDIA社の「AI戦略」を考える。

2018年4月20日(金)
Deep Insider の SNS :

本コンテンツの目次

イベントから学ぶ最新技術情報
イベントから学ぶ最新技術情報

AIの音声/画像認識技術は人間レベルを超えた!? Microsoftによる最新AI技術。Japan Partner Conference 2017 Tokyo


本コンテンツに関連する重要用語