東大大学院と東工大が日本代表として挑戦
「Imagine Cup」は、2003年にマイクロソフトの創始者であるビル・ゲイツ氏の発案で始まった学生ITコンテストだ。IT人材育成に力を入れる米マイクロソフトの年次イベントで、学生たちはテクノロジーを活用して、社会の課題解決に役立つソリューションや新たな価値を与えるプロダクトを創造し、競い合う。これまで同コンテストに参加した学生は、世界190カ国のべ200万人を突破、まさに世界最大の学生ITコンテストだといえる。
Imagine Cup世界大会は、自国の予選を勝ち抜いたチームが出場権を獲得する仕組みだ。日本においても、日本マイクロソフトが毎年3月に国内予選を実施しており、今年はディープラーニング(機械学習手法の一つ)を用いた音声変換システムを実現したチーム「NeuroVoice」(東京大学大学院)と、視覚障がい者向けスマート白杖デバイス開発したチーム「TITAMAS」(東京工業大学)の2チームが、日本代表として選ばれた。今回は世界39カ国54チームものファイナリストがシアトル本社に集結した。
今年のImagine Cupの目玉は、開催15周年を祝して、優勝賞金が10万ドル(日本円で約1100万円)へと大幅にアップしたことだ。加えて、12万ドル分(日本円で約1320万円分)のMicrosoft Azure(マイクロソフトのクラウドサービス)の利用権も副賞として用意された。また、大会の中身も一新され、これまで設けられていた「ゲーム部門」といった3つのカテゴリーを全て廃止。代わりに「世の中にインパクトを与える革新的でクリエイティブなソリューションやサービス」にエントリー条件が統一された。これにより、全ての参加チームが同じ土俵で闘うことになった。
また今回から、エントリーする全てのソリューションやサービスにおいてMicrosoft Azureの使用がルール化されたことにも注目したい。その理由についてMicrosoft Azureを推進するCharlotte Yarkoni氏(米マイクロソフトのコーポレート部門副社長)は、「未来で活躍する人材を輩出するImagine Cupとしては、クラウドの利用はもはや必須であると考える」と記者説明会の席で述べた。同氏によると、テクノロジー最高財務責任者たちの74%は今後、クラウドの事業を重要視すると答えており、こうした未来を見据える意味でも、学生にはクラウドのメリットを活かしたアイデアや課題解決を求めていきたいというのだ。
声から声の音声変換で斬新さをアピール! 東京大学大学院チーム「NeuroVoice」
世界大会は、第1次審査であるTech Showcaseで幕を開けた。各チームはブースに訪れる3名の審査員に対して、それぞれ10分間のプレゼンテーションやデモを行い、審査員からの質疑に応える。
ちなみに、Imagine Cupのプレゼンテーションでは、単にプログラミングスキルやアイデアの斬新性を競うのではなく、自分たちで考えたソリューションが社会で普及するためのビジネスモデルや、どれだけ社会にインパクトが与えられるのかを表現することが求められる。しかも、全て英語で伝えなければならず、日本チームは例年、この英語によるプレゼンテーションが課題であった。そのため、今年の学生たちは世界大会前の3カ月間に、グロービス/グロービス経営大学院とベルリッツ・ジャパンの2社からメンタリングを受けて、万全の体制で挑んだという。
東京大学大学院のチーム「NeuroVoice」は、音声の生成モデルにディープラーニングを用いた音声変換システム「NeuroVoice」を発表した。同システムは、テキストを音声に変換するのではなく、対象人物が話す声をより自然で流暢に、他人の声に変換できるというもの。ディープラーニングを用いることで音声の最小単位である音素の学習を可能にし、人の声が持つ独特のイントネーションや発音の特徴を再現できるようにした。チームNeuroVoiceでは、ビル・ゲイツ氏の発言をヒラリー・クリントン氏やアーノルド・シュワルツェネッガー氏の声に置き換える動画を作成し、ソリューションの魅力を審査員に訴えた。
NeuroVoiceは、Speech Recognition(音声認識)とConversion(変換)という深層学習の技術を用いて、他の手法よりも10倍以上速く学習できるのが特徴だ。また、多くの人が利用できるシステムを目指し、API型(ソフトウェア同士のやり取りに使用する機能および仕様)のサービスで提供した。
さらに、ビジネスとして展開していくためには、セキュリティ、スケーラビリティ、拡張性などの課題が発生するが、Microsoft Azureを使用することで、充実したインフラ環境で対応できるとメリットを主張した。
他にもビジネス面では、近年高まりをみせる音声認識サービス市場の需要をアピールした。映画の吹き替えやゲームなどのエンターテイメント、チャットやロボットなどのコミュニケーションツール、言語障がい者の支援など、多様な用途で活用が見込めるという。
しかし、こうしたメンバーのプレゼンテーションは届かず、東京大学大学院のチーム「NeuroVoice」は、第1次審査で敗退となった。