タグ: ディープラーニング(深層学習)

  • 富士通とPFU、AIを活用した発変電所における電力量計読み取り実証実験を実施

    富士通とPFU、AIを活用した発変電所における電力量計読み取り実証実験を実施

    富士通株式会社と株式会社PFUは、中国電力株式会社と株式会社エネルギア・コミュニケーションズと共同で、発変電所巡視業務において、電力量計の数値をタブレットのカメラを使って自動で読み取る実証実験を、2016年10月から12月までの3カ月間実施した。

    中国電力では、各発変電所の所内電力量を記録するため、作業員が電力量計の数値を読み取っているが、目視確認と写真撮影を行ったうえで数値の記録をしているため、同業務をより正確かつ効率的に実施したいというニーズがあった。これまで様々な画像認識技術の活用を検討したが、天候や電力量計の設置環境などにより数値の認識が正確にできなかったり、アナログ式の電力量計においては数値の回転度合いが様々であるため、認識精度も課題となっていたという。

    AI(人工知能)技術のひとつであるディープラーニングによるメーター読み取りシステム(PFUが特許出願中)は、メーターにタブレットをかざすだけで自動撮影を行い、メーターの数値を正確に認識できる。また、学習データを追加することで、認識可能となるメーター機器の種類を拡充できるという。

    同システムを利用し、所内電力量記録作業の精度向上と、将来的な所内電力量自動読取機能の実現に向けて、富士通とPFUは中国電力と6カ所の変電所における電力量計(アナログ式、デジタル式)を対象に、2016年10月から3カ月間の実証実験を実施した。同実証の結果、アナログ式およびデジタル式電力量計のいずれも高い認識精度を確保し、電力量計の読み取りにおいて有用であることを確認することができた。

    今後富士通とPFUは、メーターの読み取り画像データの蓄積を進め、ディープラーニングによる認識精度の向上、ならびに電力量計以外の圧力計、温度計、流量計など各種メーターへ対応することにより、発変電所だけでなく、ビル、工場などにおける各種メーター読み取り業務も含めた実用化を目指していくとしている。

    提供:富士通

    【関連リンク】
    富士通(FUJITSU)
    ピーエフユー(PFU)
    中国電力(EnerGia)
    エネコム(Energia Communications)

  • NTTレゾナント、AIが旅選びのサポートをする行動支援サービスを開発着手

    NTTレゾナント、AIが旅選びのサポートをする行動支援サービスを開発着手

    NTTレゾナント株式会社は、AIが対話を通じてユーザーの気分に寄り添い、ユーザー理解を深めることで、旅選びのサポートをするサービスの開発に着手する。この技術はNTTグループのAI関連技術「corevo」を活用している。2017年9月を目標にサービス提供を開始する予定としている。

    このサービスでは、AIが、旅先や旅行目的がはっきりしていないユーザーの気分に寄り添い、対話を通じて「のんびりしたい」「癒されたい」などのユーザーの気持ちを推察する。次に、「教えて!goo」の旅行に関するQ&Aデータや「gooブログ」の旅行体験記事といった旬なソーシャル情報、「goo旅行」の観光地情報、「goo地図」の地域情報をディープラーニングにより学習し、ユーザー理解を深めることで、ユーザーの気分に寄り添った旅先の提案を行うという。

    今回開発されたAI技術(*1)の特徴は、AIとの対話とAIによる旅選びの行動支援だ。

    1. ユーザーを理解する対話エンジン
      2016年9月にサービス提供開始した「教えて!goo」でのAIサービスは、「教えて!goo」の恋愛カテゴリーのQ&Aデータをディープラーニングにより学習し、一問一答形式で回答を生成。対して、今回開発されたAI技術はユーザーとのリアルタイムの対話を繰り返し、ユーザーのあいまいな気分から関心事を理解する。
    2. 複数のデータベースを学習
      同AI技術は、「教えて!goo」の旅行に関するQ&Aデータ、「gooブログ」の旅行体験記事、「goo旅行」の観光地情報、「goo地図」の地域情報といった複数のデータベースをディープラーニングにより学習する。複数のデータベースを学習することで、ユーザーに提案できる情報が増え、AIはさまざまなユーザーの気分に寄り添った旅選びを支援することができるという。
      NTTレゾナント、AIが旅選びのサポートをする行動支援サービスを開発着手

    対話エンジンは2017年3月に日本テレビ放送網株式会社と共同実験を行い、今後も各社との連携を検討するとしている。

    (*1) NTTグループのAI関連技術「corevo」の自然言語処理技術を応用したディープラーニングによる独自のAI技術。

    【関連リンク】
    NTTレゾナント(NTT Resonant)
    corevo(コレボ)
    日テレ(NTV)

  • ヴイ・インターネットオペレーションズ、AI画像解析を活用して防犯カメラ映像から危険をリアルタイムに検知する技術を開発

    ヴイ・インターネットオペレーションズ、AI画像解析を活用して防犯カメラ映像から危険をリアルタイムに検知する技術を開発

    パナソニック インフォメーションシステムズ株式会社の連結子会社であるヴイ・インターネットオペレーションズ株式会社は、同社の映像監視システム「ArgosView(アルゴスビュー)」とパナソニック株式会社の物体認識システムを連携し、防犯カメラ映像から危険をリアルタイムに検知する技術を開発した。

    2020年の東京オリンピック・パラリンピックに向けてセキュリティ意識が高まる中、商業施設や鉄道など、さまざまな施設で防犯カメラの大幅な新設・増設が進んでいる。多数のカメラにより防犯効果が高まるものの、警備員が膨大な数の監視映像を目視確認することは困難であり、期待された効果が十分に得られていないケースも生まれているという。

    今回開発された技術では、ディープラーニングをはじめとしたAI(人工知能)画像解析技術を有するパナソニックの「物体認識システム」が、あらかじめ学習しておいた識別方法にもとづいて対象を検知し「ArgosView」へアラートを通知する。アラートを受け取った「ArgosView」が該当するカメラ映像を警報メッセージとともにポップアップ表示し、効率的かつ確実な警備を実現するという。

    検知したい対象は、灯油缶や刃物などの危険物のほか、身体の不自由な人やふらつく人、転倒した人など、ニーズに合わせて設定が可能。また、検知対象の識別に必要な事前学習は、パナソニック独自のディープラーニング技術を用いることで、少量のデータで高精度な結果を得ることができるという。

    【関連リンク】
    パナソニック インフォメーションシステムズ(Panasonic Information Systems)
    ヴイ・インターネット オペレーションズ(V-Internet Operations)
    パナソニック(Panasonic)

  • ディープインサイトとトプスシステムズ、組込みディープラーニング技術と非従来アーキテクチャのAIプロセッサの融合で超高速100fpsで物体を判別可能な画像入力フロントエンドシステムを開発

    ディープインサイトとトプスシステムズ、組込みディープラーニング技術と非従来アーキテクチャのAIプロセッサの融合で超高速100fpsで物体を判別可能な画像入力フロントエンドシステムを開発

    エンベデッドディープラーニングフレームワーク「KAIBER」を開発するディープインサイト株式会社と新世代のプロセッサ「SMYLEdeep」を販売する株式会社トプスシステムズは、ディープラーニングを用いて100fpsと高速かつ低消費電力で一般物体判別が可能なシステムを実現した。

    SMYLEdeepは従来型プロセッサの20分の1以下の75MHz動作でFull-HD入力画像に対する移動物体の検出及び判別を100fpsで実行可能(1つの物体の判別時間は2msec未満)で、消費電力は500mW未満*(28nmでチップ化した場合)。エネルギー効率(性能/電力比)は、1TOPS/W(Tera Operations Per Second/Watt)を超える。

    KAIBERは、エッジコンピューティングとIoT向けに開発されたエンベデッドディープラーニングフレームワーク。 今回、SMYLEdeep向けに最適化されたKAIBERのディープニューラルネットワークが使用され、判別率は93%以上だという。

    IoTや自動運転などのエッジコンピューティング市場に、カメラ画像入力に対するリアルタイム分析/ディープラーニング処理システムとしてコンピュータ・ビジョン評価システムやSMYLEdeepを販売していくという。なお、SMYLEdeepは、国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)の『極低電力回路・システム技術開発(グリーンITプロジェクト)』の「低消費電力メニーコア用アーキテクチャとコンパイラ技術」の成果の一部を適用して開発されたSMYLEvideoの次世代にあたるメニーコアプロセッサだ。

    また今後、NEDOの『次世代人工知能・ロボット中核技術開発』の「メニーコア用のデータフロー型プログラミングの開発」で委託を受けて開発している技術成果をSMYLEdeepソフトウエアの一部に適用する可能性があるという。

    自動運転やロボットにおいては、カメラに映される膨大な量の時系列画像に対するリアルタイム(実時間)での精度の高い計測処理や、AIを用いた確度の高い画像認識処理が必要とされている。認識処理の高度化に伴って必要な計算量は数TOPS(PC数百台分)以上になる。しかし、冷却が困難で夏には高温になる車載システムやモバイル機器では1W以下という低消費電力が求められる。そこで、高速化と低消費電力化を両立させ、これらの機器に組込み可能なディープラーニングシステムを開発した。

    トプスシステムズは、IoTやAIのエッジ・コンピューティングのプラットフォームとして、従来型プロセッサの20分の1以下の75MHz動作でも最大で毎秒480枚のFull-HD画像に対する画像認識処理(移動物体検出及び追跡)が可能な超高速なSMYLEdeep(注1)を製品化している。

    AIプロセッサは、マイクロプロセッサの発展におけるブレークスルーとして注目されており、GPUが3,000以上のコアを集積することでCPUを超える高い性能を達成しているが、消費電力が大きく、コストが高いという課題があった。カメラからのリアルタイム画像に対し、低消費電力で画像認識処理やディープラーニング等のAIを組込みデバイス環境で高速実行することは困難だった。トプスシステムズは、同技術を「SMYLEdeep プロセッサIP」としてライセンス提供するとともに、SMYLEdeepをFPGA上に実装した「コンピュータビジョン評価システム」を販売している。

    ディープインサイトは、現在、ほとんどの汎用ディープラーニングフレームワークは商用サポート環境が極めて未整備で、小型デバイス等への組み込み用途も考慮しておらず、エッジコンピューティングへの適用に大きな障害となっている現状の中、今後生まれる多様なIoTデバイスにディープラーニングを簡単に組み込める使い易さと商用ビジネス展開を支援できるサポート体制を実現する為、純国産ディープラーニングフレームワーク「KAIBER」を開発している。今回は、SMYLEdeepの低消費電力・高性能とKAIBERの柔軟なデバイス最適化構造という特徴を融合した次世代システムを実現した。トプスシステムズは、SMYLEdeepに最適化したディープラーニングフレームワークKAIBERを用いたソリューションを提案していく。

    また、ディープインサイトは、SMYLEdeepに最適化したディープラーニングフレームワークKAIBERを製品化していく。

    注1:SMYLEdeep 
    トプスシステムズの開発したデータフロー型の並列処理を得意とし、高度な並列処理を効率よく実行可能な新しいタイプのプロセッサ。動作周波数が低くても高速処理が可能なためエネルギー効率(消費電力あたりの性能)が高く、またコア数を増加することでほぼリニアに性能を向上可能なため、組込みシステム等のローエンドからサーバーなどのハイエンドまでスケーラブルな応用が可能な新世代の計算プラットフォーム。

    【関連リンク】
    ディープインサイト(Deep Insight)
    トプスシステムズ(TOPS Systems)
    国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)

  • 福田道路とNEC、AI技術を活用した舗装損傷診断システムを開発

    福田道路とNEC、AI技術を活用した舗装損傷診断システムを開発

    福田道路株式会社と日本電気株式会社(以下 NEC)は共同で、AI(人工知能)技術を活用し、路面の映像からわだち掘れとひび割れを同時に検出する「舗装損傷診断システム」を開発した。

    近年、国内における道路の総延長は120万kmを超え、その多くを管理する国・自治体では、職員などによる路面点検の人員確保や高価な専用機器を用いた調査の費用負担などが大きな課題となっており、効率的かつ計画的な道路の維持管理に向けた取り組みが重要になっている。

    同システムは、NECの最先端AI技術群「NEC the WISE」の一つであるディープラーニング(深層学習)技術を搭載した「NEC Advanced Analytics – RAPID機械学習」を活用し、一般的なビデオカメラを取り付けた自動車から撮影した路面の映像を分析することで、路面のわだち掘れとひび割れを同時に検出し、路面状況の劣化レベルの判定を可能とする。また、路面の撮影と同時に記録したGPSによる位置情報の活用により、地図データ上で路面状況の確認が可能。

    これらにより、従来の路面の目視点検や専用機器による調査に比べ、安価で効率的に路面の健全度の見える化を実現する。

    福田道路とNEC、AI技術を活用した舗装損傷診断システムを開発
    (左)わだち掘れ検出のイメージ  (右)ひび割れ検出のイメージ

    福田道路とNECは、同システムを用いた一般道での実証実験において、専門技術者の目視点検と同等のレベルで路面のわだち掘れとひび割れを同時に検出できることを確認した。更に社会実証を重ね、今後実証データの公表を予定しているという。福田道路とNECは、2017年度を目処に同システムの実用化を目指す。また今後、同システムを活用した路面の健全度の見える化のみならず、道路の補修計画の策定から補修工事の実施・評価までの一連の工程において、AI技術を活用した最適化を検討していくという。

    【関連リンク】
    福田道路(FUKUDA ROAD)
    日本電気(NEC)

  • NTTデータ、人工知能を用いたニュース原稿の自動生成する実証実験を実施

    NTTデータ、人工知能を用いたニュース原稿の自動生成する実証実験を実施

    株式会社NTTデータは、人工知能(以下:AI)を用いて、アナウンサーが読み上げる気象ニュース原稿を気象電文から自動生成する実証実験を2016年9月から4カ月間にわたって実施した。

    近年は、生物の脳構造を参考にして考案された最先端のAIであるディープラーニング技術を画像や音声の自動生成に適用する事例が注目を集めている。しかし、画像や音声と比較して、ビジネスにおいて意味が分かる水準の文書を自動生成することは難しいとされていた。同実証実験では、難易度が高い文書自動生成に挑戦し、自動生成された原稿の品質が実用に耐えうるかの検証が行われた。

    同実証実験では、まずは気象庁が過去に公開した気象電文とアナウンサーが読んだニュース原稿をそれぞれ4年分用意し、原稿作成の規則性をディープラーニングで学習することで、ニュース原稿を生成するAIを構築。このAIに、新たな気象庁の気象電文を読み込ませると、AIが学習した結果を基にして、新たな気象ニュース原稿を自動生成するようになる。さらに、NTTグループのAI「corevo」の高精度の日本語解析技術を組み合わせることで、より自然な日本語の生成を実現している。

    次に、自動生成された気象ニュース原稿の「日本語文法の正しさ」と「意味の正しさ」を評価。その結果、「日本語文法の正しさ」は、4点満点中3.86点(NTTデータ独自の採点基準)で、人が読んでも違和感が無いレベルに達し、「意味の正しさ」は、4点満点中3.07点(NTTデータ独自の採点基準)で、自動生成された気象ニュース原稿をわずかに修正することで、元の気象電文と矛盾しないレベルに達していることを確認。

    この結果を踏まえ、今後は、「意味の正しさ」を向上させるほか、気象分野における商用化を目指すとともに、他分野展開のための新たな実証実験を進めるという。

    これまでニュース原稿を自動生成するには、あらかじめ用意されたテンプレート文に、単語や数値を埋め込む方法が主流だったが、この方法では大量のテンプレート文や単語の埋め込み方を人間が一つ一つ設計する必要があるため、さまざまなパターンに対して網羅的に対応するには限界があった。一方で、ディープラーニングによる文書の自動生成は多くの人手を必要としないため、設計・開発コストを低減できる可能性がある。また、速報性が求められるスポーツニュースや災害情報のリアルタイム配信、地方のニュースの積極的な配信が可能になる。

    今後、NTTデータでは、AI記者の気象分野における商用化を目指すとともに、企業の決算発表やスポーツ記事等の大量のデータを伴う分野においても新たな実証実験を行い、AI記者の他分野展開を目指すという。

    【関連リンク】
    NTTデータ(NTT DATA)

  • データセクションとフレームワークス、AIとビッグデータを活用し物流事業の最適化へ向け共同研究を開始

    データセクションとフレームワークス、AIとビッグデータを活用し物流事業の最適化へ向け共同研究を開始

    データセクション株式会社と、大和ハウスグループの株式会社フレームワークスは、AIとデータを活用した次世代型物流事業の構築を目指し、共同研究を開始する。

    ECサイトの普及は消費者の生活利便性を飛躍的に向上させた一方で、多品種、小ロットによる短納期配送の実現を迫られたうえに、更なるコストの削減が求められるなど、物流業界は更なる高度化・効率化が求められている。このような状況に対応すべく、AIとデータを活用した物流領域の高度化・効率化を目指し、データセクションはフレームワークスと共同研究を開始する。

    先端デバイス活用により収集される様々な物流業務のビッグデータと各種のオープンデータを活用することで、属人業務を排除し、労働集約業務の効率化やロボットへの業務移管が可能となる状況を提供。例えば、収集したビッグデータをAIが分析判断することにより、「需給予測」ではなく、より精度の高い「需給見込」を導きだし、最適な在庫配置、最適な人員配置、最適な配車、最適なラインコントロールを実現し低コスト、短納期でのサービス提供が可能になるという。

    両社は、データセクションのディープラーニング実用化実績、データ活用ノウハウと、フレームワークスの物流業務に関するノウハウを掛け合わせることにより、時代の変化とともに必要とされる次世代型物流事業の実現を目指す。また、物流領域以外の領域においてもAIとデータを活用した事業を広く展開していくことを目指していく。

    【関連リンク】
    データセクション(Datasection)
    フレームワークス(FRAMEWORX)

  • 東芝、ディープラーニングを低消費電力で実現する脳型プロセッサを開発

    東芝、ディープラーニングを低消費電力で実現する脳型プロセッサを開発

    東芝は、ディープラーニング(深層学習)の処理を極めて低い消費電力で実行する、人間の脳を模した半導体回路TDNN(Time Domain Neural Network)(注1)を開発した。TDNNは演算回路を小さくできる特徴があり、従来と比べ多くの演算回路を1チップに実装することができる。

    現在、ディープラーニングは、大量の演算を高速で処理し、多くの電力を消費する高性能コンピュータによって行われており、センサーやスマートフォンなどのエッジデバイスで同様のディープラーニングを実行するためには、大量の演算を数ワット以下の低消費電力で実行するチップが必要だ。ノイマン型(注2)と呼ばれる一般的なアーキテクチャのコンピュータでディープラーニングの処理を実行する場合、消費電力の大部分はデータをメモリから演算回路に移動するために利用されているため、データの移動に使われる電力を抑えることが課題となっていた。

    ディープラーニングの処理におけるデータの移動を減らすためには、演算回路を完全に並列化(注3)し、その演算回路が利用するメモリを演算回路の直近に配置することが有効だという。従来このようなアーキテクチャは、チップサイズが大きくなってしまうため採用できなかった。

    そこで同社は、2013年に開発された時間領域アナログ信号処理技術(注4)を演算回路に採用し、演算回路の小型化に成功。時間領域アナログ信号処理は、デジタル信号が論理ゲートを通過する際の遅延時間をアナログ信号として利用することで加算などの演算を効率よく実行することができる技術だという。この技術により、ディープラーニングの1つの演算を行う演算回路をわずか3つの論理ゲートと1ビットのメモリで実現し、チップサイズを小型にしながら演算回路を完全に並列化することができるようになる。

    今回は、揮発性メモリ(SRAM)を利用したチップを試作し、ディープラーニングに必要な基本的動作である画像認識を行った結果、演算あたりの消費エネルギーをこれまでに学会で報告されている値(注5)の6分の1以下の20.6フェムトジュール(注6)に抑制することができたという。

    今後、同社はより小型化と消費電力化が可能になる抵抗変化型メモリ(ReRAM)を使用したTDNNを用いたプロセッサの開発を予定している。デバイスの小型化に必要な技術開発を進め、エッジデバイスでのディープラーニングを可能にするプロセッサの実現を目指すという。

    注1 TDNN:時間領域アナログ信号処理を利用したニューラルネットワークのこと。
    注2 ノイマン型:コンピュータのもっとも一般的な構成。記憶装置からデータを読み出して、演算装置で演算を行うのが特徴の一つ。
    注3 並列化:演算数と同じだけの大量の演算回路を敷き詰めること。
    注4 時間領域アナログ信号処理:デジタル信号が論理ゲートを通過する際の遅延時間をアナログ信号として利用して演算を行う、同社独自の信号処理方法のこと。
    注5 ISSCC 2016(International Solid-State Circuits Conference 2016)論文番号24.2
    注6 20.6フェムトジュール: 1ワットの消費電力で1秒間に48.5兆回の演算ができることに相当する。

    【関連リンク】
    東芝(TOSHIBA)

  • 富士通研究所とFRDC、人工知能モデルを活用した高精度の手書き文字列認識技術を開発

    富士通研究所とFRDC、人工知能モデルを活用した高精度の手書き文字列認識技術を開発

    富士通研究開発中心有限公司(以下、FRDC)と株式会社富士通研究所は、手書き文字列での画像認識において、信頼性の高い認識結果を出力できる人工知能モデルを開発し、中国語の手書き文字列の認識性能において、世界最高精度を達成したと発表した。

    深層学習をはじめとする人工知能モデルによる単一の中国語手書き文字認識は、すでに人間の認識能力を超えているという(※)。しかし手書きの文字列に適用した場合、1つの文字の区切りを正しく判別できないことが実用上の大きな課題となっていた。今回、手書き文字列の画像認識において、正しい文字を高信頼度に、文字にならない部分を低信頼度に出力可能な新しい人工知能モデルが開発された。同モデルの適用により、文字の認識ミスを従来の半分以下に抑えることができ、手書きテキスト電子化入力作業などの効率が大幅に向上するという。

    従来の文字の教師サンプルに加え、新たに開発した部首やつくりなどのパーツや、文字にならないパーツの組み合わせからなる非文字の教師サンプルによる異種深層学習モデルにより、正しい文字のみに高い信頼度が出力される技術が開発された。同技術の特徴は以下のとおり。

    1. 非文字を含む異種深層学習モデルの効果的な学習技術
      異種深層学習モデルには、従来の文字の教師サンプルと、非文字の教師サンプルの二種類が含まれる。文字の教師サンプルの数と比較して、文字を分解し、さらに組み合わせで得られる非文字の教師サンプルは膨大な数になる。そのため、中国語文中で、隣り合って現れやすいパーツの組み合わせを、非文字の特徴として記憶させて重みづけを行うことで、非対称な構造の深層学習モデルに対しても、効果的に学習できる技術を開発。
    2. 信頼度の高低を利用して手書き文字列を正しい区切りで分解する技術
      学習済みの異種深層学習モデルに候補領域の画像を入力すると文字と非文字それぞれの信頼度が出力され、文字となる候補領域に高い信頼度を、文字ではない候補領域に低い信頼度を出力する仕組みを設けることにより、文字列中の一つ一つの文字の区切りを効果的に判別する技術を開発。加えてに既存技術である中国語の言語処理モデルを適用して、認識候補が正しい中国語の文字列になるかということを解析した上で、最終的な候補文章を出力させるという。
      今回の認識技術を適用すると、文字として存在しないパーツの組み合わせに対しては、文字としてみたときの信頼度のレベルが低くなるため、文字列の先頭から信頼度の高い区切りを順に選択していくことにより正しい認識結果が得られるという。

    開発された技術を、中国科学院自動化研究所「Institute of Automation, Chinese Academy of Sciences(CASIA)」 が2010年に公開し、学会で標準として用いられている手書き中国語データベースに適用したベンチマークにおいて、従来技術に比べて5%上回る96.3%の最高精度を達成したという。これにより手書きテキスト入力作業などの効率が大幅に向上できる。

    同技術は、スペースによる単語の区切りのない、中国語、日本語、韓国語などの言語に対して有効だという。同技術を、富士通研究所が長年の技術的蓄積で強みをもつ日本語の言語処理技術と融合させることで、日本語の自由手書き文字に対しても認識精度の大きな向上が見込まれます。同技術は2017年に、富士通のAI技術「Zinrai」への活用を目指し、順次日本向けの手書き帳票電子化などのソリューションに適用していくという。

    ※人間の認識能力を超えている:人間の脳の働きを模した人工知能技術を活用し、中国語の手書き文字認識率96.7パーセントを達成(2015年9月17日プレスリリース)

    【関連リンク】
    富士通研究開発中心(FRDC)
    富士通研究所(FUJITSU LABORATORIES)
    富士通(FUJITSU)