Twitterを使ったインテグレーションサービスを展開する時には、有料のAPIをクライアントに契約してもらう必要がありましたが、今後はツイートデータを仕入れて加工して売るということができるようになります。

NTTデータによる料金設定はこのようになっています。

f:id:webdatareport:20171219155635j:plain

Twitter社の今年10月に発表した第3四半期の世界でのデータ販売収入は、前年同期比22％増の8700万ドルとのことなので、データ販売は貴重な収入源になっているようです。

2017-11-25

AI同士が対戦しサッカー実試合の結果を予測、勝敗の“的中率”は最高76.9％、5割超を保つ

サッカー専門戦況予測AIエンジン「WARP_AI」として、今年7月に提供を始めた。サッカーくじ「toto」の結果で評価すると、最高で76.9％（13試合中10試合的中）、最低で38.5％（同5試合的中）である。全体的に5割以上の場合が多いようだ。

最高で 76.9％、最低で38.5％が精度が高いのかどうかがピントこない。五割以上はいけてるとはいうものの、チームの強さはほぼ見えているので前の年の順位順に強さを判定するだけで、5割は超えないか。

ただ、このAIは、実際にAIが個々の選手のプレーをシミューレーションして勝敗を決める（仮想の実況もある）。単なる統計の延長ではないというのが特徴。

このAIをつかってTOTOを買ってしまえば儲かるのではないかと思ったら、このサービスの予測をつかってTOTOを買う仕組みもある。（WARP買いというメニュー）

2017-10-07

Google Home と Amazon Echo を両方触ってみた感想

Google Home 日本語版、LINE WAVE が、2017-10-06に発売になりました。

またAmazonEchoが年内の発売という発表があり、いよいよスマートスピーカーが揃い踏みになります。

以下、Google Home（日本語版）とAmazon Echo（まだ英語版）を実際に触ってみた所感です。

スマホの周辺機器としてのGoogeと、単独の家電としてのAmazon

まず、Google Homeは、Google Homeというスマホアプリをスマホにインストールする必要があります。一方でAmazon Echoは初期設定は全てブラウザで可能です。PCのブラウザからも設定できるので、スマホアプリは必要ありません。

Google Homeのアプリは、Googleアカウントと連携するので、基本は普段スマホで使っているGoogleアカウントです。共有アカウントを試そうと思いましたが、共有アカウントをスマホに設定した時点でスマホの写真が吸い上がるかと思ってやめました。

パーソナル用途のGoogleとファミリー用途のAmazon

したがって、Google Homeは基本的に個人が使ってるGoogleアカウントと連携することが大前提です。AmazonにもGoogleアカウントと連携するGoogleカレンダー読み上げ機能もあるのですが、オプションのような役割ですね。Amazonも当然誰かしらのAmazonアカウントで設定することにはなるのですが、これといったプライバシー情報が端末と連動するルートはなさそうです。

地味に目覚ましとして使えるのがGoogleHome

Amazon Echoは、毎朝何時に目覚ましを鳴らすという機能がないのですが、GoogleHomeは目覚ましそのものの機能があります。寝室は寝たままで操作したいですから、寝室向きなのはGoogle Homeですね。

Google Home はYoutube連動が素晴らしい

正確には、ChromeCastと連動してYouTubeをテレビで再生しているだけなのですが、YouTubeが声だけで操作できるのは思ったよりも快適です。アーティスト名やコンテンツ名もきっちり認識してくれます。

「オッケーグーグル、世界の中心で愛を叫ぶをユーチューブでみせて」

などという、係り受けが破綻した文章も、ちゃんとタイトル部分だけ認識してて、テレビから再生してくます。クラウドの音声認識ならではの機能なので、オフラインの家電には真似できません。

音楽はSpotifyでほぼ決まり

GoogleもAmazonも、「○○をかけて」と言えば、音楽をかけてくれるのですが、音楽配信サービスと契約している必要があります。GoogleMusic、AmazonMusicが存在しますが、これだけのためにデバイスに依存した契約はためらわれます。そして、どちらもSpotifyは対応しているので、この場合Spotifyの有料プランを一つ持っておけば、どちらでも音楽を楽しめるでしょう。Spotifyは元々多くのデバイスと連動することを想定しているので、最強です。音楽のラインナップもオルゴールでごまかしたりせずに、ライブ音源などなんとかしてアーティストの声が入った音源を入手してくれています。

スピーカー＆マイクの性能はAmazon Echo

Amazon Echoの方がスピーカーのクオリティとしては上です。サイズ・重量・価格ともに高いから当たり前ですが。音量を上げても音が割れないです。一つだけ、機能面での差があるとすると、AmazoEchoは、音量を上げても「アレクサ」の呼びかけをしっかりと認識してくれます。Google Homeは、スピーカーからの音が大きいと、こちらからの呼びかけの認識が落ちている印象です。

PCでSkype会議をしていたりすると、スピーカーからの音をマイクが拾ってしまってハウリングすることがあるかと思いますが、ハウリングしないスピーカーマイクはなかなかの値段をします。「己が出した音と他人が出した音を区別する」と言う機能はまだまだ重要です。

GoogleHomeへの呼びかけは「オッケーグーグル」でも「ねぇグーグル」でも可

Heyに相当する日本語は「ねぇ」のようでして、「ねぇグーグル」と呼びかけるようなのですが、既にスマホで使ってる「オッケーグーグル」も使えます。「ねぇ」は関西生まれにとっては女言葉なのでかなり抵抗があります。オッケーグーグルの選択肢があって何よりです。Amazonは元々「アレクサ」という名前そのものを呼べばいいので楽ですね。

Google Homeは認識効率は高いのに、発話がイマイチかも

「オッケーグーグル、トゥウェニーワンかけて」『スポティファイで、ツーエヌイーイチを再生します』

「オッケーグーグル、フォーミニッツかけて」『スポティファイで、よんみにっとを再生します』

と、聞き取れるには読みを知らないというのが不思議ポイントです。

Google Homeは基本的には、6つくらいのコマンド知っておけば十分楽しめる

以下のコマンドで、音と映像は一通り楽しめます。

○○かけて（音楽再生）
○○見せて（YouTube再生）
音量上げて／下げて
次（スキップ）
ストップ
この曲何？（これで曲名を教えてくれる）

AmazonEchoもほぼ同じ機能がありますので、このあたりはスマートスピーカー共通の機能でしょう。

2017-09-11

電通、深層学習技術で視聴率を高精度に予測予測業務の半減を目指す

電通は、深層学習（ディープラーニング）技術を活用したテレビ視聴率予測システム「SHAREST（β版）」を開発。今年12月までに実証実験を終了して、来年から本格運用に入る。テレビ視聴率の安定的な予測を自動で実現して、予測業務の半減と、最終的に広告効果の向上を目指す。SHARESTの開発は、2015年10月からデータアーティスト（東京都港区）と共同で進めてきた。SHARESTは、過去の視聴率データや番組ジャンル、出演者情報、インターネット上の閲覧傾向などのデータを教師データとして、深層学習アルゴリズムに学習させて放送前のテレビ視聴率を予測する学習モデル。電通は7月からSHARESTを活用して、関東地区で1週間内の放送枠の高精度な視聴率予測を実践する検証プロジェクトを実施している。

視聴率予測による広告最適化と広告運用自動化が実現することが期待できそうです。Twitter以外でどのwebデータを活用していくのか興味深いです。

電通、深層学習技術で視聴率を高精度に予測予測業務の半減を目指す - 日経BigData

2017-08-08

ホテル口コミ1億件を収集・分析し収益化、独トラスト・ユーをリクルートが買収

ホテル口コミ1億件を収集・分析し収益化、独トラスト・ユーをリクルートが買収 - 日経BigData

トラスト・ユーは、インターネットに公開されているデータを、集約と分析の2段階で価値化しているユニークなビジネスモデルを採っている。世界の250以上の旅行情報サイトのデータを、毎年1億件規模で収集し、ホテルごとに整理してダッシュボードで評価や口コミを可視化する。大規模な旅行サイトとはAPI（アプリケーション・プログラミング・インターフェース）でのデータ取得を契約し、データの量と質を担保している。

Googleでホテルを検索した時に出てくる評価も、トラスト・ユーのデータを使っているとのこと。Googleがクロールデータをを外から仕入れているというのが面白い。

年間1億件というどれくらいかというと、一年間は3000万秒くらいなので、1秒あたり3件のデータを取得するという規模感。絶対に無理なボリュームではないのだけれど、どこに新しいデータが出てきてるかということをちゃんと把握するほうが大変。

上の記事では大手とはAPI提携をしているとのことですが、別途APIサーバを立てるよりも、既存のHTMLベースのインフラの方がCDN経由だったりして負荷に耐えやすい。なのでAPIではなく「連携用の画面」を追加で用意してもらうことが自社ではあります。

2017-07-25

九大が電子教材で1年生全員の受講データ分析、教師による学習効果の違いが明白に

九大が電子教材で1年生全員の受講データ分析、教師による学習効果の違いが明白に - 日経BigData

九州大学は昨年から、電子教材を活用する講義の教師へのリアルタイムフィードバックを実施。講義の改善に取り組んでいる。今年度前半には、新1年生2700人、15クラスを対象にある必修科目の講義状況をリアルタイム把握。教師による学習効果の違いなどが一目瞭然となった。

私（前田）の母校ですが、このような取り組みにより教養学部の学習効果が上がるとともに、アクティブティーチングで生徒、教師双方のモティベーションアップも期待できそうです。25年前は紙とペンしかなかったですね、笑

2017-06-25

ビッグデータでバイク窃盗を現行犯逮捕、京都府警が予測システムを導入で実績

日経ビッグデータより

business.nikkeibp.co.jp

京都府警察本部はビッグデータを活用した犯罪予測システムを昨年10月に導入し、半年で数件の検挙につなげる成果を上げているとのこと。

一見すると、「すわ！監視社会か！」って反応をしそうだけど、実際には個人を追いかけるのではなく、過去の犯罪の「時間」「エリア」を丹念に集計しているだけ。

それでも、犯罪が発生しやすい時間×エリアは傾向がでるので、パトロールのリソース配分という意思決定にはめちゃくちゃ役に立つ。一種のエリアマーケティング。

さらに、分析エンジンには、機械学習やAIは用いてないというのも特徴的。

京都府警は今回、NEC、立命館大学と共同で開発した。分析エンジンには機械学習や人工知能（AI）の要素を入れていない。それぞれの犯罪について過去データから、人が予測ロジックを作り込んでいる。「現時点ではどのようなロジックで予測結果を出しているのかについてブラックボックス化したくないと考えている」（岡本所長補佐）。

「ブラックボックス化したくないから」というのが非常に示唆深いし、機械学習の特徴を分かってる。

Webデータレポート

株式会社ルーターのデータレポートブログです

NTTデータとTwitterが日本独自のメニューを用意