【備忘録】AI(人工知能)関連で気になった記事 ~政府のAI人材25万人育成計画とFiNCさんの事例~

いつもリフ株式会社・公式ブログをお読みいただき、ありがとうございます。ブログ担当・Kです。
本日の記事は私の備忘録がてらで恐縮なのですが、AIの実務経験者の方々の意見が反映された2本の記事が目に留まりまして、非常に共感する部分が多かったため、記録しておこうと思いました。

一本目は日本経済新聞さんの記事で、以下の部分に共感しました。

メルカリのAI戦略を担う木村俊也エンジニアリングディレクターは、世間が認識するAI人材と、現実に不足している人材にズレがあると指摘する。「AI技術そのものよりも、AIに学習させる実データがどこにあるか、AIをプロダクトにどう落とし込めるかを担える人材が実は不足している。そうした人材を積極的に採用したい」(木村氏)。

衝撃のAI人材25万人育成計画、裏に2つの「失策」
日本経済新聞 2019年4月16日
https://r.nikkei.com/article/DGXMZO43377270V00C19A4000000

政府の25万人育成計画はぜひ上手くいって欲しいですが、やはり実務上で必要な職務要件を育成内容にも反映しないと、適切な人材が育たないリスクが高くなってしまうと感じました。

二本目はITmediaさんの記事で、以下の部分に共感しました。

1. AI開発プロジェクトは「アジャイル開発」で進める
2. 評価方法を定めてからAI開発プロジェクトを始める
3. AIプロジェクトのゴールを「AIモデルの実装」にしない
4. データセットの準備やアノテーションを丸投げしない
5. AI/ML人材はソフトウェアエンジニアから輩出する

“おいしいデータ”で、成果が出るAIモデルを育てる(2):
「データセットの準備を丸投げしない」――健康管理アプリ「FiNC」AI開発5つの教訓
ITmedia 2019年04月16日
https://www.atmarkit.co.jp/ait/articles/1904/04/news001.html

このうち1については、弊社でもクライアントとの初期打ち合わせにおいて、「AI開発はアジャイルで進めるしかない」ということをご理解いただくことに腐心する場合がよくあります。
また、4については、初期の学習の方向性を間違えると、リカバリーが非常に難しくなるため、自社でやるにしろ外部に委託するにしろ、学習の目的を正確に理解している評価者が業務に当たる必要があります。(理想は、サービスのバリューチェーン上で自然に教師データが集まるビジネスモデルですが)
一方5については、私としては実感があまりない指摘でした。確かにソフトウェアエンジニアがデータサイエンティストを兼任できれば良いとは思うのですが、そういう人は本当に少ないと思いますし、その必要があるのか?という点について、私としてはあまり実感が湧きませんでした。

以上、感想に始終して恐縮ですw ぜひAI開発の実務担当者の方々と、議論してみたいなと思う内容でした。

新宿御苑で夜桜見れるってよ!(4/8月 – 4/20土)

晴れの新宿御苑
撮影:ブログ担当K

いつもリフ株式会社・公式ブログをご覧いただき、ありがとうございます。ブログ担当Kです。今回はまったくAIとも弊社事業とも関係ない話で恐縮ですが、個人的にテンションが上がった話題だったのでブログ記事にしてしまいましたw
なんと、あの「日中しか開いていない楽園」新宿御苑が、初めての試みで夜桜観覧用に夜も開園するとのこと!
4月8日(月)~10日(水)、14日(日)~20日(土) の期間は、19:00以降も入園できるようです。

ソース:環境省ウェブサイト → 
http://www.env.go.jp/garden/shinjukugyoen/topics/post_140.html


弊社は新宿区(高田馬場)にございます関係で、私含めた社員がよくフラ~と新宿御苑に赴いて思索に耽ったりしておりまして、大変好きな場所なのです。
新海誠監督の『言の葉の庭』 のような運命的な出会いはついぞございませんが・・・orz

大変素敵な場所ですので、普段ご縁がない方も是非この機会に遊びに行かれてみてはいかがでしょうか!?

AI(人工知能)開発でよくいただく質問(1)  ~分析技法・モデルの選び方~

いつもリフ株式会社・公式ブログをお読みいただき、ありがとうございます。ブログ担当・Kです。
本日は、AI開発のご相談をいただく際に必ず議題に上がる「どうやって分析方法やモデルを選んだらよいのか?」という点について、ご説明したいと思います。
エンジニアの方向けの技術内容を説明した日本語記事はQiitaなどにもだいぶ増えて参りましたが、本記事はエンジニアの方というより、開発に直接かかわることがない経営者や事業責任者の方向けを想定しております。
「このあたりが判断のポイントになるんだなー」とお感じいただけましたら幸いです。

Ⅰ. どんなオプション(選択肢)があるのか?

本記事執筆時点(2019年2月)では、MLP(Multilayer perceptron、多層パーセプトロン)かGBDT(Gradient Boosting Decision Tree、勾配ブースティング決定木)のどちらかに行きつくと思われます。理由は、「現時点でこれらが最も進んだ技法だから」です。
それぞれを大雑把に説明すると、以下のような感じです。
MLP: 重回帰分析の進化系。Y=aX+b をひたすら積み上げる
GBDT: 決定木分析の進化系。「こういう条件ならY1またはY2」というIF文をひたすら積み上げる

なお、どのような技法があるかをご説明している際に、よく「それはディープラーニング(深層学習)ですか?」「機械学習ではなく、ディープラーニングをやってほしいんですが、可能でしょうか?」というご質問をいただきますが、この考え方は以下の理由で正しくなく、ともすればAIの精度を犠牲にしかねないため、注意が必要です。

理由①:ディープラーニングとは機械学習において層(パーセプトロン)が多い(深い)状態のことであり、ディープラーニングという技法があるわけではない。
(なお「ディープ」の定義も、昔は3層だったが今は100層以上でディープと言われるように、あくまで相対的なものである)

理由②: ある機械学習をディープラーニングで行うかどうかは、「当てはまりが良いか(精度が出るか)」で決めるべきであり、常にディープな(層が多い)方が良いというわけではない

Ⅱ. 技法・モデルを選ぶ際の判断軸

次に、MLPかGBDTのどちらを選ぶか決める際の判断軸についてですが、以下の4点あたりが大事になってくるのではないかと思います。

(1)目的が「回帰」なのか「判別」なのか
・ 回帰・・・ あるインプットを与えたときに、「恐らくこうなるであろうという予測値」をアウトプットすること
・ 判別・・・ あるインプットを与えたときに、「これはAである」、「これはBである」という分類の結果をアウトプットすること

(2)カテゴリカル変数が含まれるか
・ カテゴリカル変数とは、数値の大小で評価できないタイプの変数のこと
・ 例えば、「相性が良い⇔悪い」は、 0~100 の間で相性が良いほど数値が大きくなる、といった形で表すことができますが、「赤、青、緑」のようなカテゴリー/区分は(RGBの数値で表現することはできますが)数値の大小で良いのか悪いのかを表すことはできません
・ 後者の「色」などをカテゴリカル変数といいます
・ カテゴリカル変数には、一般的にGBDTの方が適していると言えます

(3)データ量が多いか
・ 変数の量(種類)やモデルの複雑さによって、高い精度を出すために必要なデータ量は変わるため、何レコードだと多いという明確な基準があるわけではありませんが、いわゆるビッグデータならMLPによる収束(モデル化)が期待できます

(4)データのバラツキが大きいか
・ 外れ値や欠損値が多い場合はGBDTの方が扱いやすいと言えます

Ⅲ. 技法・モデルの決め方

以上の判断軸を総合的に判断して、どちらが適しているかを判断します(欠損値が多いから即GBDTだ!となるわけではなく、あくまで総合的に判断することが重要です)。
但し、精度の良いAIを開発するためには、予算と時間が十分にある場合は、両方を試してみる、というのが理想的だと思います。

以上です。少しでも、この記事を読んでくださった方の参考になれば嬉しいです!

弊社では上記のようなAI開発に至るまでの考え方などについても、丁寧にご説明させていただいております。AIに興味があるけど何から手を付けて良いか分からない、といったお悩みがございましたら、是非お気軽にこちらまでご連絡ください!

弊社代表・五十嵐が新聞に載りました!

リフ株式会社・五十嵐_AI(人工知能)についての講演の様子

あけましておめでとうございます!本年もどうぞよろしくお願い致します。

いつも弊社ブログをお読みいただき、ありがとうございます。ブログ担当・Kです。
突然ですが、弊社代表・五十嵐が新聞に載りました!去年8月に北海道・紋別市で地元の小・中・高の学生の皆さまに、AI(人工知能)が今後世の中にどういう変化をもたらしうるか?というテーマで講演をさせていただいたときの様子です。
生まれて初めて見るオホーツク海に五十嵐は感動しておりました笑

弊社は色々と面白いAIを開発しているのですが、クライアント様からの受託案件であるため、なかなか本ブログで公開できない点が、ブログ担当者としては悩ましいところです・・・orz

2018年はMLPによる事故・渋滞予測、小売業における在庫適正化、ECサイトのバナー出し分け、などでAIを開発して参りました。ご興味ある方は、ぜひお気軽にお問い合わせくださいー!
お問い合わせはこちらから