ビッグデータから分類・回帰・クラスタリングを施すセグメンテーション機械学習アプリ開発
企業向けに
機械学習エンジン開発と
ビッグデータから継続学習する運用支援を行っています。
機械学習とは
データのパターンや特徴から学習
機械学習は、ビッグデータから様々な気付き(傾向・特徴・類似性/異常値)をパターンとして覚え、
刻一刻と変わるデータにおいても学習し、学習結果を出力(検知・分類・判定・予測)する統計学から発達したテクノロジーです。
機械学習を使う事で、「今までシステム化で解決できなかったこと」「人がケースバイで対応していたこと」の一部を自動化させる事ができます。
「経験に基づく業務」を再現
人間は、一つの判断を下す時に、様々な経験や情報を参考にしています。
お客様に喜ばれた/怒られた、などの「体験に基づく成功・失敗」を繰り返す事で、「正解/不正解」を意識せずに判断しています。
また、「晴れの時は売上が上がる」など、外部要因のデータも参考にして、予測を行っています。
人間と同じように「判断に必要となるデータ」を揃える事で、経験に基づく業務を再現・反復する事ができます。
機械学習のビジネス利用場面
ケースバイのセグメント分類と実行
機械学習では、ユーザの興味、欲求、クリックなどの行動、SNSなどの言動、プロフィールなどのユーザの特徴や、
刻一刻と変わる外部市場要因の特徴、IoTによるセンサーデータなど多くのデータから、ケースバイも網羅して特徴パターンを抽出し、似たものをグルーピング(クラスタリング)する事で、細やかなセグメント分類を行う事ができます。
これにより、今まで「人が判断して行っていた事を自動化」したり、「経験や勘ではなくデータに基づいた提案」を行ったり、「今まで気づかなかったインサイト」を提供したりする事ができます。
需要予測
売上情報、市場動向情報などを学習データにする事で、回帰分析し、需要など傾向予測ができるようになります。株価予測や業績予測などに使われます。
マッチングAI
ユーザの行動やプロフィール情報などからマッチングを行う事ができます。主に、お見合いマッチングやお仕事マッチングなどで使われます。
画像/映像学習解析
画像や映像を識別し、識別粒度を細かくする為にカスタムで学習をさせていき、画像や映像結果から必要なアウトプットを導き出します。
機械学習レコメンド
物件情報やおすすめの商品などユーザーの行動特性や問い合わせ履歴、購入履歴データなどからユーザ毎にオススメの商品を提示します。
セールスアシスタント
購入データ、市場データ、提案書など参照データ、などを学習データにする事で、セールス場面でのインサイトを提供します。また同様の情報は顧客側へ購入検討時の情報公開にも役立ちます。
ソーシャルリスニング
SNSなどによる消費者からの口コミ情報を可視化し、課題毎に自動分類する事で、消費者のリアルな声をモノづくりに反映させる事ができます。
嗜好セグメント
マーケティング
消費ニーズが多様化する中、多様なニーズ毎にユーザーセグメント分類を行い、ユーザーの特性毎にメルマガやPush通知を行う事でマーケティング反響率を高める事ができます。
ダイナミック
プライシング
施設の空き状況、チケットの売れ行き、天気によって左右される来店者数、消費期限の近い商品などに、価格変動制ビジネスを取り入れ、価格の最適化を提供する事ができます。
機械学習を始めるには
保有データから逆算する事
データを保有していれば、すぐに機械学習エンジンの開発着手ができますが、データが無い場合は独自での機械学習プロジェクトを始めるのはオススメできません。
データボリュームとしては、少なくとも数百万件以上あると、効果を発揮させやすいものです。
データが無い場合は中期的な未来を見据えて、機械学習の前に、データ収集を始めましょう。
保有されているデータがある場合は、「保有データから逆算する」発想を軸に企画を始めると、現実的になりやすいです。
当社が提供していること
Microsoft AI Innovation Partner of the Year 2024
「AI イノベーション パートナー オブ ザ イヤー アワード」は、マイクロソフト製品の活用によってAI分野で革新を起こしたパートナーに贈られるアワードとして2024年に新設され、ヘッドウォータースは同分野において最も優れた実績をあげたとの評価を受けた結果、初代受賞パートナーとなりました。
当社では、生成AIを積極的に導入して豊富な案件実績と先進的な事例公開、並びにAIの活用支援サービスのラインナップも拡充しております。
データチェック&クレンジング
機械学習プロジェクトにおいて大半を占めるのが、この工程です。
機械学習エンジンに出させたい結果に因果関係のある元データが必要ですが、元データが「整理されていない」「必要でないデータが混ざっている」「データが壊れている」事も多くあります。
当社では、保有データサンプルを拝見する事で、活用できるかのチェックを施し、機械学習の手法を検討し、現状のデータを整理し、いらないデータを省き、「AIクローラー」などで足りないデータを補完する事で、
機械学習プロジェクトのスタートを切りやすくしています。
プロトタイプによる学習
一気に完成品を目指すのではなく、「現状あるデータ」と「仮説」を持ち、簡易的にAzureMLなどを活用して「動くもの」を2週間~1ヶ月程で開発します。
動くものを用いる事で、「改善サイクル」を早々に回し、検証を重ねながら学習させ、細やかにチューニングを施します。
クライアント企業やステークホルダーへの理解の促進と、プロジェクトメンバーの体感値獲得により、
エンジニア以外のビジネス層の協力者を巻き込む事が可能となり、新たな視点、新たなデータと共に仮説検証が進みやすくなります。
機械学習エンジン開発
当社では、様々なAIのプロジェクトをMulti AI Platformで実現しています。
Multi AI Platformでは、必要な機能は既にコンポーネント化しており、呼び出すだけで実行が可能です。
機械学習プロジェクトおいては、Phython+scikit-learnを用いながら、実エンジン開発までをスピーディーに実現しています。
Multi AI Platformをもっと見る
ユーザビリティ
機械学習プロジェクトにおいて、盲点になりがちなのは、ユーザビリティです。
機械学習への学習精度に目が行きがちな為、ユーザーが機械学習エンジンの結果をどのように享受するかまでの想定が抜けがちになります。
UIシナリオから考えた場合、機械学習のOutputしてほしい結果が違う事もあり、手戻りリスクとなります。
Webサービス、スマートフォンアプリ、エッジデバイスなど様々なインターフェースでAI開発を行っている当社では、学習とユーザビリティ設計は並行で進め、ユーザと機械学習のギャップを埋めるプロジェクト運営を行います。
実サービスAPI連携
作成した機械学習エンジンを、既存のサービスと連携させる為、API構築も行っております。
機械学習エンジンを密結合させない事で、機械学習エンジンのマルチインターフェース化を実現し、Web、アプリ、チャットボット、ロボットなどに水平展開する事を可能とし、メンテナンス性を高め、既存で動いているサービスとの連携を容易にします。
ビジネス活用を目的とした機械学習
当社は研究や実験で留まらず、ビジネス活用を目的とした機械学習エンジン構築を行っています。
当社では、「教師あり学習」「教師なし学習」を組み合わせながら、過学習しないよう「人の知見によるチューニング」しています。
「できるだけ人間のコントロール配下に置く事で、機械学習エンジンを高速に改善しやすくする」事が可能となり、
機械学習エンジンがどう動き、なぜその結果が出たかを知り、クライアントと共に育てていきやすいからです。
機械学習事例
SyncLect Personalize
パーソナルレコメンドエンジン
デジタル上でヒアリングを含めたコンシェルジュをAIが行います。
Web上の行動ログや会員情報などのユーザーデータと、ユーザーに販売するコンテンツデータの特徴量をクラスタリングにより抽出し、過去データの類似特徴をビッグデータに蓄積し、機械学習のパーソナルレコメンドを行っています。
ユーザーの価値観や嗜好のポイントを強化する為に、ボットヒアリングを行い追加の嗜好データを取得し、その後のユーザー行動ログで強化学習のような重みづけを
行っています。
SyncLect Forecast
AI時系列予測エンジン
社内外データを利用した時系列予測を行い、予測後のオートメーションまでを自動的に行います。
当社では、機械学習(LightGBMを利用した勾配ブースティング)やRNN(リカレントニューラルネットワーク)、別次元データを応用するハイブリッドフィルタリングによる予測のAI構築を行っています。
社内外からデータを自動的に収集し、機械学習予測を行った後のオートメーション化までを提供する事で、企業のビジネスに貢献します。
ダイナミックプライシング
動的価格予測エンジン
スーパーマーケットにおける賞味期限が近付いた商品が特売価格になったり、
コロナの影響でマスクの価格が高騰するなど、需要の増減や生産の増減により、物価に影響があります。
AI予測サービスを応用して「価格」にフォーカスしたものがリアルタイム動的価格設定「ダイナミックプライシング」です。
当社ではPhython、scikit-learn、numpy、pandasを利用して、動的価格設定を行う機械学習エンジンを構築しています。
MLOpsプラットフォーム
SyncLect CL
今や機械学習の注目は構築する難しさではなく運用する難しさにシフトしています。
MLOpsプラットフォームSyncLect CLは機械学習運用プロジェクトにおける各工程の自動化を実現する事で運用コスト負担を軽減する事ができます。
特徴量エンジニアリングの半自動化、アノテーションの半自動化、学習の自動化、評価の自動化、デプロイの自動化を行う事で、専門データサイエンティストの負荷を減らし、ソフトウェアエンジニアの手で機械学習運用を実現する事ができます。