ビッグデータとは?企業にとっての意味や種類・活用事例を紹介
ビッグデータを活用し、実際に成果をあげたという事例がよく聞かれるようになってきました。自社のビジネスにも「ビッグデータを取り入れたい」と考えている企業は多いでしょう。一方、ビッグデータとはどのようなもので、何を実現できるのかについては曖昧なままになっているという方もいるかもしれません。
そこで本記事では、ビッグデータの基本的な意味について説明したうえで、ビジネスに活用できるデータの種類や活用事例を紹介していきます。
ビッグデータとは
ビッグデータという用語は、「データの巨大な集まり」のことを指すものと考えれば概ね間違いありません。世界中から集められた膨大な量のデータを格納すると、単位でいえばテラバイトやペタバイトに及ぶ大きさになることもあります。
しかし、ビッグデータの定義として重要なのは、巨大かどうかよりも目的を果たせるかどうかです。現実の企業活動に用いる文脈では、以下のようなデータが「ビッグデータ」と呼ばれます。
– 一般的なパソコンやデータベースで扱える範囲を超えたサイズをもつ
– ビジネスに役立つ何らかの知見を得られる
これらの特徴は、ビッグデータがAIやDXと関係の深い概念であることを示しています。それぞれとの関係について、詳しくみていきましょう。
ビッグデータとAI
サイズの大きなデータを扱うためには、必然的にそれに見合うデジタル技術が必要となります。例えば、以下のような技術です。
– 膨大な量のデータを保管しておけるストレージ技術
– 高速にデータを処理できる分析技術
ビッグデータは、こうした技術が進歩したことにより実用可能になりました。なかでも近年めざましい発展をとげているのが、AIを用いた分析技術です。人の力だけでは導き出すことが難しいパターンを、高度な分析によりデータから読み解けるようになりました。
ビッグデータとDX
DXは「デジタル技術とデータを活用」してビジネスに役立てる取り組みです。データに裏付けられた分析結果によって、人の勘や経験ばかりに頼らない、より効果的なビジネス施策の選択が可能になります。
その際の手段として近年目立つようになってきたのが、ビッグデータをAIとともに用いる例です。DXは「AIとビッグデータを活用」するものだと読み替えても差し支えがないほど、今やこの2つはDXに必須の要素となっています。
ビッグデータの性質
ビッグデータには、従来のデータとは異なる3つの性質があります。それぞれの頭文字をとって「3つのV」などと呼ばれている、ビッグデータがもつこれらの性質について説明します。
– データ量が多い(Volume)
– データの種類が多い(Variety)
– データの更新頻度が高い(Velocity)
データ量が多い(Volume)
1つ目の「V」は「Volume」で、「容量」のことです。ビッグデータには「大量のデータを扱う」という特徴があることを示しています。
例えば、SNSに世界中から投稿される膨大なテキストは、明らかに大容量のデータといえるでしょう。ほかにも、実用的にはそこまで巨大ではない以下のようなデータもビッグデータと呼んで問題ありません。
– 全国の支店から集めた業務データ
– 長期にわたって蓄積されたWebサイトのアクセスログ
ビッグデータのこの性質(Volume)は、具体的なサイズを規定するものではないため曖昧な部分もありますが、このあと説明する残り2つの「V」を実現するために必要な要素でもあります。
データの種類が多い(Variety)
2つ目の「V」は「Variety」で、「多様性」のことです。ビッグデータの「さまざまな種類のデータが含まれる」という特徴を示しています。
例えば、一般的なデータベースに格納されるデータは、あらかじめ形式が決まっている「構造化データ」です。これに対し、ビッグデータでは構造を一様に決められない「非構造化データ」を扱うケースが多くなります。また、より多くのデータを収集しようとすれば、その出どころも多岐にわたることになるでしょう。
こうした多様なデータは、思いもよらない情報を内在していることが少なくありません。そこでAIを用いて総合的に分析することにより、新たな知見がみつかる可能性が広がるのです。
データの更新頻度が高い(Velocity)
3つ目の「V」は「Velocity」で、「速度」のことです。ビッグデータには「新しいデータが頻繁に追加される」という特徴があることを示しています。
例えば、全国展開しているチェーン店のPOSデータを即座にデータセンターに送信するようなケースでは、時間帯によっては1秒間に数千件ものペースでデータが増えることも考えられるでしょう。これは、データを処理する際にもスピードが求められることを意味しています。
適切にAIを用いれば、こうしたデータをリアルタイムに近い速さで分析することも可能です。これにより、状況の変化に対して即応性の高いビジネス判断を実現しやすくなるでしょう。
ビジネスに活用できるビッグデータの種類
総務省の発行する「情報通信白書」の平成29年版では、ビッグデータについて以下のように述べられています。
データが主導する経済成長と社会変革の実現においては、ビッグデータの利活用が鍵を握る。そしてビッグデータを収集するための手段がIoT(Internet of Things)であり、ビッグデータを分析・活用するための手段がAI(人工知能:Artificial Intelligence)である。
ここで述べられている内容が、IoTやAIのすべてというわけではありません。しかし、DXの潮流のなかにある多くの企業で実際に起こっていることを、端的に言い表しているといえるでしょう。重要なのは、「3つのV」の性質をもつビッグデータを「どこから収集し」「何を目的として分析するか」という点です。
ここからは、具体的にどのような種類のデータが「3つのV」の性質をもち、ビジネスにも活用できるビッグデータとなりうるのかを説明していきます。
– 不特定多数から収集したデータ
– ユーザーから収集したデータ
– 社内で収集したデータ
– 各種オープンデータ
不特定多数から収集したデータ
インターネットなどを通して不特定多数から収集した膨大なデータは、間違いなくビッグデータといえます。例えば、以下のようなデータです。
– SNSに書き込まれたテキストや、コメント・フォローなどによるユーザー間のつながり
– 動画サイトで配信されているコンテンツ
– 長期にわたって蓄積した、自社サイトのアクセスログ
これらは、ユーザーのニーズや自社製品の評判などを知るための手がかりとして、広く分析・活用できるデータです。
ユーザーから収集したデータ
自社サービスの顧客から得られる情報も、十分なデータサイズがあれば貴重なビッグデータとなります。
– 購入履歴など、購買行動に関するデータ
– アンケートへの回答内容や、ユーザーサポートの記録
– スマートフォンなどを通して得られる位置情報
これらは、サービスの改善や顧客満足度の向上に直結する知見を得るために活用できるデータです。
社内で収集したデータ
社内の活動から生じる以下のようなさまざまなデータは、日々蓄積されて大きくなり、ビッグデータを形成していきます。
– 従業員が作成した各種文書
– 社内システムに蓄積された業務データや研究データ
– 生産ラインなどのセンサーデータ
これらは、生産性や安全性の向上など、業務プロセスの改善に役立てられるでしょう。
各種オープンデータ
政府や自治体などが一般公開しているデータも、ビッグデータとして利用できます。例えば、以下のようなデータが挙げられます。
– 人口などの統計情報
– 気象データ
– ハザードマップや災害情報
これら以外にも、パートナー企業との協力関係や業界内の連携によって構築された、共有データを利用できることもあるでしょう。
ビッグデータの活用事例
ビッグデータは、すでにさまざまな業界で実用化されています。ここでは以下の業界をピックアップして、活用事例の一部を紹介します。
– 小売:需要予測で発注を最適化
– 農業:醸造用ブドウを安定供給へ
– 医療:新薬の研究・開発期間を短縮
– 通信:自動車の渋滞を予測して周辺地域に公開
– 観光:行動分析で温泉街を活性化
– スポーツ:デジタル解説者が次の投球を予測
– 行政:災害時の避難指示発令をAIが支援
小売:需要予測で発注を最適化
スーパーやコンビニエンスストアなどの小売業界では、人手不足と食品ロスが大きな課題となっています。商品の発注をベテラン従業員の勘に頼っていると、その従業員が休職や離職をした際に、在庫を適切に保てなくなるなどのリスクがあるのです。
セブン&アイ・グループのイトーヨーカドーでは、AI技術を取り入れて、傷みやすい食品の需要を日ごとに予測できるようにしました。天気予報やイベント情報など、異なる種類のデータと組み合わせることにより予測精度を高めているのが特徴です。
本事例の詳細は、こちらの記事でも紹介していますのであわせて参考にしてください。
農業:醸造用ブドウを安定供給へ
農業の分野では、近年の異常気象により農作物の安定的な生産が難しくなってきています。気象データなどを見ても、どのように対処すればよいのかわからないのが実情です。
長野県高山村では、これまで属人的だったワイン醸造用ブドウの栽培ノウハウを形式化させる取り組みが行われました。農園内のセンサーからさまざまなデータを収集することで、病気が発生する条件などを明らかにするというものです。あわせてBotによる通知も導入し、必要な対策をタイミングよく打てるようになりました。
本事例の詳細は、こちらの記事でも紹介していますのであわせて参考にしてください。
医療:新薬の研究・開発期間を短縮
近年、新薬開発のターゲットは、症例の少ない難病にシフトしてきています。そのため研究・開発の困難さが増しており、いかに開発期間を短縮するかが課題となっているのです。
そこで、製薬各社は薬の成分となりうるさまざまな化合物をデータ化することで、研究・開発の効率化に取り組んでいます。膨大なデータのなかから、AIにより最適な組み合わせの候補をピックアップする仕組みです。
本事例の詳細は、こちらの記事でも紹介していますのであわせて参考にしてください。
通信:自動車の渋滞を予測して周辺地域に公開
通信サービスには、用途によって異なる品質が求められます。自動車業界においては、自動運転や交通情報のためにリアルタイム性の高い通信が必要です。
NEXCO東日本は、東京湾アクアラインの利用者向けに、AIによる渋滞予測を公開しています。NTTドコモの通信技術とリアルタイム人口統計を用いることで、精度の高い予測を可能にしました。
本事例の詳細は、こちらの記事でも紹介していますのであわせて参考にしてください。
観光:行動分析で温泉街を活性化
兵庫県北部に位置する城崎温泉には、スマートフォンさえあれば旅館へのチェックインや温泉巡りなどを財布なしでできるサービスがあります。その利用履歴を定量的に分析することで、これまでは定性的な面しかわからなかった人の行動を、データに基づいて予測できるようになりました。
ここでのデータから得られるのは、例えばグループ構成や回遊経路、施設ごとの利用時間といった観光客にとっても身近な情報です。温泉街が実施するイベントや広告による効果の把握・改善に、これらの情報が役立てられています。
スポーツ:デジタル解説者が次の投球を予測
AIは、人間の発想ではたどり着けないような分析結果を提示してくれることもあります。
株式会社電通が開発したデジタルスポーツ解説者「ZUNO(ズノさん)」は、プロ野球の試合状況に応じた投球予測が可能なシステムです。300万球を超える過去の打席データを分析することで、これまで人間の解説者が気づけなかった選手の傾向などを理解できるようになりました。このシステムを用いて実際の試合で投球予測を行った結果、人間を超える正答率を記録しました。
行政:災害時の避難指示発令をAIが支援
災害時に自治体が発令する避難指示に、AIを活用する取り組み例もあります。
株式会社Specteeは、名古屋市の実証プロジェクトにおいて、危機管理ソリューション「Spectee Pro」を開発しました。河川の水位や降水量、SNSからの情報などを、AIがリアルタイムで分析するというものです。データにもとづいた予測は、担当者の経験則だけに頼らない判断を可能にします。今後も的確な避難情報を遅延なく発令できる仕組みづくりを進めていくということです。
ビッグデータの活用に向けた課題
ビッグデータの活用には、課題もあります。これからビッグデータを積極的に活用していこうと考えている企業にぜひ検討しておいてほしい、共通の課題について説明します。
– 個人情報に留意したデータ管理が求められる
– データの質が分析の精度を左右する
– データとビジネスを橋渡しできる人材が求められる
個人情報に留意したデータ管理が求められる
ビッグデータには、顧客情報など個人のデータが含まれていることも少なくありません。氏名や連絡先のように個人を直接的に特定可能なデータはもちろん、指紋やDNAなども取り扱いに注意を要する個人データです。個人データの活用にあたっては、「提供者からの同意を得て利用する」または「匿名加工を施して一定の条件下でのみ利用する」などの対策が求められます。
また、データの管理・運用も厳重に行わなければなりません。トレーサビリティを高め、データのコピーや移動をともなう作業を把握できるようにしておく必要があるでしょう。加えて、データの保護も課題となります。システムのセキュリティを強化し、意図しないデータの流出を防ぐことが重要です。
データの質が分析の精度を左右する
精度の高い分析を行うためには、データの「質」が重要です。しかし、ただ収集しただけのデータは、品質がバラバラの状態になっているのが通常でしょう。例えば、データ入力時の誤字や文字化け、重複・欠損などが考えられます。
また、部署をまたいで収集されたデータなどは、突き合わせの際に問題が生じることも少なくありません。表記に「ゆれ」があったり、IDや識別番号が統一されていなかったりすると、本来は関連するはずのデータ同士を紐付けできないケースがあるのです。
満足できる分析結果を得るためにも、こうしたデータには「前処理」と呼ばれるプロセスが必要です。事前にデータの重複や欠損を修正し、フォーマットをそろえて分析しやすい状態にします。
データとビジネスを橋渡しできる人材が求められる
企業がデータから意味のある知見を得るには、ビジネスの要請に応じた分析を行う必要があります。とはいえ、ビッグデータを活用するためのスキルには、専門性の高い部分が多いのも実情です。
例えば、データを最大限に活用するには、数ある分析手法のなかから適切なものを見極めるデータアナリストの能力が欠かせません。AIモデルを構築して実際のシステムに落とし込むには、エンジニアの能力も求められます。
データをビジネスに有効活用したい企業は、これらの人材をいかにして確保するかを考えていかなければなりません。そのためには、外部ベンダーとのパートナーシップを構築したり、自社内で人材を育成したりといった選択肢が考えられます。
ビッグデータに欠かせないAIの技術力を獲得するには
ビッグデータは、ビジネスに新たな知見をもたらす情報源となるものです。効果的に用いるには、AIとの組み合わせが不可欠といえるでしょう。
一方、AIは高い専門性を必要とする技術です。AIを適切に扱える人材の不足にお悩みの際は、弊社の「AI実装支援」サービスの活用をご検討ください。経験豊かなAIエンジニアが、スピーディな開発や技術獲得などをサポートします。
DXの一環としてビッグデータを用いるためのシステムを構築するには、内製を目指すのが望ましいでしょう。それには、弊社の「AI_STANDARD」サービスがおすすめです。短期間でAIエンジニア不足の解消を目指せる研修サービスとなっていますので、DX推進を担う人材を確保・育成するための施策として、あわせてお役立てください。
詳しい資料は、ダウンロードページにて無料で公開しています。下記の「資料ダウンロード」ボタンよりご確認ください。
技術人材育成サービスのご案内