IBMによると、この2年間に生成されたデータは、これまでに人類が生成してきた全データの90%を占めるという。これをどう分析し、活用するか。ビジネスの種は無数に転がっている。
ビッグデータとは、その言葉通り、大量のデータが生成され、蓄積され、それが利用されることを指す。
ある調査によると、2007年から11年までの間にデジタルデータの量は約10倍に膨れ上がり、11年には1.8ゼタバイトに達したといわれる。
ゼタは、10の21乗という単位である。PCやBDレコーダーの上位機種には、テラバイト単位のハードディスクが搭載されているが、ゼタはテラの10億倍。1.8ゼタとは、2000億本超のハイビジョン画質の映画が収録可能で、一人が24時間365日見続けても、すべてのムービーを見るには、約4700万年かかる計算だ。
20年には、データ量は現在の50倍にも増えるという試算が発表されている。なぜ、これほどまでにデータが増えているのだろうか。
一つは、インターネットに接続する端末の数が増加している点だ。ここ数年、携帯電話によるネット接続が増加。さらに、タブレット端末や薄型テレビ、そして白物家電までも接続されている。
11年にインターネットに接続されている機器は全世界で40億台に達したといわれており、15年にはこれが150億台にまで拡大するとみられる。
2つ目は、ソーシャルメディアの広がりだ。現在、FacebookやTwitterなどのソーシャルメディアの利用者数は全世界で17億人に達している。
3つ目は、クラウド時代の到来である。従来、データを保存する容量には物理的な制約があった。だが、ネットワーク上にデータを保存するクラウド環境になれば、それが事実上なくなる。
4つ目は、ネットワーク環境の広がりだ。企業、家庭内はもちろん、モバイル環境においても、高速ネットワーク環境が広がっている。
5つ目は、センサーをはじめとする機械からの情報発信である。センサーから発信される情報には、気象データや、地震観測などの自然に関するデータ、自動車などの交通量情報、農業分野における土質データ、水量センサーなどがある。これらには数値データだけでなく、画像データなども含まれる。
現在、技術が進展し、大量のデータを速く、安価に解析することが可能になった。データを分散処理できるオープン技術のソフト「Hadoop」も、ビッグデータ時代を支える技術の一つだ。
大量のデータのやりとりは、もはや不可欠だ。現在、これらを解析することで、私たちの生活や企業のマーケティング活動などに活用しようという動きが注目されている。
※すべて雑誌掲載当時