データアナリストって聞くと、なにやら賢そうな職業に聞こえないだろうか?
とても頭が良く、プログラムをバリバリと書く優秀なデータアナリストも世の中には相当数いるし、統計学の深い知識を使い仕事している高学歴のデータアナリストも沢山いることは間違いない。
しかし、私のようにまともな統計学を学んだこともなければ、コードも書けない高卒のデータアナリストも存在するのである。
基本的なデータアナリスト
データアナリストは、情報(データ)を収集し、それを分析する能力があれば成り立つ。分析したデータから仮説を立て業務の効率化を目指したり、課題の発見に繋げて問題提起や解決策を提案する分析スキルと資料作成ができればデータアナリストとして仕事することは可能だ。
「データアナリスト」という名前だけを追えば、私の仕事とは違うフィールドで、働き方も全く違う場合もあるが、このブログで書く「データアナリスト」とは、会社の様々な数値データをデータベースからまとめ、経営指標や、オペレーションの効率化を推進するための仕事を指す。
私は、データアナリストとして働いているが、プログラミングは出来ないし、コードも書けない。統計学も学んでいないし、ミクロ経済もマクロ経済も説明できない。何の学位も持っていないのだ。
私はただデータを整理してまとめ、区分けし、データの動きと、相関関係を見つけ資料作成や、デジタルダッシュボードの作成・管理をしている。
統計学の知識はなくても、私にはコモンセンス(共通感覚・常識)がある。それを使って、製造生産の効率と運用状況の精査、製造に対する材料費や人件費のデータ分析等をするのである。
エクセル進化で幅が広がる
今の仕事で私は「データアナリスト」以上の仕事もするようになった。データサイエンティストの人達が行う業務の一部、分析データ元となるデータモデリングを理解し、自分で作成可能になったのだ。
これはエクセルが進化し、パワーピボットという機能が拡張されて私のようにコードを書かない物でもデータモデリングが出来るようになったからだ。
データアナリストとして人が作ったデータセットを長く利用して仕事をしていると、もっと使いやすいデータセットというのがユーザー目線で分かってくる。これが経験によるスキルなのだろうが、通常大規模開発が入らない限り簡単には変更実現しないのでやっかいなのだ。
しかし、パワーピボットが登場してから自分の使いたい形でデータモデリングが可能にり、大規模開発を待たずとも迅速に自前のデータ分析ツールを作れてしまうのだ。
最終的には大規模開発でデジタルダッシュボードを作成することになるが、その時には自作パワーピボットツールを開示し、指揮官として開発チームをリードすることもできるのである。作るものがはっきりと開発者にも理解できてウィンウィンになるのだ。
開発されたものが要望するものと違うということは本当に往々にしてある。最速最短で欲しいものが作られる為に見て確認できるものが有るのと無いのとでは雲泥の差があるのだ。
多くのデータに携わる
私は10年程、派遣社員として3~4社でデータをまとめる仕事をした。どの会社もそれぞれ別のシステムを使っていたが、それが私のキャリアには良かったのかもしれない。日々それぞれのシステムをじっくり扱い、データの性質を十分に考える時間が与えられた。
会社運営でKPIという指標をどこも大事にしているが、それはどういうデータをどのようにまとめ上げればいいのか時間をかけて学ぶことができたのだ。
その経験がベースとなって、会社が管理したい指標をヒアリングし、会社のデータベースを見ればどの項目をどのように纏めればいいのか見えるようになったのだ。
こうして私は「データアナリスト」としての専門職者になることができたのである。
会社のデータベースの仕組みを把握できて、勘を働かすことができれば仕事の幅を広げることができる。私のように統計学を学んでいなくても、経験を生かせば企業でデータアナリストの仕事を得ることが可能であると思うのだ。
私がシステム開発に深く関わる様になって気づいたのだが、世の中にはコードを書ける人は沢山いるが、勘が良くない人が実に多いということだ。
開発者へ新規開発案件の要望を伝えても、理解の齟齬が簡単に起こってしまい欲しいシステムが作成されないのだ。ある日、私はしびれを切らして具体的な指示を出し、モニタリングを行いながら会社が作りたいものを作る指揮者となり状況を改善した。
会社のデータパターンや、ビジネス側のシステム利用法方を理解できれば、学位を持っていなくても十分に活躍できる力(スキル)を持てるのだと確信した。
朝から晩までエクセルを扱う
私が仕事で駆使するのは、マイクロソフトのエクセルである。私のデータの仕事は95%はエクセルで片付くのだ。データ関連仕事でエクセルを使わないのは、エンドユーザーツールのデジタルダッシュボードBIツールに関係する部分くらいだ。
報告資料作成はパワーポイントを使うが、それにもエクセルでまとめたデータの画像を貼り付けてレポートをまとめるので結局エクセルを頼るのだ。
私の日常的なデータアナリスト業務
- ビジネスやオペレーションを理解する
- オペレーションに使われるデータシステムを理解する
- システムデータの関係性を考慮しデータセットをデザインする
- 実データを使ってデータセットのサンプル作成
- BRD定義書を作りソフトウェアエンジニアに説明をする
- 開発者作成のデータセットデモの総合的データ整合性テストの実行
- データセット連携した指標KPIを算出データモデリングの作成
- 指標KPIの定義書作成
- 分析ツールの提供
- 指標KPIの分析と、レポート作成
このリスト仕事の全部でエクセルを使う。デモデータの作成も、開発したデータセットの検証もエクセル機能を使い、デジタルダッシュボードBI(ビジネスインテリジェンス)のサンプルもエクセルで作成する。
デザイン画のようにイメージだけを作るのではなく必要な数式を埋め込んで、実データを使いKPIを算出する。実用的なデモ分析ツールを作り、BIソフトウェアエンジニア担当者に同じようにデジタルダッシュボード開発をしてもらうのだ。
そのダッシュボードツールが出来るまでは、エクセルで作ったデモ版が短期ソリューションツールとして実用でき、デジタルダッシュボードBI開発の検証用比較データとしても使うことができる。
今のエクセルには沢山優秀な機能が備わっている。本当に驚くほど充実していて、以前はACCESSを使って処理していたことも今はエクセルひとつで処理ができるのだ。
以前は、高額なシステムデータツールでデータモデルを開発者に作成してもらい、数値を自動算出するほかなかったが、今ではかなりの量のデータであってもエクセル単体で構成することが可能である。
パワーピボット使って幅を広げる
データのモデリングは、パワーピボットというエクセルの標準機能を使うが、あまり多くの人が使うものではないのか、標準ではリボンに表示されないので、エクセルのオプションで設定する。
私はパワーピボット機能が標準でエクセルに搭載され、この機能を利用できることに仰天している。
しかし、エクセルを結構使いますという人でも、パワーピボットはちょっとハードルが高い。
まずは普通のピボットテーブルをしっかり習得し、通常のピボットテーブルに計算式を埋め込むことが出来る位迄使いこなせるようになったらパワーピボットにチャレンジしてみればいいだろう。
データをまとめる仕事をしているならば、パワーピボットを使えば可能性が広がる。かゆいところに手が届くようになるから学習してパワーピボットを習得する価値は大いにある。
エクセルの基本操作
沢山のデータをエクセルで取り扱うにはコツがいる。素早く正確にデータ加工やデータ算出するにはエクセルの基本をしっかり理解しておくことは不可欠である。
データを扱う為に私が絶対に抑えなければいけないと思うエクセルの基礎がいくつかある。簡単なリストをこのブログに書くが、それぞれの詳しい内容はウェブ検索をして調べ身に着けてほしい。
相対参照と絶対参照
エクセルで式を作成するときに$マークがついたり消えたりするが、それを絶対に理解する必要がある。式の作成、式のコピーで完全な理解をせずに作業をするのは無謀であり、ミスを生む。
100行とか1000行とかに式をコピーしデータ検証をするのに相対参照と絶対参照を理解し数式を設定できなければ短時間の内に必要な仕事を終えることは不可能だろう。
データの形式
コレはセルの書式設定ではない。セルに入った数字が数字にみえるデータでも、数字として扱われている場合もあれば、文字扱いになっている場合があることを理解する必要がある。データの扱われている状況により、文字から数値、数値から文字に変更することも必要。計算式を作ったのに計算されないトラブルは、だいたいこれが原因である。
書式設定
せっかく数式を入力しても数式が文章のようにセルに現れることがある。書式設定により強制的に処理がされているから、その場合セルの書式設定を標準に設定し、そのセルを選択したままで、エクセル上部にある数式バーにカーソルを移動し、確定(エンター)すればそのセルには計算結果が表示される。
不要な書式設定
列丸ごと、行丸ごとを選び書式設定をすると無意味にファイルがサイズ激重になるケースがある。これはエクセルが書式を設定したエリアにもデータがあると勘違いして起こる現象だ。ファイルの開閉に時間が掛かかったり無駄が増えるから書式設定は必要な部分だけに設定する。列や行を丸ごと選びセルに色付けするのは危険な行為なのである。
形式を選択したコピペ
値だけのコピペ、数式だけのコピペ、書式だけのコピペのほか、値と書式をコピペなど、コピペには様々な選択肢がある。これを使いこなせれば、非常に効率的にデータの体裁整備が可能となる。
空白と半角全角の罠
これで悩む人は本当に多い。VLOOKUPで算出ができない時や、パワーピボットで目には同じ項目に見えるものが、分かれて表示される場合の原因がだいたいコレだ。隠れ空白だったり、半角、全角の違いがあって違うデータだと判断されているのだ。対応策は置き換えで空白を除去するとか、ASC関数を利用しデータを半角へ強制統一する。置き換え機能で全角スペースを半角スペースに置き換えるのも効果的。置き換えでスペース2個を1個に変更し問題解決することも可能。
数字羅列の文字列データ
分類コードなどにありがちで、始まりの文字が数字の0という場合だ。これを誤って数字として取り扱ってしまうと頭の部分にある0を失い、誤ったデータとなってしまう。長い数字だけで構成された文字列データの場合も注意が必要だ。うっかりそのセルを触るとデータが奇妙な数値データに変換されてしまい、もともとの数値データが失われる場合があるので取扱いには注意する必要がある。
他にも大量のデータ処理をするのにエクセルを使いこなすには多種多様な機能がある。それらを楽しんで学べることができれば、ソフトウェアエンジニアにならなくとも、高収入の「データアナリスト」になることは可能だろうと私は思うのだ。
ビジネスとシステムと熟知する
私はデータデザインをするのに、ビジネスとシステムの両方を良く理解をしたうえで、データデザインをしている。
その知識とエクセルの機能を使えば、ソフトウェアエンジニアが作り出すデータの整合性検証をエンジニアがするよりも早く総合的に対応することも可能なのだ。
開発アイテムの問題をいち早く見つけ、その誤りについて説明と仮説をエクセルを使って具体的にエンジニアに伝えることが出来れば開発時間を短縮することも可能になり、スピーディーにデータシステムの製品化され、会社全体がその恩恵を受ける事ができるのだ。
仕事が面白ければ成長できる
エクセルを使ったデータの仕事は、私にとってビデオゲームをやっているような感覚だ。明確なゴールに向かって、色々な機能を習得し、その機能を利用して攻略していくのである。
何か追加の機能が必要だと思ったらネットにそのキーワードを打ち込めば絶対に答えはそこにあるのだ。大変と思うよりも、謎解きをするようで面白いと思えれば必ず成長できるはずだ。
頭は月並みでも、努力によって知識は増やせる。初めは人に習うことの方が多いだろうが、習ったことを理解し、勘を正しく働かせることが出来れば、自分の力で次々と検証する道が開け知識が蓄わるのである。
学生時代熱心に勉学に励んだ高学歴で優秀なスキルある同僚も周りには沢山いる。チームで仕事をするならその人達の力を借りれば、もっと高速に良い結果を出せるだろう。そんな時、自分は皆を迷わずに目的地へガイドが出来ればいいだけなのだ。
ITフィールドには私よりもずっと優秀な人が多く、彼らが助けてくれるから私もサバイブできるのだ。そして、私のような者でも諦めずに真剣に取り組んでいれば、そういう優秀な人たちの仕事をも助けることもある。
雑草のように図太く自分のペースでやればいい。ゴールを明確にしてゆっくりでもとにかく諦めずにしっかり取り組んでいれば、その努力は必ず実ると信じている。